![]() |
Поиск текста в xml и запись в файл
Добрый день, по аналогии из этой темы, необходимо из каталога "D:\Импорт\"с более чем 200 файлов xml извлечь данные(КПТ-Кадастровый план территории) и записать в файл csv.
Содержимое xml файлов делится на блоки по типу: 1) Parcel, 2)Building, 3)Construction Файл 141697 КПТ.xml
Код:
<Parcel CadastralNumber="74:14:0101001:2" State="01" DateCreated="1996-07-10"> Возможно есть еще какие-то блоки, но интересуют только эти. Результат содержимого CSV должен отображаться приблезательно так с подсталенными значениями: Код:
Строка 1;Parcel CadastralNumber;Building CadastralNumber;Construction CadastralNumber;ObjectType;State;DateCreated;AssignationBuilding;AssignationName;Area;Unit;Inaccuracy;Name;OKATO;KLADR;Region;District Name;District Type;City Name;City Type;Street Name;Street Type;Level1 Type;Level1 Value;Other;Note;Category;Utilization Utilization;Utilization ByDoc;CadastralCost Value;CadastralCost Unit |
Вложений: 1
Интересует любое решение способное реализовать поставленную задачу.
|
al-1k, xml-схемы КПТ, выписок и паспортов довольно часто меняются, благо последний год не так радикально как раньше. По сути перед вами стоит задача "парсить" эти xml.
Если это касается непосредственно рабочего процесса, то имеет смысл обратить внимание на готовые продукты для работы с xml росреестра. Ищутся в интернете как "XML Конвертер росреестр". Стоят не дорого, у многих есть демо-версии для оценки функционала. Если это какой-либо личный интерес, то рекомендую самостоятельно изучать вопрос т.к. задача довольно специфична и придется часто "допиливать" под меняющиеся условия. В PowerShell достаточно легко обрабатывать xml. В свое время я столкнулся с подобной задачей. Привожу пример кода для "вытягивания" кадастрового номера. Его можно легко доработать. рабочий фрагмент
Код:
$PathIn = "D:\Импорт\" # каталог, откуда брать xml файлы |
Время: 16:43. |
Время: 16:43.
© OSzone.net 2001-