![]() |
xml одной строкой и весом 70mb разбить по файлам
Здравствуйте, имеется огромный однострочный xml с которым невозможно работать!
Нужен умный кот, который сможет распинать этот xml на файлы по сегментам <conceptGrp>.....</conceptGrp> желательно в папку рядом с файлом и чтоб на выходе были названия файлов вида 00001 - 25000 в общей сложности выйдет около 24тыс файлов. И пожалуйста вариант как обратно склеить в одну строку все 25тыс файлов. |
Умный кот?
![]() Я так понимаю каждый кусок <conceptGrp>.....</conceptGrp> должен быть в отдельном файле? Между <conceptGrp>.....</conceptGrp> и <conceptGrp>.....</conceptGrp> постоянно ничего нету или могут быть какие-то символы? |
Elven,
Цитата:
Цитата:
|
Может для читабельности просто заменить в notepad++
это "><", на это ">\r\n<" (предварительно включив режим поиска "расширеный") или "</conceptGrp><conceptGrp>" на это "</conceptGrp>\r\n<conceptGrp>"? После чего можно разбить основной файл построчно (все теги, или <conceptGrp> как удобно) батником со следующим содержимым: Код:
Цитата:
Код:
copy "папка с фалами котроые нужно объединитьв один\*.xml" 1.xml |
gremlintv2, да, было б хорошо разнести на строки и разделить этим бат файлом
conceptGrp.bat
Код:
@echo off И увы notepad++ "Не отвечает" |
Цитата:
|
Цитата:
Сейчас чисто из интереса запустил замену перевода строки на теги в словаре весом 200Мб. Так как гиговый словарь notepad++ отказался открывать. =( |
Iska, стоит задача перевести этот xml, для последующего использования в качестве базы терминов, а файл слишком велик для перевода.
В этом и необходимость его резать - клеить. gremlintv2, Iska, Ок. дождусь вечера и пусть notepad++ пилит его на строки до самого утра, и уж завтра ночью делить его на файлы, до самого утра )))) Спасибо! |
Цитата:
|
Время: 20:26. |
Время: 20:26.
© OSzone.net 2001-