PDA

Показать полную графическую версию : [решено] Удалить строки в которых нет пробелов в .txt файле.


papacoca
31-12-2014, 00:08
Не так давно, создавал тему по редактированию "базы синонимов" тут. (http://forum.oszone.net/post-2430382.html)
Очень упростило задачу.

На сей раз мне нужна помощь в следующем.
Есть база синонимов ~ 800.000 строк, в ней перемешаны синонимы слов и словосочетаний. Необходимо выбрать все "слова сочетания", на данный момент выбрал около 25.000, к сожалению есть пропущенные.

Нужен батник который удалит строки в которых нет пробелов и "-" до "," (препинания), например:
наишачило,наработало
наишачилось,наработалось
витаминизирующий,дающий витамины
витаминизирующим,дающим витамины
сен-бернар,сенбернар
горе-охотник,охотник
найти в себе силы,возмочь
найти возможность,словчить

Оставить такие строки:
сен-бернар,сенбернар
горе-охотник,охотник
найти в себе силы,возмочь
найти возможность,словчить

С наступающим всех.

Georgio
31-12-2014, 00:40
papacoca, с наступающим Новым годом!

@findstr /rc:"[^ ][^ ]*[ ][ ]*[^ ][^ ]*" "example.txt">"new.txt"

papacoca
31-12-2014, 01:01
Georgio - спасибо

Батник работает, но 1 не учел.
Такой нюанс:
например:
наишачило,наработало
наишачилось,наработалось
витаминизирующий,дающий витамины
витаминизирующим,дающим витамины
сен-бернар,сенбернар
горе-охотник,охотник
найти в себе силы,возмочь
найти возможность,словчить
Оставить такие строки:

Оставить такие строки:
сен-бернар,сенбернар
горе-охотник,охотник
найти в себе силы,возмочь
найти возможность,словчить

Вообщем нужно удалить строки в которых нет пробелов и "-" до "," (препинания).

Тему отредактировал...

mwz
31-12-2014, 01:17
Такой нюанс:
Цитата:
витаминизирующий,дающий витамины »(и т.д.) – неверная запись: после запятой обязан следовать пробел.

papacoca
31-12-2014, 01:41
после запятой обязан следовать пробел
НЕТ все правильно я написал.

Georgio
31-12-2014, 01:58
@<"example.txt" more|>"new.txt" findstr /rc:"^[^,- ][^,]*[- ][^,]*[^,- ],..*$"

papacoca
31-12-2014, 12:58
гуд




© OSzone.net 2001-2012