Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Прочее - grep - вытянуть телефоны

Ответить
Настройки темы
Прочее - grep - вытянуть телефоны

Новый участник


Сообщения: 3
Благодарности: 0

Профиль | Отправить PM | Цитировать


день добрый
кто может помочь?
есть текстовый файл, в нем куча объявлений и номера телефонов в формате: т. 8-999-999-99-99
как сделать так - чтобы все телефоны записались в отдельный файл?

Отправлено: 20:47, 17-08-2012

 

Забанен


Сообщения: 6158
Благодарности: 1300

Профиль | Цитировать


grep -ohw 'т. 8-[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]' sourcefile > result
Ну и если нужно убрать "т. " то так:
grep -ohw 'т. 8-[0-9][0-9][0-9]-[0-9][0-9][0-9]-[0-9][0-9]-[0-9][0-9]' sourcefile | sed 's/т. //g' > result

Последний раз редактировалось vadblm, 17-08-2012 в 21:08.

Это сообщение посчитали полезным следующие участники:

Отправлено: 21:00, 17-08-2012 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Новый участник


Сообщения: 3
Благодарности: 0

Профиль | Отправить PM | Цитировать


пустой файл выходит почемуто

Отправлено: 23:47, 17-08-2012 | #3


Забанен


Сообщения: 6158
Благодарности: 1300

Профиль | Цитировать


Значит, некорректно поставлена задача. Дайте что ли кусочек исходного файла.

Отправлено: 23:58, 17-08-2012 | #4


Новый участник


Сообщения: 3
Благодарности: 0

Профиль | Отправить PM | Цитировать


Есть газета. В ней много текста - к примеру
продается машина москвич 2140. т. 8-000-000-00-00.
нужно вытянуть тел и записать его в файл

Отправлено: 09:49, 18-08-2012 | #5


Забанен


Сообщения: 6158
Благодарности: 1300

Профиль | Цитировать


Короче, формулирую за вас: телефонный номер всегда начинается с символов "т. 8-", дальше идут 10 цифр, могущие быть в диапазоне от 0 до 9, сгруппированные в 4 группы по 3,3,2,2, разделённые символом "-". Я дал выражение для этой формулировки, но вы говорите ,что оно не срабатывает, значит формулировка неверна. Может между "т." и "8-" не один пробел, а два, или вообще нет, может исходный файл в другой кодировке (CP866, CP1251, KOI8-R), а в линуксе UTF-8. Дефисы бывают разные, может такой "-", а может такой "—", да и пробелов в типографском деле целый пучок, а с точки зрения системы они все разные символы. Они даже порой в разных кодировках по разному кодируются, например, неразрывный пробел (nbsp) в KOI8-R имеет код 0x9A, а в других — 0xA0.

Отправлено: 10:58, 18-08-2012 | #6



Компьютерный форум OSzone.net » Linux и FreeBSD » Общий по Linux » Прочее - grep - вытянуть телефоны

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Debian/Ubuntu - grep регулярное выражение Forpost Общий по Linux 3 25-05-2012 00:50
Вытянуть ссылку с документа MS Word в IE sniper_super AutoIt 3 20-04-2011 00:49
[решено] Как вытянуть Alkid SE из Zver CrOsP Автоматическая установка Windows 2000/XP/2003 12 03-02-2010 02:58
Прочее - grep регулярные выражения dogidogi Общий по Linux 8 28-05-2009 22:54
Как вытянуть Флеш память из kiro Мобильные ОС, смартфоны и планшеты 5 21-02-2004 18:14




 
Переход