PDA

Показать полную графическую версию : [решено] поиск странички


jannaly
02-09-2013, 21:57
есть "txt" там всё забита htm кодом мне нужно отудого вытенуть вот такое к примеру http://33.media.exempl.com
с правой стороны убрать текст и слевой
пробывал так но от собирает всю строку ((
FINDSTR /C:"exempl.com" decode.c >>config.txt

ink rel="shortcut icon" href="http://33.media.exempl.com/avatar_296aanate" type="application/rss+xml
ink rel="shortcut icon" href="http://34.media.exempl.com/avatar_296aanate" type="application/rss+xml
ink rel="shortcut icon" href="http://35.media.exempl.com/avatar_296aanate" type="application/rss+xml

чтобы в результате "config.txt" было такое если возможно?


http://33.media.exempl.com
http://34.media.exempl.com
http://35.media.exempl.com

Anonymоus
02-09-2013, 22:00
Проще всего это будет реализовать с помощью grep.
Образец txt приложите. И укажите, из каких тэгов нужно получать значение атрибута\текст внутри.

Anonymоus
02-09-2013, 22:27
@Echo Off
rem Получаем данные из href
For /F "tokens=2 delims==" %%A In ('grep -Po "href=[\x22']{1}[^\x22']+[\x22']" "data.txt"') Do (
rem Удаляем обрамляющие кавычки и обрезаем ссылку до хоста
For /F "tokens=1,2,* delims=/" %%B In ("%%~A") Do Echo %%B//%%C>>config.txt
)

Grep для Windows можно забрать здесь (http://gnuwin32.sourceforge.net/packages/grep.htm).

Foreigner
02-09-2013, 22:28
jannaly,
sed.exe:

sed -n "/exempl.com/ s/.*\(http.*com\).*/\1/p" 1.txt 1>config.txt

powershell.exe:

(gc 1.txt | sls 'exempl.com') -replace '.*(http.*com).*','$1' | sc config.txt

jannaly
02-09-2013, 22:53
пасибки Anonymоus!
Foreigner первый вариянт нечего не происходит? хотя код не и не большой..
фторой так и не нашо powershell.exe (( Спасибки за помошь! класный сайт всегда нохожу всё что мне надо!

Foreigner
02-09-2013, 22:57
первый вариянт нечего не происходит? »
А sed есть? Он там же (http://gnuwin32.sourceforge.net/packages.html), где и grep

jannaly
02-09-2013, 23:13
да есть и sed в тойже директорие что и grep (( да у мня может карявые руки ))

вот рабочий от Anonymоus

@Echo Off
rem Получаем данные из href
For /F "tokens=2 delims==" %%A In ('grep -Po "href=[\x22']{1}[^\x22']+[\x22']" "decode.c"') Do (
rem Удаляем обрамляющие кавычки и обрезаем ссылку до хоста
For /F "tokens=1,2,* delims=/" %%B In ("%%~A") Do Echo %%B//%%C>>config.txt
)




© OSzone.net 2001-2012