![]() |
скрипт, который брал бы урл из переменной и сохралял исходный код веб страницы
Возможно создать такой скрипт, который брал бы урл из переменной и сохралял исходный код веб страницы в файл?
|
campbell, тебе нужен ответ в стиле да\нет или скрипт?
|
скрипт конечно )
|
campbell, используйте сторонние средства для загрузки страницы, например, Wget (Wget for Windows - GnuWin32) или cURL (cURL - Download).
В рамках WSH или PoSH сие также решаемо. |
спасибо пошел разбираться, но чувствую еще вопросы будут..
И если возможно напишите вариант скрипта, который читал бы файл html как исходный код и орентируясь по паре назначенных переменных вытаскивал бы строки. по примеру назначаешь переменную %A= "^<div class...^>" и он вытаскивает строчку а вторую двойную переменную т.е начиная с ..<BODY>.. и заканчивая </BODY> Заранее спасибо |
Что-то мне это напоминает ;)… campbell, у Вас, случайно, не похожий случай?
|
ох вот я задачку выбрал (подумалось) =)
Iska в чем-то похоже, завтра сяду на работе плотненько покопаю, А на самом деле идея казалась простенькой. Если вкратце я собрал разные скрипты с этого и других форумов (пинг серверов, проверка места на файл-хранилищах, дефрагментация и т.д.) и завязал все конечным скриптом обработки и переноса всех логов в один с отправкой на почту, и все бы хорошо)) Но дурная голова рукам, как известно....)) и решил а почему бы после всего не прикрутить к этому еще один скрипт который все это дело распихивал в заранее подготовленный html (и не выкладывал на ftp на закрытую страничку сайта) Да еще и с других сайтов инфу нужную добирал (хотя наверно это проще было бы на php сделать) Вот теперь сижу мучаюсь за одно осваиваю язык. Кстати хотел бы внести предложение: помимо помощи под конкретные задачки можно было бы завести топик просто для вопросов (глупых и не очень )) ) я бы регулярно пользовался, а то часто пытаясь разобрать скрипт упираешься в пару знаков и часами ищешь инфу, а зачем оно там стоит. |
Код:
@Echo Off нужен парсер строк на примере GISMETEO:там в исходном коде есть такой кусочек Код:
<h2>Погода за окном</h2> <div class="section"> Москва -1C 743 мм рт.ст СВ 4 м/с 68% |
Тишина ни у кого нет идей?
|
помогите с парсером который бы просто удалил из html все теги <...>
|
campbell, я же Вас спрашивал… Пробуйте (WSH):
Код:
Option Explicit Цитата:
|
Так закопался в возможности bat/cmd что забыл посмотреть форум
Iska, огромное спасибо вот только для меня cmd еще в процессе познания а vbs и подавно, если можно вставьте комментарии, что за что отвечает. задание сайта и кодировки я разобрал, а вот как, в последствии, происходит обработка полученного исходного кода. и вывод происходит в окно, а как направить в файл |
campbell, код достаточно сложен, если Вы не знаете самой технологии, так что сами по себе комментарии вряд ли помогут.
Если вкратце, то: 1. При помощи регулярного выражения выделяем из URL основной домен. 2. При помощи объекта «MSXML2.XMLHTTP» получаем исходный код страницы. 3. Посредством объекта «ADODB.Stream» конвертируем полученный массив байт в текст (поскольку «MSXML2.XMLHTTP» всегда получает содержимое в кодировке UTF-8 — дополнительно конвертируем в оригинальную кодировку; в данном случае сие необязательно, поскольку оригинал и так в UTF-8, но я оставил данный приём для демонстрации). 4. При помощи вставки тэга «BASE» корректируем относительные ссылки в документе. 5. Чтобы избежать исполнения скриптов — посредством регулярного выражения корректируем тип тэгов «SCRIPT». 6. Посредством DOM (Использование HTML DOM (Document Object Model) в скриптах на базе Windows Script Host) делаем разбор получившегося html-документа: а). Получаем коллекцию тэгов «H3». б). Ищем среди них тэг с классом «typeC». в). Далее опять же, посредством DOM, продвигаемся по дереву элементов, выделяем потребные нам элементы, получаем их значения. Цитата:
Код:
cscript.exe //nologo "E:\Песочница\0091\0001.vbs" >Result.txt |
Цитата:
|
Время: 06:36. |
Время: 06:36.
© OSzone.net 2001-