Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - Парсинг HTML из URL

Ответить
Настройки темы
CMD/BAT - Парсинг HTML из URL

Пользователь


Сообщения: 116
Благодарности: 1

Профиль | Отправить PM | Цитировать


хочу получить HTML код страницы по URL после того как она загрузилась(прошли все php скрипты и всё такое) в файл...не важно стандартными средствами CMD или доп по...главное чтобы по не занимало сотни файлов...1 или 3 нормально будет...но думаю такое врядли существует чтоб прям одним файлом...по крайней мере я такого не нашел...

Отправлено: 20:37, 11-07-2018

 

Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата Darkar25:
по URL »
Например?

Цитата Darkar25:
прошли все php скрипты »
С каких пор php скрипты начали выполняться на клиенте?

И определитесь:
Цитата Darkar25:
Парсинг HTML »
или просто:
Цитата Darkar25:
получить HTML код страницы »

Отправлено: 20:46, 11-07-2018 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Пользователь


Сообщения: 116
Благодарности: 1

Профиль | Отправить PM | Цитировать


Цитата Iska:
Например? »
например https://github.com/npocmaka/batch.sc...ntDownload.bat
тут батник для скачивания HTML кода страницы но в моём случае он не работает...
Цитата Iska:
С каких пор php скрипты начали выполняться на клиенте? »
а где я сказал что они на клиенте выполняются?
Цитата Iska:
И определитесь: »
Цитата Iska:
или просто: »
разве это не одно и то-же?

Отправлено: 08:04, 12-07-2018 | #3


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата Darkar25:
например https://github.com/npocmaka/batch.sc...ntDownload.bat »
Я имел в виду адрес страницы, которую нужно — что — загрузить/парсить.

Цитата Darkar25:
тут батник для скачивания HTML кода страницы но в моём случае он не работает... »
От пакетного файла там только огрызок. В реальности там банальный JScript .NET. С большим успехом можно использовать PowerShell, базирующийся на том же .Net Framework.

Цитата Darkar25:
а где я сказал что они на клиенте выполняются? »
Ну, Вы это так специально оговорили, как будто бы от клиента зависит, будут ли они выполняться, али нет.


Цитата Darkar25:
разве это не одно и то-же? »
Нет, не одно и то же.


В Вашем случае для загрузки страницы следует использовать либо wget.exe, либо curl.exe, либо PowerShell.

Отправлено: 08:24, 12-07-2018 | #4


Пользователь


Сообщения: 116
Благодарности: 1

Профиль | Отправить PM | Цитировать


Цитата Iska:
Я имел в виду адрес страницы, которую нужно — что — загрузить/парсить. »
вообще парсить хочу свой личный сайт...на нём происходит сверка вводимых данных и данных на сервере...потом если все норм то на страницу выводит Correct,..иначе Wrong...вот пример...
onedev.tk/check.php?key=file&param1=1&param2=2
Цитата Iska:
Ну, Вы это так специально оговорили, как будто бы от клиента зависит, будут ли они выполняться, али нет. »
нуу...)))
Цитата Iska:
В Вашем случае для загрузки страницы следует использовать либо wget.exe, либо curl.exe»
я там посмотрел wget и curl для видны...там столько файлов шо капец...ну а мне нужно чтобы это не занимало слишком много места и файлов...
Цитата Iska:
либо PowerShell. »
а как это можно сделать через шелл?

Последний раз редактировалось Darkar25, 12-07-2018 в 09:48.


Отправлено: 09:39, 12-07-2018 | #5


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата Darkar25:
я там посмотрел wget и curl для видны...там столько файлов шо капец.. »
Сколько? Для wget я насчитал пять:
Код: Выделить весь код
libintl3.dll
libiconv2.dll
libeay32.dll
libssl32.dll
wget.exe
общим объёмом в три мегабайта.


Цитата Darkar25:
а как это можно сделать через шелл? »
Invoke-WebRequest

Отправлено: 16:18, 13-07-2018 | #6

x0r x0r вне форума

Забанен


Сообщения: 795
Благодарности: 137

Профиль | Цитировать


Да они обадва (и wget и curl )всего-то, по ~4MB весят. Просто для виндоюзерофф понятие "зависимости" в описании, вганяет в ступор мгновенно Хотя все библы описаны в редмну, а так же легчайше ищуццо чеерз F3 в TC .
Darkar25, думаю, тебе нужен именно curl.

а еще , есть такая прога Aria2. но лучше curl

Отправлено: 17:36, 13-07-2018 | #7


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


Цитата x0r:
Просто для виндоюзерофф понятие "зависимости" в описании, вганяет в ступор мгновенно »
Меня не вгоняет .

Цитата x0r:
а так же легчайше ищуццо чеерз F3 в TC . »
Dependency Walker.

Отправлено: 18:23, 13-07-2018 | #8


Забанен


Сообщения: 793
Благодарности: 260

Профиль | Цитировать


curl, начиная с апрельского обновления Win10 является штатной утилитой, так что всем обладателям данной системы не нужно заморачиваться. А вообще, статически слинкованные wget и curl не нуждаются в сторонних файлах, - это к слову.
Помимо прочего есть Cygwin (чтобы не заморачиваться с зависимостями).
Это сообщение посчитали полезным следующие участники:

Отправлено: 18:30, 13-07-2018 | #9

x0r x0r вне форума

Забанен


Сообщения: 795
Благодарности: 137

Профиль | Цитировать


Iska, меня тоже нет. Долго пытался стать красноглазиком. честно пытался, не сложилось. Как та пчела из "басни о пчёлах" Мандевилля xD - сознательно выбрал "винду", отвергнув канонiчный Линух(кой-чего почерпнув оттудава. Конечно консоль, тулзы всякие ).

Цитата greg zakharov:
татически слинкованные wget и curl не нуждаются в сторонних файлах, - это к слову. »
ну раз к слову... то скажу, что по личному опыту, эту хрень не надо юзать. Я дважды качал статически слинкованную версию wget (та что одним файлом) и оба раза оно глючило. По параметрам вылетало, а параметров не так уж и много, всего десяток примерно - и wget вылетал. Curl не пробовал даже, нафиг. ~14MB в одной папке держу, все библы для wget + curl + grep + скрипты = можно качать почти отовсюду, почти что угодно(это то, что с бравзером переносным таскаю).

14.5MB список библ, стопудова есть лишние, но лень уже вычислять. пох.

Код: Выделить весь код
cygffi-6.dll
cyggcc_s-1.dll
cyggcrypt-11.dll
cyggmp-10.dll
cyggnutls-26.dll
cyggnutls-28.dll
cyggnutlsxx-28.dll
cyggpg-error-0.dll
cyghogweed-2.dll
cygiconv-2.dll
cygidn-11.dll
cygintl-8.dll
cygnettle-4.dll
cygp11-kit-0.dll
cygpcre-1.dll
cygpsl-5.dll
cygtasn1-3.dll
cygtasn1-6.dll
cygunistring-2.dll
cyguuid-1.dll
cygwin1.dll
cygz.dll
aria2c.exe
curl.exe
grep.exe
wget.exe

Отправлено: 19:16, 13-07-2018 | #10



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Скриптовые языки администрирования Windows » CMD/BAT - Парсинг HTML из URL

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
VBS/WSH/JS - [решено] Парсинг html-страницы The_Immortal Скриптовые языки администрирования Windows 20 12-05-2018 23:34
2003/XP/2000 - открытие URL из MS WORD sweetest Microsoft Office (Word, Excel, Outlook и т.д.) 1 11-09-2016 11:56
PowerShell - Парсинг HTML, Parser HTML dosperados Скриптовые языки администрирования Windows 6 15-04-2016 08:46
http/web - Редирект URL на другой URL zergood Сетевые технологии 0 03-04-2014 15:20
CMD/BAT - Парсинг HTML Smasher Скриптовые языки администрирования Windows 14 25-09-2012 20:45




 
Переход