![]() |
Получить заголовок страницы в Интернете
Привет. Такая задача.
Надо получить заголовок страницы, которая расположена на удалённом сервере. Т.е., надо получить текст между тэгами <TITLE>. С помощью каких встроенных функций можно такое сделать? |
Вот так примерно:
Код:
#include <IE.au3> |
Чё-то он выдаёт ошибку. В файле IE.au3 344-я строка.
Код:
$sTmp = $oWindow.type ; Is .type a valid property? |
У меня без ошибок. Пробовал разные ссылки и https тоже.
IE 11 на Windows 10 x32, autoit 3.14 |
А у меня Хрюша и IE 6.
Ну ладно, спасибо. |
на хрюше вроде ie 8 или даже 9 есть )))
|
Mike909, какой смысл в вечно ложном условии:
Код:
If IsObj($oIE) Then Код:
$oIE=_IECreate($link,1,0,1) Мой вариант: Скрытый текст
Код:
#include <IE.au3> |
Iska, спасибо. Ваш скрипт работает. Интересно, а будет ли он работать на любых операционных системах?
Хотя-бы, чтобы начиная с ХР, кончая 10-ой. И чтобы от разрядности не зависел. |
Паразит, проверяйте, мне не на чем. Могу сказать одно: работать будет не везде. Например, данный форум и сайт на IE11 без установки режима совместимости дадут ошибку обработки. Соответственно, и скрипт «обломается».
|
А как выставить такой режим?
|
Паразит, не интересовался. Видимо получать номер версии IE, сравнивать и добавлять по нужде сайт в списки: Programmatically add a site to Compatibility View list.
|
Цитата:
|
Mike909, ясно.
|
Паразит,
Код:
$sURL = 'http://forum.oszone.net/post-2726095.html' |
Creat0R, это то, что мне нужно. Просто и со вкусом. Но.
1. Не работает с защищённым соединением (HTTPS). 2. Если страница UTF-8, то выводятся кракозябры. Я думаю, что второе это ерунда (легко поправимо), а вот с первым - я думаю, что не ерунда. |
Цитата:
Цитата:
|
Iska, точно. Не работает, если не указан протокол.
Так работает: Код:
http://wincmd.ru/ Код:
www.wincmd.ru |
Паразит, протокол желательно указывать. Ведь схема является составной и обязательной частью URI.
|
Код:
$sURL = 'http://wincmd.ru' |
Creat0R, великолепно, спасибо. Работает так, как надо.
|
Это ещё не всё :):
Код:
$sURL = 'https://koi8.pp.ru/' |
Iska, а почему не работает? Потому что кодировка?
Или robots.txt не позволяет? Или слишком сложная доменная структура? |
Цитата:
|
Я думаю, что сайтов с такой кодировкой уже почти не существует
|
Угу: Usage Statistics of Character Encodings for Websites, April 2017. Но они есть. И, видите ли… уже почти не существует машин на Windows XP, но те, что есть, приходится учитывать. Так и тут — если рассматривать вопрос не в каком-то частном контексте, а в целом.
|
Цитата:
Что касается кодировки, то это тоже можно решить (но здесь это не требуется): Код:
#include <Encoding.au3> |
Время: 02:49. |
Время: 02:49.
© OSzone.net 2001-