Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » AutoIt » [решено] Получить заголовок страницы в Интернете

Ответить
Настройки темы
[решено] Получить заголовок страницы в Интернете

Аватара для Паразит

Пользователь


Сообщения: 68
Благодарности: 0

Профиль | Отправить PM | Цитировать


Изменения
Автор: Паразит
Дата: 04-04-2017
Привет. Такая задача.
Надо получить заголовок страницы, которая расположена на удалённом сервере.
Т.е., надо получить текст между тэгами <TITLE>.
С помощью каких встроенных функций можно такое сделать?

Отправлено: 12:41, 04-04-2017

 

Ветеран


Сообщения: 27449
Благодарности: 8086

Профиль | Отправить PM | Цитировать


Это ещё не всё :
Код: Выделить весь код
$sURL = 'https://koi8.pp.ru/'

Отправлено: 13:20, 05-04-2017 | #21



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Аватара для Паразит

Пользователь


Сообщения: 68
Благодарности: 0

Профиль | Отправить PM | Цитировать


Iska, а почему не работает? Потому что кодировка?
Или robots.txt не позволяет?
Или слишком сложная доменная структура?

Отправлено: 13:35, 05-04-2017 | #22


Ветеран


Сообщения: 27449
Благодарности: 8086

Профиль | Отправить PM | Цитировать


Цитата Паразит:
Iska, а почему не работает? Потому что кодировка? »
Потому что там KOI-8.

Отправлено: 13:45, 05-04-2017 | #23


Аватара для Паразит

Пользователь


Сообщения: 68
Благодарности: 0

Профиль | Отправить PM | Цитировать


Я думаю, что сайтов с такой кодировкой уже почти не существует

Отправлено: 13:52, 05-04-2017 | #24


Ветеран


Сообщения: 27449
Благодарности: 8086

Профиль | Отправить PM | Цитировать


Угу: Usage Statistics of Character Encodings for Websites, April 2017. Но они есть. И, видите ли… уже почти не существует машин на Windows XP, но те, что есть, приходится учитывать. Так и тут — если рассматривать вопрос не в каком-то частном контексте, а в целом.

Отправлено: 14:42, 05-04-2017 | #25


Аватара для Creat0R

Must AutoIt


Сообщения: 3054
Благодарности: 1009

Профиль | Сайт | Отправить PM | Цитировать


Цитата Паразит:
почему не работает? »
Потому что там тег TITLE (заглавными буквами), а в регулярке поиск по умолчанию чувствительный к регистру букв (нужно в начало добавлять (?i)).

Что касается кодировки, то это тоже можно решить (но здесь это не требуется):

Код: Выделить весь код
#include <Encoding.au3>

$sURL = 'https://koi8.pp.ru/'

$sHtml = BinaryToString(InetRead($sURL))
$aTitle = StringRegExp($sHtml, '(?i)<title>(.*?)</title>', 3)

If Not @error Then
    $sTitle = (_Encoding_IsUTF8Format($aTitle[0]) ? BinaryToString(StringToBinary($aTitle[0]), 4) : $aTitle[0])
    $sTitle = (_Encoding_GetCyrillicANSIEncoding($sTitle) = 'KOI8-R' ? _Encoding_KOI8To1251($sTitle) : $sTitle)

    MsgBox(0, @ScriptName, $sTitle)
EndIf
Библиотеку Encoding.au3 брать отсюда.

-------
“Сделай так просто, как возможно, но не проще этого.”... “Ты никогда не решишь проблему, если будешь думать так же, как те, кто её создал.”

Альберт Эйнштейн

P.S «Не оказываю техподдержку через ПМ/ICQ, и по email - для этого есть форум. ©»

http://creator-lab.ucoz.ru/Images/Icons/autoit_icon.png Русское сообщество AutoIt | http://creator-lab.ucoz.ru/Images/Ic...eator_icon.png CreatoR's Lab | http://creator-lab.ucoz.ru/Images/Icons/oac_icon.png Opera AC Community

Это сообщение посчитали полезным следующие участники:

Отправлено: 02:08, 06-04-2017 | #26



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » AutoIt » [решено] Получить заголовок страницы в Интернете

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Заголовок сообщения: I7adonok Металлолом 3 06-06-2013 05:17
php способы получить данные со страницы в инете enikei Вебмастеру 2 13-10-2010 04:54
[решено] Как получить только исхоный код страницы по HTTP (без картинок и тд - только текст)? evg64 AutoIt 3 10-01-2010 01:17
Интернет - Internet Explorer 6.0 sp2. Как указать печать адреса страницы при печати страницы. GifuN Microsoft Windows 2000/XP 1 11-11-2008 08:29




 
Переход