leonid.poydolov@fb
05-11-2016, 11:55
Сейчас сайт погоды определяет браузер, после чего дает загружать страницу..
Подскажите куда вставить код1, в код2 парсера, чтобы при парсинге он определялся как браузер?
код1
$out = "GET $path HTTP/1.0\r\n";
$out .= "Accept: image/gif, application/xhtml+xml, */*\r\n";
$out .= "Accept-Language: ru\r\n";
$out .= "Host: $host\r\n";
//Имитируем браузер Opera Mini:
$out .= "User-Agent: Opera/8.01 (J2ME/MIDP; ".
"Opera Mini/2.0.4509/1716; ru; U; ssr)\r\n";
$out .= "Cache-Control: no-cache\r\n"; //Не кэшировать
$out .= "Connection: Close\r\n\r\n";
код2
<?php
$url = 'http://pogoda.yandex.ru/moscow/details'; //загрузит
$beginBlock = '<div class=\"b-navigation-city\">';
$endBlock = '<div class=\"b-print b-noprint\">';
$cachefile = dirname(__FILE__) . '/cache/weather.php'; // файл кеша
$cache_time_config = 7200; //время актуальности кеша 2 часа
//Проверяем наличие кеша
if (file_exists($cachefile))
{
$cachetime = filemtime($cachefile); // время создание кеша
if ((time() - $cachetime) < $cache_time_config) //если кеш не устарел - берем значение из него
{
$cache_used = true;
include $cachefile;
}
}
if (!$cache_used) // если не использовали кеш - заправшиваем страницу с сервера погоды
{
$pattern = '%' . $beginBlock . '(.*)' . $endBlock . '%isU';
$fp = @fopen($url, 'r');
if (!$fp)
exit();
$data = '';
while (!feof($fp))
{
$data .= fgets($fp, 8192);
}
fclose($fp);
$data = str_replace("yandex.st/weather/1.2.83/i", "localhost", $data);
if (!preg_match($pattern, $data, $matches)) // страница не доступна
{
if (file_exists($cachefile)) // берем из устаревшего кеша данные
{
include $cachefile;
}
else // кеш отсутствует
{
echo 'Сервер погоды временно недоступен';
}
}
else // сохраняем в кеш новое значение
{
file_put_contents($cachefile, '<?php $matches=' . var_export($matches, 1) . '; ?>');
}
}
echo isset($matches[1]) ? $matches[1] : '';
Подскажите куда вставить код1, в код2 парсера, чтобы при парсинге он определялся как браузер?
код1
$out = "GET $path HTTP/1.0\r\n";
$out .= "Accept: image/gif, application/xhtml+xml, */*\r\n";
$out .= "Accept-Language: ru\r\n";
$out .= "Host: $host\r\n";
//Имитируем браузер Opera Mini:
$out .= "User-Agent: Opera/8.01 (J2ME/MIDP; ".
"Opera Mini/2.0.4509/1716; ru; U; ssr)\r\n";
$out .= "Cache-Control: no-cache\r\n"; //Не кэшировать
$out .= "Connection: Close\r\n\r\n";
код2
<?php
$url = 'http://pogoda.yandex.ru/moscow/details'; //загрузит
$beginBlock = '<div class=\"b-navigation-city\">';
$endBlock = '<div class=\"b-print b-noprint\">';
$cachefile = dirname(__FILE__) . '/cache/weather.php'; // файл кеша
$cache_time_config = 7200; //время актуальности кеша 2 часа
//Проверяем наличие кеша
if (file_exists($cachefile))
{
$cachetime = filemtime($cachefile); // время создание кеша
if ((time() - $cachetime) < $cache_time_config) //если кеш не устарел - берем значение из него
{
$cache_used = true;
include $cachefile;
}
}
if (!$cache_used) // если не использовали кеш - заправшиваем страницу с сервера погоды
{
$pattern = '%' . $beginBlock . '(.*)' . $endBlock . '%isU';
$fp = @fopen($url, 'r');
if (!$fp)
exit();
$data = '';
while (!feof($fp))
{
$data .= fgets($fp, 8192);
}
fclose($fp);
$data = str_replace("yandex.st/weather/1.2.83/i", "localhost", $data);
if (!preg_match($pattern, $data, $matches)) // страница не доступна
{
if (file_exists($cachefile)) // берем из устаревшего кеша данные
{
include $cachefile;
}
else // кеш отсутствует
{
echo 'Сервер погоды временно недоступен';
}
}
else // сохраняем в кеш новое значение
{
file_put_contents($cachefile, '<?php $matches=' . var_export($matches, 1) . '; ?>');
}
}
echo isset($matches[1]) ? $matches[1] : '';