![]() |
Сбор информации с сайта и ее обработка.
Собственно хочу добавить в программу сбор информации о ЛЮБОМ фильме с портала Кинопоиск, да еще и так что бы работало все время правильно. Вот список для сбора.
Код:
<tr><td> Код:
<tr><td class="type">год</td><td class=""><a href="/level/10/m_act%5Byear%5D/2009/">2009</a></td></tr> Код:
<tr><td class="type">жанр</td><td><a href="/level/10/m_act%5Bgenre%5D/2/">фантастика</a>, <a href="/level/10/m_act%5Bgenre%5D/3/">боевик</a>, <a href="/level/10/m_act%5Bgenre%5D/4/">триллер</a>, <a href="/level/10/m_act%5Bgenre%5D/10/">приключения</a></td></tr> Код:
<tr><td class="type">сборы в мире</td><td class="dollar"><a href="/level/85/film/397496/">+ $91 500 000 = $190 077 529</a></td></tr> Код:
<tr><td class="type">премьера (мир)</td><td class="calendar"><a href="/level/80/film/397496/">5 августа 2009</a></td></tr> Код:
<tr><td class="type">время</td><td>118 мин.</td></tr> Код:
<tr><td colspan=3 style="padding:10px;padding-left:20px;" class="news"> Код:
<div style="color: #f60; font-family: tahoma; font-size: 25px"><a href="/level/83/film/397496/" class="continue" style="background: url(/images/dot_or.gif) 0 93% repeat-x; font-weight: normal !important; text-decoration: none">7.047<span style="font:100 14px tahoma, verdana"> 4163</span></a> Код:
<div style="color:#999;font:100 11px tahoma, verdana">IMDB: 6.10 (12 210)</div><div style="color:#999;font:100 11px tahoma, verdana">ожидание: <a href="/level/53/" style='color:#999;font:100 11px tahoma, verdana; text-decoration:underline;'>64%</a> (8 014)</div> Я набросал кое что. Но не думаю что у меня правильно получилось :( (Честно говоря мне с трудом даются SringRegExpReplase и др.) Код:
Func _Get() |
Цитата:
|
Извиняюсь..
Код:
http://www.kinopoisk.ru/level/1/film/397496/ |
Medic84, На будущее, всегда выкладывай рабочий пример, в твоём коде также нехватает инклюда Inet.au3.
Цитата:
P.S А в чём смысл замены пробела на пробел? :) |
Цитата:
Цитата:
Цитата:
|
Цитата:
|
В опере нажимаю "Исходный код".
Думаешь через IE нужно страницу сохранять? З.Ы. А ты пробовал слеш убирать? :) |
Цитата:
Вобщем вот рабочий вариант получения информации о фильме по ссылке. Исходник добывается извращённым путём - через скрытую инстанцию браузера IE :) Код:
#include <IE.au3> |
Если бы можно было оценку поставить поставил бы 10 баллов!
|
Хех. Пытался вставить свое и свое ничего не работает. Кроме краткого....
Причем в твоем скрипте "Имя" не работает. Код:
#include <IE.au3> |
Medic84,
Вот подправил: Код:
#include <IE.au3> Кстати, кроме «& nbsp;» ещё могут встречаться и другие теги(?), у меня где то была функция для их полной замены... |
Цитата:
Код:
Func _ContentReplaceTags($sString, $iCorrect=-1) |
Цитата:
Имя фильма поправил на Код:
(?si).*?<h1 style=(?si).*?class=moviename-big.*?>(.*?)</h1>.* 1. Рейтинг фильма. IDMB я вставил сам, а вот с обычным рейтингом незадача. Код:
<div style="color: #f60; font-family: tahoma; font-size: 25px"><a href="/level/83/film/392930/" class="continue" style="background: url(/images/dot_or.gif) 0 93% repeat-x; font-weight: normal !important; text-decoration: none">7.952<span style="font:100 14px tahoma, verdana"> 10591</span></a> У меня есть Элемент List Хочу добавить актеров с помощью _GUICtrlListBox_AddString($roles_List, "Актер") Код:
<tr><td style="height: 31px; text-align: right; border: none; padding-right: 10px"><span style="color: #f60">В главных ролях:</span></td></tr> |
Цитата:
Цитата:
Код:
(?si).*?<h1.*?class=moviename-big.*?>(.*?)</h1>.* Цитата:
Код:
#include <IE.au3> |
Вложений: 1
Код:
;$sRet_Content = StringRegExpReplace($sRet_Content, '(?si)<(/|)[abiu]( .*?|)>|<hr(/| /|)>', '') И что то рейтинг не работает :( И актеры это не массив :( Выдает ошибку. Вобще ерунда какая то. Программа вообще критическую ошибку выдает. И выдает отчет.... Посмотри пожалуйста если есть время. Там некоторые строчки с комментариями :) |
Вложений: 1
Цитата:
|
Цитата:
|
Время: 20:14. |
Время: 20:14.
© OSzone.net 2001-