![]() |
Внимание, важное сообщение: Дорогие Друзья!
В ноябре далекого 2001 года мы решили создать сайт и форум, которые смогут помочь как начинающим, так и продвинутым пользователям разобраться в операционных системах. В 2004-2006г наш проект был одним из самых крупных ИТ ресурсов в рунете, на пике нас посещало более 300 000 человек в день! Наша документация по службам Windows и автоматической установке помогла огромному количеству пользователей и сисадминов. Мы с уверенностью можем сказать, что внесли большой вклад в развитие ИТ сообщества рунета. Но... время меняются, приоритеты тоже. И, к сожалению, пришло время сказать До встречи! После долгих дискуссий было принято решение закрыть наш проект. 1 августа форум переводится в режим Только чтение, а в начале сентября мы переведем рубильник в положение Выключен Огромное спасибо за эти 24 года, это было незабываемое приключение. Сказать спасибо и поделиться своей историей можно в данной теме. С уважением, ваш призрачный админ, BigMac... |
|
Компьютерный форум OSzone.net » Компьютеры + Интернет » Вебмастеру » Скрипт для скачивания сайта |
|
|
Скрипт для скачивания сайта
|
![]() Radio-active Сообщения: 1406 |
Всем здравствуйте!
Мне нужно сделать PHP скрипт который бы заходил на сайт вводил логин и пароль, используя форму для поиска осуществлял поиск и скачивал бы результаты поиска к себе. Вот только даже не знаю с чего начать. Как сделать что-то вроде имитации захода пользователя на сайт? |
|
Отправлено: 23:39, 15-10-2006 |
Пользователь Сообщения: 67
|
Профиль | Сайт | Отправить PM | Цитировать |
Отправлено: 01:16, 16-10-2006 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
![]() Ветеран Сообщения: 1864
|
Профиль | Отправить PM | Цитировать Plutonium 239
Надо симулировать браузер HTTP запросами. Смотрим в сторону curl функций. Либо пишем свои классы для составления и отправки ХТТП запросов |
------- Отправлено: 01:36, 16-10-2006 | #3 |
![]() Radio-active Сообщения: 1406
|
Профиль | Отправить PM | Цитировать Цитата:
![]() curl как я понял может использовать кукис для авторизации на сайте, вот это было бы как раз то что нужно. А еще нужно вытащить из полученного HTML документа информацию, HTML вида
Из него нужно получить массив типа: дата, заголовок, текст и т.д. Пробовал регулярным выражением но это неработатет, и другие тоже не работают ![]() И еще, на сайте кодировка UTF-8 а у меня какая-то другая, windows по всей видимости, и когда php скрипт этот файл открывае то там белеберда всякая, что делать? |
|
Отправлено: 13:48, 16-10-2006 | #4 |
Ветеран Сообщения: 1404
|
Профиль | Отправить PM | Цитировать Цитата:
/class=\"date\">(.*?)<\/td>/ /class=\"title\">(.*?)<\/td>/ /class=\"text\">(.*?)<\/td>/ |
||
------- Отправлено: 16:29, 16-10-2006 | #5 |
![]() Radio-active Сообщения: 1406
|
Профиль | Отправить PM | Цитировать Вот такой код
В результате браузер выдает белиберду, в адресной строке вместо значков & какие-то amp; что это за amp такие, откуда они беруться и как от них избавиться? |
Отправлено: 19:37, 18-10-2006 | #6 |
Ветеран Сообщения: 1404
|
Профиль | Отправить PM | Цитировать Цитата:
мой интерпретатор PHP выдает ошибку, когда в начале стоит вот такое определение переменной $url = "search.phtml?s_ty=All&s_i=F&s_l=M&s_f=18&s_t=40&s_p=checked&s_c=3159_4528_4549&s_w=checked" В остальном этот код работает вроде бы так как и должен. Перед неалфавитными символами рекомендую использовать слэш. Слэш означает что этот символ будет пониматься так как он написан: \& \? \" \' \. \/ \\ |
|
Отправлено: 04:49, 19-10-2006 | #7 |
![]() Radio-active Сообщения: 1406
|
Профиль | Отправить PM | Цитировать Все нормально страничка скачатвается, разбирается на ссылки, но вот тольок я сталкнулся с такой проблемой, когда перехожу по ссылке просят ввсести код с картинки вместо нужной странички.
Есть ли какой-нибудь способ это обойти? |
Отправлено: 09:44, 21-10-2006 | #8 |
![]() Ветеран Сообщения: 1864
|
Профиль | Отправить PM | Цитировать Plutonium 239
Нет, почти нет. Если программисты там сами не допустили какой нибудь оплошности в виде передачи этого номера по GET, что сегодня уже почти не происходит. А парсинг подобной картинки и попытки вычитать оттуда номер не увенчаются успехом, или будет длиться очень долго и с неточностьями |
------- Отправлено: 14:33, 21-10-2006 | #9 |
![]() Radio-active Сообщения: 1406
|
Профиль | Отправить PM | Цитировать А вот еще такой вопрос, можно ли сделать так, чтобы скрипт скаченные странички архивировал и отправлял на заданный email? Это вообще возможно, если да, то как?
И еще вопрос, чтобы заменить в скаченном файле все ссылки с http://..../файл.htm на файл.htm достаточно просто натравить на него регулярные выражения? И кстати, где можно почитать про PCRE регулярные выражения в PHP мануал я уже прочитал, хотелось бы более развернуто и доступно ![]() |
Отправлено: 17:04, 23-10-2006 | #10 |
|
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Интернет - Программа для скачивания сайта | Evgesha_572 | Программное обеспечение Windows | 7 | 17-02-2012 10:12 | |
нужен скрипт для добавления сайта в избранное и сделать его стартовой страницей | Denis Shutka | Вебмастеру | 2 | 30-01-2005 11:03 | |
Есть каккая-нить прога для скачивания всех рисунков с сайта? | Guest | Хочу все знать | 9 | 27-05-2004 09:09 | |
Ссылки на файлы для скачивания | pauluss | Вебмастеру | 3 | 06-03-2004 18:25 | |
Программа для скачивания сайтов | Asiona | Хочу все знать | 3 | 29-11-2003 04:18 |
|