|
Компьютерный форум OSzone.net » Компьютеры + Интернет » Вебмастеру » Можно-ли собрать оптом инфу о статусе товаров с и-нет магазина? |
|
|
Можно-ли собрать оптом инфу о статусе товаров с и-нет магазина?
|
Восставший Сообщения: 405 |
Я в этом деле ничего не понимаю, и возможно спрошу\скажу глупость, но я попробую.
Есть и-нет магазин. Есть необходимость раз-два в неделю проверить наличие \ остутсвие 200 - 300 наименований товара. В идеале вывести результат в таблицу. Насколько это вообще реально? Насколько трудоемко, и, как следствие, насколько дорого заказать такую вещь? Предполагаю, что все-таки зависит еще и от того самого и-нет магазина, но пока вопрос такой, какой есть, без конкретики. Спасибо. |
|
Отправлено: 12:22, 07-09-2010 |
Кот Ти Сообщения: 7318
|
Профиль | Отправить PM | Цитировать Если разметка и адреса всех страниц схожие, то реализовать сбор информации достаточно просто (адреса, например, имеют номера от 1.html до 300.html или что-то в этом духе). Кодируется, думаю, за час (плюсуем сюда время на формирование красивого отчёта, обновления по расписанию, создание интерфейса и т.п.)
Если надо на странице каталога выискивать ссылки и по ним скачивать страницы, то это сложнее, но незначительно. Опять же, "ровная" разметка значительно упрощает процедуру. Да, ещё: если владелец сайта установил ограничения на загрузку страниц (например, не больше 10 штук в секунду или что-то в этом духе), то надо будет ещё предусматривать интервалы между запросами. Проф, может, это быстро сделает, а новичку придётся повозиться. |
Отправлено: 12:29, 07-09-2010 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
Восставший Сообщения: 405
|
Профиль | Отправить PM | Цитировать вообще надо не совсем сбор информации. есть код товара. этот код берется из таблицы (ее несложно сделать вручную - час/ два моего времени), ищется на сайте, определяется его наличие по соответствующей надписи (этот момент меня смущает больше всего), и ставится в таблице соответсвующая этому товару запись - есть он или отсутствует.
вообще скорость сканирования совсем не критична, критично делать это вручную. |
Отправлено: 12:42, 07-09-2010 | #3 |
Deadooshka Сообщения: 2562
|
Профиль | Отправить PM | Цитировать Регекспы подразумевают постоянство хтмл-кода. Удобнее сделать API для получения данных в удобном формате (XML,JSON и т.д.)
|
Отправлено: 12:47, 07-09-2010 | #4 |
Восставший Сообщения: 405
|
Профиль | Отправить PM | Цитировать Регекспы - тут не пропущен пробел или точка?А то я нервничаю при виде этого слова.
![]() |
|
Отправлено: 12:55, 07-09-2010 | #5 |
Deadooshka Сообщения: 2562
|
Профиль | Отправить PM | Цитировать Регексп - регулярное выражение (много букв). Парсинг хтмл-кода идет в основном за счет них (preg_match и т.д.).
|
Отправлено: 12:59, 07-09-2010 | #6 |
Ветеран Сообщения: 20133
|
Профиль | Отправить PM | Цитировать |
------- Отправлено: 13:01, 07-09-2010 | #7 |
Кот Ти Сообщения: 7318
|
Профиль | Отправить PM | Цитировать Sham, думаю, речь идёт о разборе чужого интернет-магазина, т.ч. API вряд ли получится сделать. Или о своём всё-таки? Нет данных.
Цитата hellrised:
Найти конкретное слово в тексте - очень просто, если оно единственное на странице. Смущать не должно ![]() А я в первую очередь подумал о простой функции поиска - без регулярных выражений. |
|
Отправлено: 13:02, 07-09-2010 | #8 |
Восставший Сообщения: 405
|
Профиль | Отправить PM | Цитировать магазин чужой.
Адреса страниц типа - http://www.адрес_магазина /код_товара_типа_AB123C /название_товара_с_подчеркиваниями_вместо_пробелов. html если уж делать исходную таблицу кодов интересующих товаров, то вместе с его кодом можно воткнуть и адрес страницы. Видимо поиск товара ни к чему, если его адрес известен. Остается автоматом найти метку "товар в наличии" или ее отсутствие. (в коде страницы даже мне не составило труда его найти вручную) |
Отправлено: 13:15, 07-09-2010 | #9 |
Кот Ти Сообщения: 7318
|
Профиль | Отправить PM | Цитировать Ну что ж, если все ссылки будут, то вообще всё просто. А если страницы открываются даже по запросу http://www.адрес_магазина /код_товара_типа_AB123C / (без дальнейшей части), то и ссылки не нужны - кода хватит.
Вопрос решён? ![]() |
Отправлено: 13:29, 07-09-2010 | #10 |
|
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Мультимедиа - Записал инфу на винт, отсоединил - ничего нет... | CyraxZ | Хочу все знать | 2 | 10-11-2008 19:38 | |
GeForce 8600GTS....можно подробную инфу? | WiKer | Видеокарты | 24 | 09-04-2008 17:21 | |
Delphi - Вопрос о статусе Delphi | 5pliT | Программирование и базы данных | 3 | 13-01-2008 20:22 | |
Установка - При установке Winды поверх XpSp2. Какую инфу можно потерять? | Rock | Microsoft Windows 2000/XP | 9 | 24-10-2007 03:16 | |
Как собрать инфу об установленном железе | Guest | Защита компьютерных систем | 6 | 28-01-2004 21:28 |
|