Войти

Показать полную графическую версию : Интернет сервис, выдающий по URL страницы фаргмент этой страницы


Yewgeniy
18-10-2017, 09:50
Есть ли в инете такой сервис, который по заданным параметрам "вырезает" и возвращает часть исходного кода страницы?
Хочу сделать выборку по именам элементов посредством другого сервиса, но встретилась страница, собранная из элементов с именами, одинаковыми во всех частях страницы.

Например, есть страница Сраница1
Структура её такая:

элемент имя=Элемент1 // реклама
элемент имя=Элемент2 // реклама
элемент имя=Элемент3 // реклама
Текст1
элемент имя=Элемент1 // полезное содержание
элемент имя=Элемент3 // полезное содержание
элемент имя=Элемент2 // полезное содержание

Интересна только часть страницы после Текст1, но поскольку эта часть состоит из элементов с теми же именами как и в других частях страницы, сделать выборку по именам не получится. Сначала надо получить часть страницы после Текст1 и уже из этой части сделать выборку по именам.

Iska
18-10-2017, 12:23
Yewgeniy, пока даже не понятно, о чём конкретно Вы речь ведёте.

DJ Mogarych
25-10-2017, 11:51
Yewgeniy, здесь нужно делать скрипт самому. Полагаю, Powershell для этого вполне подойдёт, если вы работаете под Windows.

Начать можно с этого:
https://social.technet.microsoft.com/wiki/contents/articles/26009.getting-information-from-web-pages-via-powershell.aspx

Yewgeniy
25-10-2017, 12:49
Иногда проще отказаться от предложения (т.е. в данном случае - от вебстраницы), чем превращать чужую проблему в мою проблему.

softter
25-10-2017, 18:50
Первое что приходит в голову использовать метод HTML парсинга страниц с помощью PHP библиотеки Simple Html Dom
Я с ее помощью свой сайт с юкоза постранично распарсил и перенес на PHP хостинг

Yewgeniy
26-10-2017, 10:36
softter, окупается?

softter
26-10-2017, 20:44
Yewgeniy, не понятен смысл вопроса. Что окупается?

Yewgeniy
27-10-2017, 10:17
Ваши деятельность и издержки. Хозяйственный эффект какой? Иметь собственный сайт проще чем кошку. Зарабатывать на нём - вот это результат.




© OSzone.net 2001-2012