Цитата Griboed0ff:
смогу ли я, например, пропарсить странички с другой структурой? насколько с понял парсер извлекает данные со странички, а потом уже можно из них дергать, то что нужно.»
|
В исходном скрипте парсятся таблицы и конвертируются в csv. Таблиц на страницах может быть несколько, а также они могут иметь вложенную структуру. Со вложенными таблицами - не всё просто, их парсер разобрать вряд ли сумеет, только можно исключить из разбора и парсить только конечные, которые не имеют вложенных элементов TABLE.
Если структура требуемых страниц отличается, то естественно, придется скрипт корректировать... т.е. так, чтобы была полная универсальность, в костылях сделать не получится...
Цитата Griboed0ff:
Парсер мне еще много раз пригодится, например собирать данные с веб морд принтеров, поэтому хочу научиться настраивать его под нужную страничку. »
|
Ну, собственно,
здесь, я попытался сделать то, что можно корректировать под конкретную структуру, это та часть, которая начинается с
Код:

[pscustomobject]@{
- это формирование хэш-таблицы, в которой дергаются данные из того, что было выбрано парсером.
Т.к. исходный парсер использует все таблицы, то в конечном пришлось добавить параметр номера таблицы (нумерация начинается с 0), в которой находятся необходимые данные. Этот номер сильно зависит от структуры страницы и автоматом его определять сложно, необходима привязка к конечным данным.
Цитата Griboed0ff:
Например сейчас есть потребность снимать данные со странички, у которой есть авторизация. »
|
Любой парсер будет зависеть от структуры страницы, универсальность в наших костылях - предел мечтаний, так что...