Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Хочу все знать (http://forum.oszone.net/forumdisplay.php?f=23)
-   -   [решено] Скачивание всех mp3 с сайта (http://forum.oszone.net/showthread.php?t=275013)

DJ Mogarych 01-01-2014 13:12 2281532

Скачивание всех mp3 с сайта
 
С новым годом!

Есть сайт с аудиосказками (http://mp3tales.info). Хочется скачать все эти сказки в mp3 автоматически.
В коде страниц сайта файлы лежат в таком виде:
Код:

file: "/audio/gorodok_v_tabakerke.mp3",
Может ли, например, wget найти все такие строки на сайте, поставить в начало адрес сайта, чтобы получилась полная ссылка, и скачать полученный список?

Буду благодарен за любую информацию, наводящую на решение, в т. ч., можно просто дать совет, как выдернуть все относительные ссылки на mp3 с сайта. Дальше-то ясно.

Update:

Сделал через костыли:
  1. Получил список ссылок всего сайта программой Xenu.
  2. Экспортировал список в txt, разделённым табуляцией.
  3. Импортировал txt в LibreOffice Calc, отсортировал по нужным ссылкам, скопировал их в ещё один текстовый файл.
  4. Запустил wget c параметром -i, подцепив этот список.

Интересно было бы узнать, как сделать это одним wget-ом...

Iska 01-01-2014 15:44 2281601

DJ Mogarych, я тоже обычно делал по отдельности: отдельно собирал ссылки в текстовый файл, в Excel добавлял в начало адрес, затем натравливал на него Wget или импортировал во Free Download Manager.

А что значит «найти Wget'ом»?

Теоретически можно попробовать собрать посредством WinHTTrack, установив фильтр на загрузку по типу.

DJ Mogarych 01-01-2014 17:32 2281656

Просто wget - мощная штука, и по идее, сам должен мочь находить ссылки на страницах.

Ну, или если не он, так curl какой-нибудь.

Nordek 01-01-2014 17:50 2281663

DJ Mogarych, Может эта информация поможет.

Habetdin 01-01-2014 20:04 2281744

DJ Mogarych, конечно мощная, особенно если мануал прочесть :jester: (не в обиду)
Цитата:

Цитата DJ Mogarych
В коде страниц сайта файлы лежат в таком виде: »

А еще в виде ссылок:
Код:

Размер: <a href="/audio/...
Запускаем wget и получаем всё (/tales/ для рекурсивного обхода по всем сказкам):
Код:

wget -r -l 0 -p -k -I /tales/,/audio/ http://mp3tales.info/tales/
читать дальше »

Не у всех файлов прописаны теги, кстати :(

C новым годом! :wink2:

DJ Mogarych 01-01-2014 21:35 2281766

Ооо, спасибище!


Время: 17:56.

Время: 17:56.
© OSzone.net 2001-