|
Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Программирование и базы данных » Разное - Помогите вытащить из этого сайта только ссылки |
|
|
Разное - Помогите вытащить из этого сайта только ссылки
|
Старожил Сообщения: 191 |
Привет! Хочу заблокировать все запрещенные ресурсы отсюда http://antizapret.info/ но там мешат даты и айпи адреса, помогите пожалуйста. Нужно чтобы был только список ссылок в виде столбца (.тхт) без ничего лишнего для вставки в конфигурационный файл.
|
|
Отправлено: 21:28, 01-08-2013 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать Dr. Comp, легко — API. PowerShell:
Вместо выделенного можете сразу добавить команды для вставки извлечённых строк в Ваш «конфигурационный файл». |
Последний раз редактировалось Iska, 02-08-2013 в 10:01. Причина: Поправил код для корректного вывода в файл Отправлено: 01:10, 02-08-2013 | #2 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
![]() Ветеран Сообщения: 1180
|
Профиль | Отправить PM | Цитировать Я делал так:
1. закачиваешь страницу index.html 2. Запускаешь скрипт cscript get_links.js <index.html следующего содержания: var page = WScript.StdIn.ReadAll(); var // prefix = "..\\gnu\\wget -c адрес ", // <-- команда для каждой ссылки. Я делал закачку prefix ="", re_link = /href\s*=\s*[\"\']([^\"\']+)[\"\']/gi, // re_ext = /\.mp3$/i, // <--- дополнительный фильтр на ссылки, я искал *.mp3 re_ext =//, load_list = {} for(;;) { var found = re_link.exec(page); if (found==null) break; if (re_ext.exec(found[1])) { load_list[found[1]] = true; } } for(var i in load_list) { WScript.StdOut.WriteLine(prefix + i); } |
Отправлено: 08:01, 02-08-2013 | #3 |
Пользователь Сообщения: 121
|
Профиль | Отправить PM | Цитировать Если со скриптами возиться нехочется:
Читаем http://antizapret.info/api.php Цитата:
|
|
Отправлено: 08:29, 02-08-2013 | #4 |
Старожил Сообщения: 191
|
Профиль | Отправить PM | Цитировать http://api.antizapret.info/all.php на этой странице прям за все время сайты? Чет мало.
|
|
Отправлено: 08:50, 02-08-2013 | #5 |
Пользователь Сообщения: 121
|
Профиль | Отправить PM | Цитировать Вроде бы что на сайте, то и там. Кроме удаленных из реестра.
|
Отправлено: 09:25, 02-08-2013 | #6 |
Старожил Сообщения: 191
|
Профиль | Отправить PM | Цитировать Еще есть такая проблема, кирилические aдреса неправильно отображаются в exel.
|
Отправлено: 09:30, 02-08-2013 | #7 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать $sXmlDocument = New-Object System.Xml.XmlDocument $sXmlDocument.load("http://api.antizapret.info/all.php?type=xml") $sXmlDocument.register.content | ForEach-Object -Process {$_.url.'#cdata-section'} | Set-Content -Path "E:\Песочница\0306\Domain list.txt" |
Отправлено: 10:02, 02-08-2013 | #8 |
Пользователь Сообщения: 121
|
Профиль | Отправить PM | Цитировать Кириллические адреса это вроде
Цитата:
Дак вроде правильно все. Как на сайте так и в файле. Чем именно Вы их блокировать собираетесь. Вполне возможно, что прокси такую запись поймут, а firewall'ы, насколько я помню, позволяют только по IP блокировать. Или у вас оборудование DPI поддерживает? Ростелеком, например, заявил, что у них денег на DPI нет и блокируют по IP. |
|
Отправлено: 10:31, 02-08-2013 | #9 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать Цитата torauma:
|
|
Отправлено: 11:57, 02-08-2013 | #10 |
|
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Как скачать видео с этого сайта?) | johnatan1 | Флейм | 2 | 25-07-2012 21:08 | |
Мультимедиа - Помогите вытащить музыку из видео клипа | bugmenotagain | Программное обеспечение Windows | 2 | 21-03-2012 18:26 | |
Прочие - [решено] Помогите вытащить иконку из usb safely remove | x-net | Программное обеспечение Windows | 6 | 27-12-2010 09:33 | |
Службы - Твики реестра - работа Винды после твиков с этого сайта. | AZONIC | Microsoft Windows 2000/XP | 18 | 23-09-2008 19:12 | |
Где взять многие статьи этого сайта в формате chm | Guest | О сайте и форуме | 4 | 25-06-2004 12:24 |
|