Войти

Показать полную графическую версию : Яндекс новости - частота обновления?


Страниц : [1] 2

Vampire
30-08-2006, 13:10
У меня такой вопрос: практически написал рсс парсер для отображения новостей с яндекс.новости на своем сайте, теперь вот осталось выяснить с какой частотой эти новости на яндексе обновляются (это для того-чтобы постоянно при загрузке страницы с новостями на моем сайте к яндексу не стучаться, делаю копию рсс ленты на своем сайте). случаем никто такой статистики не имеет? Буду очень благодэарен.

И еще вопросик: как лучше ленту обозвать news.rss или news.xml?

E-mail
30-08-2006, 13:13
Vampire

/rss/news.xml

:)

Vampire
30-08-2006, 13:22
Спасиб,
Только меня больше интересует первый вопрос - очень нужен на него ответ

E-mail
30-08-2006, 13:35
Vampire а что яндекс по этому поводу говорит?
по идее новостная лента обновляется по мере поступления новой новости, а кто может предсказать с какой частотой они будут появлятся?

Vampire
30-08-2006, 13:50
Ух нашел, вот:
Периодичность обновления
Максимальных или минимальных ограничений на количество сообщений нет, однако издание должно обновляться с определенной периодичностью, которая должна быть заявлена в информации об издании. Индексация транслируемых изданием сообщений осуществляется Яндексом каждые 10 минут.

Каждые 10 минут в автоматическом режиме, глубоко они эту инфу зарыли в "Информация для партнеров" (http://news.yandex.ru/cooperation.html).
Я же не их партнер и туда само собой не заглядывал, а оказывается надо было.

Ладно всем спасибо за помощь

E-mail
30-08-2006, 13:52
Vampire Каждые 10 минут в автоматическом режиме
это не дает гарантии на то что информация поменялась

Vampire
30-08-2006, 14:42
это не дает гарантии на то что информация поменялась
Да не дает.
У меня принцип такой, зашел посетитель на главную страницу сайта или на новостную страницу, пошла работа скрипта по выводу новостей. Этот скрипт стучится к нужной рубрике новостей яндекса, переделывает ленту и сохраняет эту ленту на сервере. Далее уже вывод на сайт новостей идет с ленты расположенной на моем сайте...
Представь, если на сайт зайдут одновременно или через несколько секунд, например 10 человек. Это мой скрипт будет до яндекса стучатся 10 раз (при этом он 10 раз будет создавать мою ленту с одним и тем-же содержимым), не хорошо получится. Для этого я ставлю задержку на 10 минут, как у яндекса. Скрипт сравнивает текущее время и время последнего обновления моей ленты. И если прошло более 10 минут с последнего обновления, то производится обработка новости с яндекса и создается моя лента, если нет, то новости выводятся из моей ленты. Это еще спасает от того, вдруг до яндекса нельзя будет достучаться :) - выведутся нновости из моей ленты, хотя и немного устаревшие.

Такой вот принцип, надеюсь не особо сумбурно написал :)

E-mail
30-08-2006, 15:12
Vampire,
зачем все усложнять? и зачем так часто беспокоить яндекс? каждые 10 мин этоже сдохнуть можно!
А вы не пробывали яндексу посылать заголовок if-modified-since перед скачиванием содержимого?

Vampire
30-08-2006, 22:44
Так этот яндекс сам каждые 10 минут по всем сайтам , на которых новости собирает, проходит и меняет свою ленту и не факт что новость какая-то добавилась, а дата файла все равно меняется.

У меня еще вопросик: обязательно в xml файле выстраивать древовидную структуру или это только для наглядности и можно каждую строку начинать без этих дополнительных пробелов перед ней?

benya
31-08-2006, 20:11
Vampire,
Можно не выставлять (тяжело будет для прочтения, но если открыть XML експлорером, то он сам выставит отступы)

Vampire
31-08-2006, 21:20
А зачем это дело эксплорером открывать, по моему в нем хмл читать не совсем удобно, он же всю разметку полностью с тегами выводит, проще ленты открывать программами для чтения новостных лент (у меня плагин в Макстоне для этого дела стоит) или я не прав?

А этих начальных пробелов на целый килобайт можно насобирать. Трафик пользователей нужно экономить. :)

benya
01-09-2006, 15:21
Vampire
Чушь! На килобайт больше или меньше этого никто не заметит даже через программу чтения новостей! А если вы собираетесь размещать rss новости у себя на сайте то к трафику пользователя XML вообще не относится.

XML читать и не нужно я говорил о чтении его структуры для веб-мастера.

Vampire
01-09-2006, 18:12
Я замечу, да и нефиг создавать ресурсы полностью забитые лишними пробелами, временами попадаются вообще жуткие странички, где эта самая разметка с ихними пробелами заанимает порядка 1/4 от объема всего хтмла. Куда это годится? Зачем.

А какая нафиг разница, читать xml с разметкой или без нее. Если все равно каждый тег начинается с новой строки. Или Вам без разметки сложновато мыслить? Для меня это привычное дело, хоть весь код в одну строку пусти.

Prisoner
02-09-2006, 10:30
Господа, не скатывайтесь, пожалуйста, во флейм, в оффтоп вы уже скатились.

benya
02-09-2006, 15:35
Vampire,
Вы вначале говорили о входном XML которые являлись rss новостями. Причем здесь html? А вообще не хотите использовать пробелы - можно использовать табуляцию, которая занимает один символ.

А какая нафиг разница, читать xml с разметкой или без нее. Если все равно каждый тег начинается с новой строки.

Это разве не разметка? :tease: Вы наверное имелли ввиду древовидную структуру с отступами ;)

Я замечу, да и нефиг создавать ресурсы полностью забитые лишними пробелами, временами попадаются вообще жуткие странички, где эта самая разметка с ихними пробелами заанимает порядка 1/4 от объема всего хтмла. Куда это годится? Зачем.

Как по мне так гораздо важнее создать грамотную верстку - сэкономить трафика можно гораздо больше чем считать пробелы ;) (+ gzip)
Или Вам без разметки сложновато мыслить?
Очень сложно, особенно в больших и сложных структурах.
А вы не знали что примитивный способ запутывания скрипта - пустить весь скрипт в одну строчку? ;)

Представьте, что Вам нужно просмотреть структуру XML документа, посчитать количество элементов, глубину вхождения итд. а у Вас все в одну строчку... Как будете определять? ;).

Vampire
02-09-2006, 15:55
Вы вначале говорили о входном XML которые являлись rss новостями. Причем здесь html?
А при том, что в хмле тоже имеются свои теги. Еще раз спрашиваю: Зачем разметка если каждый тег там с новой строки начинается?
Представьте, что Вам нужно просмотреть структуру XML документа, посчитать количество элементов, глубину вхождения итд. а у Вас все в одну строчку... Как будете определять?
Открою это дело в хомесайте, а там уже это дело прошерстить прошще паренной репы. :)

benya
02-09-2006, 16:49
Vampire,

Еще раз спрашиваю: Зачем разметка если каждый тег там с новой строки начинается?

Еще раз отвечаю - Если каждый тег начинается с новой строки - то это и есть уже разметка (без отступов) ;) А с отступами делается для того что бы отобразить структуру в виде дерева. Что позволяет быстро оценить где родительские элементы, а где дочерние, вобщем что во что вложено. Для парсера это не важно, это важно для повышения читаемости для программиста.

Vampire
02-09-2006, 21:21
ОК. Я все понял. :) Так как мне особо древовидная структура не нужна, то буду делать без лишних пробелов.
На сколько я понимаю программам читающим рсс или плагинам к браузерам, тоже эти пробелы не нужны, т.е. на их наличие они внимание не обращают?

benya
03-09-2006, 19:16
Vampire,

На сколько я понимаю программам читающим рсс или плагинам к браузерам, тоже эти пробелы не нужны, т.е. на их наличие они внимание не обращают?

Что бы развеять все сомнения можно просто взять да и проверить.

E-mail
04-09-2006, 23:42
На сколько я понимаю программам читающим рсс или плагинам к браузерам, тоже эти пробелы не нужны, т.е. на их наличие они внимание не обращают?
еще как обращают ( !! ), есть такие браузеры, которые далеко посылают за такую верстку, примите себе за правило не использовать пробелы для разметки используйте таб или вообще не размечайте.

Модераториал: еще раз мат и в бан.
Также, потрудитесь указывать факты, голословие ни к чему хорошему обычно не приводит. Заранее спасибо.




© OSzone.net 2001-2012