Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Вебмастеру (http://forum.oszone.net/forumdisplay.php?f=22)
-   -   Яндекс новости - частота обновления? (http://forum.oszone.net/showthread.php?t=70557)

Vampire 30-08-2006 13:10 478495

Яндекс новости - частота обновления?
 
У меня такой вопрос: практически написал рсс парсер для отображения новостей с яндекс.новости на своем сайте, теперь вот осталось выяснить с какой частотой эти новости на яндексе обновляются (это для того-чтобы постоянно при загрузке страницы с новостями на моем сайте к яндексу не стучаться, делаю копию рсс ленты на своем сайте). случаем никто такой статистики не имеет? Буду очень благодэарен.

И еще вопросик: как лучше ленту обозвать news.rss или news.xml?

E-mail 30-08-2006 13:13 478496

Vampire

/rss/news.xml

:)

Vampire 30-08-2006 13:22 478500

Спасиб,
Только меня больше интересует первый вопрос - очень нужен на него ответ

E-mail 30-08-2006 13:35 478511

Vampire а что яндекс по этому поводу говорит?
по идее новостная лента обновляется по мере поступления новой новости, а кто может предсказать с какой частотой они будут появлятся?

Vampire 30-08-2006 13:50 478522

Ух нашел, вот:
Цитата:

Периодичность обновления
Максимальных или минимальных ограничений на количество сообщений нет, однако издание должно обновляться с определенной периодичностью, которая должна быть заявлена в информации об издании. Индексация транслируемых изданием сообщений осуществляется Яндексом каждые 10 минут.
Каждые 10 минут в автоматическом режиме, глубоко они эту инфу зарыли в "Информация для партнеров" (http://news.yandex.ru/cooperation.html).
Я же не их партнер и туда само собой не заглядывал, а оказывается надо было.

Ладно всем спасибо за помощь

E-mail 30-08-2006 13:52 478523

Vampire
Цитата:

Каждые 10 минут в автоматическом режиме
это не дает гарантии на то что информация поменялась

Vampire 30-08-2006 14:42 478557

Цитата:

это не дает гарантии на то что информация поменялась
Да не дает.
У меня принцип такой, зашел посетитель на главную страницу сайта или на новостную страницу, пошла работа скрипта по выводу новостей. Этот скрипт стучится к нужной рубрике новостей яндекса, переделывает ленту и сохраняет эту ленту на сервере. Далее уже вывод на сайт новостей идет с ленты расположенной на моем сайте...
Представь, если на сайт зайдут одновременно или через несколько секунд, например 10 человек. Это мой скрипт будет до яндекса стучатся 10 раз (при этом он 10 раз будет создавать мою ленту с одним и тем-же содержимым), не хорошо получится. Для этого я ставлю задержку на 10 минут, как у яндекса. Скрипт сравнивает текущее время и время последнего обновления моей ленты. И если прошло более 10 минут с последнего обновления, то производится обработка новости с яндекса и создается моя лента, если нет, то новости выводятся из моей ленты. Это еще спасает от того, вдруг до яндекса нельзя будет достучаться :) - выведутся нновости из моей ленты, хотя и немного устаревшие.

Такой вот принцип, надеюсь не особо сумбурно написал :)

E-mail 30-08-2006 15:12 478575

Vampire,
зачем все усложнять? и зачем так часто беспокоить яндекс? каждые 10 мин этоже сдохнуть можно!
А вы не пробЫвали яндексу посылать заголовок if-modified-since перед скачиванием содержимого?

Vampire 30-08-2006 22:44 478772

Так этот яндекс сам каждые 10 минут по всем сайтам , на которых новости собирает, проходит и меняет свою ленту и не факт что новость какая-то добавилась, а дата файла все равно меняется.

У меня еще вопросик: обязательно в xml файле выстраивать древовидную структуру или это только для наглядности и можно каждую строку начинать без этих дополнительных пробелов перед ней?

benya 31-08-2006 20:11 479222

Vampire,
Можно не выставлять (тяжело будет для прочтения, но если открыть XML експлорером, то он сам выставит отступы)

Vampire 31-08-2006 21:20 479238

А зачем это дело эксплорером открывать, по моему в нем хмл читать не совсем удобно, он же всю разметку полностью с тегами выводит, проще ленты открывать программами для чтения новостных лент (у меня плагин в Макстоне для этого дела стоит) или я не прав?

А этих начальных пробелов на целый килобайт можно насобирать. Трафик пользователей нужно экономить. :)

benya 01-09-2006 15:21 479559

Vampire
Чушь! На килобайт больше или меньше этого никто не заметит даже через программу чтения новостей! А если вы собираетесь размещать rss новости у себя на сайте то к трафику пользователя XML вообще не относится.

XML читать и не нужно я говорил о чтении его структуры для веб-мастера.

Vampire 01-09-2006 18:12 479654

Я замечу, да и нефиг создавать ресурсы полностью забитые лишними пробелами, временами попадаются вообще жуткие странички, где эта самая разметка с ихними пробелами заанимает порядка 1/4 от объема всего хтмла. Куда это годится? Зачем.

А какая нафиг разница, читать xml с разметкой или без нее. Если все равно каждый тег начинается с новой строки. Или Вам без разметки сложновато мыслить? Для меня это привычное дело, хоть весь код в одну строку пусти.

Prisoner 02-09-2006 10:30 479834

Господа, не скатывайтесь, пожалуйста, во флейм, в оффтоп вы уже скатились.

benya 02-09-2006 15:35 479924

Vampire,
Вы вначале говорили о входном XML которые являлись rss новостями. Причем здесь html? А вообще не хотите использовать пробелы - можно использовать табуляцию, которая занимает один символ.
Цитата:

А какая нафиг разница, читать xml с разметкой или без нее. Если все равно каждый тег начинается с новой строки.
Это разве не разметка? :tease: Вы наверное имелли ввиду древовидную структуру с отступами ;)
Цитата:

Я замечу, да и нефиг создавать ресурсы полностью забитые лишними пробелами, временами попадаются вообще жуткие странички, где эта самая разметка с ихними пробелами заанимает порядка 1/4 от объема всего хтмла. Куда это годится? Зачем.
Как по мне так гораздо важнее создать грамотную верстку - сэкономить трафика можно гораздо больше чем считать пробелы ;) (+ gzip)
Цитата:

Или Вам без разметки сложновато мыслить?
Очень сложно, особенно в больших и сложных структурах.
А вы не знали что примитивный способ запутывания скрипта - пустить весь скрипт в одну строчку? ;)

Представьте, что Вам нужно просмотреть структуру XML документа, посчитать количество элементов, глубину вхождения итд. а у Вас все в одну строчку... Как будете определять? ;).

Vampire 02-09-2006 15:55 479932

Цитата:

Вы вначале говорили о входном XML которые являлись rss новостями. Причем здесь html?
А при том, что в хмле тоже имеются свои теги. Еще раз спрашиваю: Зачем разметка если каждый тег там с новой строки начинается?
Цитата:

Представьте, что Вам нужно просмотреть структуру XML документа, посчитать количество элементов, глубину вхождения итд. а у Вас все в одну строчку... Как будете определять?
Открою это дело в хомесайте, а там уже это дело прошерстить прошще паренной репы. :)

benya 02-09-2006 16:49 479954

Vampire,
Цитата:

Еще раз спрашиваю: Зачем разметка если каждый тег там с новой строки начинается?
Еще раз отвечаю - Если каждый тег начинается с новой строки - то это и есть уже разметка (без отступов) ;) А с отступами делается для того что бы отобразить структуру в виде дерева. Что позволяет быстро оценить где родительские элементы, а где дочерние, вобщем что во что вложено. Для парсера это не важно, это важно для повышения читаемости для программиста.

Vampire 02-09-2006 21:21 479996

ОК. Я все понял. :) Так как мне особо древовидная структура не нужна, то буду делать без лишних пробелов.
На сколько я понимаю программам читающим рсс или плагинам к браузерам, тоже эти пробелы не нужны, т.е. на их наличие они внимание не обращают?

benya 03-09-2006 19:16 480244

Vampire,
Цитата:

На сколько я понимаю программам читающим рсс или плагинам к браузерам, тоже эти пробелы не нужны, т.е. на их наличие они внимание не обращают?
Что бы развеять все сомнения можно просто взять да и проверить.

E-mail 04-09-2006 23:42 480917

Цитата:

На сколько я понимаю программам читающим рсс или плагинам к браузерам, тоже эти пробелы не нужны, т.е. на их наличие они внимание не обращают?
еще как обращают ( !! ), есть такие браузеры, которые далеко посылают за такую верстку, примите себе за правило не использовать пробелы для разметки используйте таб или вообще не размечайте.

Модераториал: еще раз мат и в бан.
Также, потрудитесь указывать факты, голословие ни к чему хорошему обычно не приводит. Заранее спасибо.

Prisoner 05-09-2006 00:28 480935

Vampire, если замечание E-mail окажется подтверждено фактами и "броузеры" не окажутся некими совершенно фантастическими вещами, то решать придется Вам - я впервые слышу о пользе табов. Их нестандартизированнная (в пробелах :)) длина - "наша беда" как и соседство с галактикой Кин-Дза-Дза. Откройте любой пакет PEAR и поглядите своими глазами. Полагаю такое авторитетное "собрание сочинений" со своими стандартами выработанными временем и опытом многих людей будет не малым свидетельством в пользу разметки. Кстати, там же, в помощи по проекту, есть и очень хороший "стандарт" (потому как относится лишь к PEAR) по разметке, комментированию и вообще оформлению кода.

E-mail 05-09-2006 00:53 480941

Prisoner,
Цитата:

еще раз мат и в бан
я знал что вы ждали момента:)

Цитата:

потрудитесь указывать факты
а теперь к фактам:

мат это когда предлог выглядет как указание а существительное - описание указанного раздела, в случае отсутствия одного из перечисленных объектов, компиляция не произойдет, так что ваше рвение не оправданно, потрудитесь исправить обратно контент и при цитировании ставте копирайт:)

П.С.

кстати, люди-пробельщики - это те кто используют пробелы в коде:)

Prisoner 05-09-2006 10:55 481076

Модераториал: E-mail, бан на трое суток за развод флейма с модератором. Охладите свой пыл, лично я ко всем отношусь нейтрально, это Вы с чего-то решили со мной воевать. Все вопросы личного характера - в ЛС.


Время: 02:33.

Время: 02:33.
© OSzone.net 2001-