PDA

Показать полную графическую версию : Поисковик Google


Interrupt
26-03-2003, 12:11
Кто знает?
принцип создания, движок, технологию,
решения(мат., техн.)

Alexey Kirdin
03-04-2003, 20:39
Хм. Такая интересная тема, а никто не обсуждает :-)) Что ж такое?

Автор поста уже потерял к ней интерес? Если нет, то советую недавний топик из форума "Дизайн" сайта RSDN под названием "Построение индекса(словаря)". Ссылку не даю, т.к. не знаю, как тут к этому относятся.

Interrupt
04-04-2003, 13:16
Да не потерял.... всегда интересно.
Я незнаю про какой ты форум говоришь. Кинь УРЛ на мыло.

А вот относительно движка....  , что так и никто не писал функции поиска, даже простые, ни у кого нет идей?

mzd
04-04-2003, 15:20
По-моему, на www.delphi.mastak.ru проскакивала инфа об ентой хрени. А может и не об этой :)

Alexey Kirdin
04-04-2003, 16:37
Interrupt
Я не знаю, про какой ты форум говоришь.
Это зря. :-)

http://www.rsdn.ru/forum/Default.aspx?group=design - сам форум

http://www.rsdn.ru/Forum/?mid=198769 - про этот топик я говорил.

А вот относительно движка....  , что так и никто не писал функции поиска, даже простые, ни у кого нет идей?

Я писал. :-) И идеи есть. Только искалка и большой распределенный расширяемый поисковик - это 2 большие разницы. Чтоб написать что-то большое, надо много знать и большое и толстое финансирование иметь. И результаты этого труда опубликовываются потом только за бааальщие деньги.

Тебе, я так понял, именно большие объемы надо обрабатывать. а на мелкие (это фигня). В Инете полно поисковиков в исходниках средней паршивости. Периодически на searchengines.ru Илья Сегалович и компания дают все новые и новые ссылки. Обычно, это поделки студентов северной части американского континента. То, что они поделывают, для больших объемов, или, для использования без серьезной до/переработки, использовать обычно нельзя. То, что можно, используется, и держится в секрете, т.е., исходники не открываются.

2 последние большие разработки университетов - Google и Teoma. Google в прошлом году заработал 100 млн., и, думаю, в Open Source их там никогда не потянет уже :-)))

И потом, надо помнить еще, что поисковик - это немеряный набор задач, начинающийся с банального хранилища, поддержки форматов и протоколов, и заканчивающийся некислой математикой с большим привлечением статистики.  Трудное это дело, короче, хороший поисковик поднять.

mzd
04-04-2003, 18:23
Есть такая наработка, на www.nnm.ru пару недель назад валялась. На Делфях налабали типы. Как я понял, она соединяется с "гуглой" и передает ей запрос на поиск инфы. Один косяк - великий и могучий она чегой-то невзлюбила. А насчет проги: ИМХО, самое простое - посмотреть, как google откликается на запрос. Собственно, вот и все. Постороить такой запрос не составит труда.

Исправлено: mzd, 18:25 4-04-2003

Merlin de Kamelot
10-05-2003, 08:52
Движок есть, вот он:

http://search.mgoso.ru

Или вообще в поисковике Google наберите:
Search: mnogosearch

ivank
10-05-2003, 11:32
Merlin de Kamelot
Это хорошее решение для поиска внутри сайта, не более.

noname00.pas
11-05-2003, 09:30
Вот ежели бы кто сказал хотя бы принцип, по которому странички категоризируются - мы бы тут же алгоритм придумали ;-)

Можно же по разному это делать...

Vadikan
11-05-2003, 11:41
Interruptпринцип создания, движок, технологию
http://www.computerra.ru/xterra/homo/25034/print.html Там читаем Google запатентовал свою поисковую технологию (№ 6 529 903), а точнее — частный случай применения технологии ранжирования страниц PageRank Осталось найти патент и вникнуть в детали ;)

Еще про Google http://www.computerra.ru/offline/2002/441/17661/print.html
Почти по теме http://www.computerra.ru/offline/2002/467/21440/print.html




© OSzone.net 2001-2012