Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Программирование и базы данных (http://forum.oszone.net/forumdisplay.php?f=21)
-   -   Поисковик Google (http://forum.oszone.net/showthread.php?t=30513)

Interrupt 26-03-2003 12:11 208919

Кто знает?
принцип создания, движок, технологию,
решения(мат., техн.)

Alexey Kirdin 03-04-2003 20:39 208920

Хм. Такая интересная тема, а никто не обсуждает :-)) Что ж такое?

Автор поста уже потерял к ней интерес? Если нет, то советую недавний топик из форума "Дизайн" сайта RSDN под названием "Построение индекса(словаря)". Ссылку не даю, т.к. не знаю, как тут к этому относятся.

Interrupt 04-04-2003 13:16 208921

Да не потерял.... всегда интересно.
Я незнаю про какой ты форум говоришь. Кинь УРЛ на мыло.

А вот относительно движка....  , что так и никто не писал функции поиска, даже простые, ни у кого нет идей?

mzd 04-04-2003 15:20 208922

По-моему, на www.delphi.mastak.ru проскакивала инфа об ентой хрени. А может и не об этой :)

Alexey Kirdin 04-04-2003 16:37 208923

Interrupt
Цитата:

Я не знаю, про какой ты форум говоришь.
Это зря. :-)

http://www.rsdn.ru/forum/Default.aspx?group=design - сам форум

http://www.rsdn.ru/Forum/?mid=198769 - про этот топик я говорил.

Цитата:

А вот относительно движка....  , что так и никто не писал функции поиска, даже простые, ни у кого нет идей?
Я писал. :-) И идеи есть. Только искалка и большой распределенный расширяемый поисковик - это 2 большие разницы. Чтоб написать что-то большое, надо много знать и большое и толстое финансирование иметь. И результаты этого труда опубликовываются потом только за бааальщие деньги.

Тебе, я так понял, именно большие объемы надо обрабатывать. а на мелкие (это фигня). В Инете полно поисковиков в исходниках средней паршивости. Периодически на searchengines.ru Илья Сегалович и компания дают все новые и новые ссылки. Обычно, это поделки студентов северной части американского континента. То, что они поделывают, для больших объемов, или, для использования без серьезной до/переработки, использовать обычно нельзя. То, что можно, используется, и держится в секрете, т.е., исходники не открываются.

2 последние большие разработки университетов - Google и Teoma. Google в прошлом году заработал 100 млн., и, думаю, в Open Source их там никогда не потянет уже :-)))

И потом, надо помнить еще, что поисковик - это немеряный набор задач, начинающийся с банального хранилища, поддержки форматов и протоколов, и заканчивающийся некислой математикой с большим привлечением статистики.  Трудное это дело, короче, хороший поисковик поднять.

mzd 04-04-2003 18:23 208924

Есть такая наработка, на www.nnm.ru пару недель назад валялась. На Делфях налабали типы. Как я понял, она соединяется с "гуглой" и передает ей запрос на поиск инфы. Один косяк - великий и могучий она чегой-то невзлюбила. А насчет проги: ИМХО, самое простое - посмотреть, как google откликается на запрос. Собственно, вот и все. Постороить такой запрос не составит труда.

[s]Исправлено: mzd, 18:25 4-04-2003[/s]

Merlin de Kamelot 10-05-2003 08:52 208925

Движок есть, вот он:

Цитата:

http://search.mgoso.ru
Или вообще в поисковике Google наберите:
Search: mnogosearch

ivank 10-05-2003 11:32 208926

Merlin de Kamelot
Это хорошее решение для поиска внутри сайта, не более.

noname00.pas 11-05-2003 09:30 208927

Вот ежели бы кто сказал хотя бы принцип, по которому странички категоризируются - мы бы тут же алгоритм придумали ;-)

Можно же по разному это делать...

Vadikan 11-05-2003 11:41 208928

Interrupt
Цитата:

принцип создания, движок, технологию
http://www.computerra.ru/xterra/homo/25034/print.html Там читаем
Цитата:

Google запатентовал свою поисковую технологию (№ 6 529 903), а точнее — частный случай применения технологии ранжирования страниц PageRank
Осталось найти патент и вникнуть в детали ;)

Еще про Google http://www.computerra.ru/offline/200...661/print.html
Почти по теме http://www.computerra.ru/offline/200...440/print.html


Время: 11:47.

Время: 11:47.
© OSzone.net 2001-