Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Компьютеры + Интернет » Вебмастеру » поиск по сайту (статические страницы)

Ответить
Настройки темы
поиск по сайту (статические страницы)
mar mar вне форума

Аватара для mar

just mar


Moderator


Сообщения: 3905
Благодарности: 164

Профиль | Отправить PM | Цитировать


Изменения
Автор: mar
Дата: 12-01-2005
Описание: (цифирь пунктам добавила)
собственно, subj
имеется сайт. на нем куча статей (статика). Народ просит поиск, может быть придется заняться.
варианты:
1)- переводим статику в php+база, пишем движек для добавления нового (ну, и чтения старого, естественно (может быть не пойдет по многим причинам, одна из которых - не хочу лишать куска хлеба тамошнего webmaster-а )
2)- делаем индексацию и скрипт переиндексации. Webmaster, кдадя очередную статью запускает скрипт и идет переиндексация базы.
2-1- вопрос: как лучше хранить индексы? в текстовом файле-словаре, или в БД?
2-2- если в бд, то в принципе возможно не переиндексация, а доиндексация. Идеи?
3)- делаем просто перевод текста статей в бд и используем полнотекстовый поиск mysql (кто что хорошего-плохого мог бы о нем сказать?) Делаем скрипт, при запуске которого идет добавление текста новой статьи в БД.

Кому какие идеи нравятся/не нравятся? Какие еще идеи?
Спасибо

Отправлено: 00:42, 12-01-2005

 

Ночной странник


Contributor


Сообщения: 4050
Благодарности: 83

Профиль | Сайт | Отправить PM | Цитировать


vadimiron
да можно пользоваться гуглем, но для комерческого сайта это не очень хорошо....
есть конечно вариант платного использования гугля, но я не думаю что это подходящий вариант...

mar
главное чтобы поиск работал не так как на IXBT , а то там второй запрос поиска кладет базу нафиг...

-------
можно практически все, но просто мы это еще не знаем.
главный враг програмиста это копипастинг
За хорошее сообщение не забываем нажимать ссылочку "Полезное сообщение"!


Отправлено: 15:20, 12-01-2005 | #11



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.

mar mar вне форума Автор темы

Аватара для mar

just mar


Moderator


Сообщения: 3905
Благодарности: 164

Профиль | Отправить PM | Цитировать


vadimiron
тот же гугль на втором шаге поиска вынесет на свои страницы. Помнишь, как в конце жизни старого движка осзона было? Что не есть гут
Vlad Drakula
ну я пока только прикидываю. Тот же mnogosearch на том же nodex-е стоит, но, насколько я понимаю, один на всех. Попросила webmaster-а сайта списаться с техподдержкой и узнать, как к нему обращаться
А полнотекстовый поиск на mysql интересен, но боюсь, не тяжел ли в обращении... (никогда с ним не работала, так что своего +/- опыта нет)

Отправлено: 23:33, 12-01-2005 | #12


Ночной странник


Contributor


Сообщения: 4050
Благодарности: 83

Профиль | Сайт | Отправить PM | Цитировать


mar
в принципе там ничего сложного вроде нет...
кстати раз тебе больше нравится постгри, так может его использовать будешь а не MySQL ?
(доплата коло 0,5$ в месяц)

тяжелость выясняется на предварительных тестах....

mar
всекогда то в первый раз!!!

-------
можно практически все, но просто мы это еще не знаем.
главный враг програмиста это копипастинг
За хорошее сообщение не забываем нажимать ссылочку "Полезное сообщение"!


Отправлено: 23:44, 12-01-2005 | #13

mar mar вне форума Автор темы

Аватара для mar

just mar


Moderator


Сообщения: 3905
Благодарности: 164

Профиль | Отправить PM | Цитировать


Vlad Drakula
тяжесть в обращении - имелось в виду не написание запросов, а загрузка сервака
по поводу постгреса, - у меня там на mysql (делалось под предыдущего хостера) крутится форум с поиском, страницы юзеров (клуб при форуме), записные книжки юзеров (при том же форуме) и некоторый задел для идей, которые пока озвучены, но не заказаны. Миграция на постгрес на боевом серваке с достаточно большой посещаемостью и к тому же коммерческими обязательствами, - мне, пожалуй, при всем любви к нему (постгресу то бишь ) - не улыбается

Отправлено: 23:57, 12-01-2005 | #14


Ночной странник


Contributor


Сообщения: 4050
Благодарности: 83

Профиль | Сайт | Отправить PM | Цитировать


mar
а зачем мигрировать... можно использовать и то и другое... т.е. иметь и MySQL И постгрее....

mar
я сторонник тестирования...
т.е. есть идея, я ее воплощаю в наброске... произвожу тестирование... понимаю плоха она или хороша...
(потом пишу тест под нагрузкой...) если производительность меня устроила то пиши вчистую... если нет то исправляю и опят начинаю тестировать...

-------
можно практически все, но просто мы это еще не знаем.
главный враг програмиста это копипастинг
За хорошее сообщение не забываем нажимать ссылочку "Полезное сообщение"!


Отправлено: 00:54, 13-01-2005 | #15

mar mar вне форума Автор темы

Аватара для mar

just mar


Moderator


Сообщения: 3905
Благодарности: 164

Профиль | Отправить PM | Цитировать


ну, быстрее все-таки все вместе хранить (скажем, чтобы тот же поиск и по сайту и по форуму разом шел)
Может, я когда-нибудь все на постгрес там и переделаю, но только после того, как у них будет выделенный сервак (а у меня - время ). Хочется, если уж использовать возможности нормальной СУБД, то и тюнинг там делать такой, какой захочется


Отправлено: 01:04, 13-01-2005 | #16

mar mar вне форума Автор темы

Аватара для mar

just mar


Moderator


Сообщения: 3905
Благодарности: 164

Профиль | Отправить PM | Цитировать


значит так
хотела написать - "не прошло и пол года", но пол года с тех пор уже прошло. Выдался свободный день, сделала таблицу с индексом по fulltext, скрипт, загоняющий в нее данные статических страниц и поиск к этому делу. Запрос элементарный:
Код: Выделить весь код
SELECT url, title, MATCH (text) AGAINST ('.....то, что запросили...')  AS relevant 
                                FROM full_text
                                WHERE MATCH (text) AGAINST ('.....то, что запросили...')
Двойной запрос MATCH (text) AGAINST, судя по dev.mysql.com, выполняется 1 раз, но зато выстраивает ответ по релевантности, отсекая 50% границу. Короткие слова, слова частовстречающиеся не индексируются. Если слово встречается на всех страницах многократно, оно игнорируется. Работает, на мой взгляд весьма быстро (хотя объем относительно неболшой - весь текст уложился в 11-12 Мб): запрос отыгывает за <= 1 мсек. В общем, мне нравится
Посмотреть настройки MySQL, касаяющиеся полнотекстового поиска можно:
Код: Выделить весь код
 SHOW VARIABLES like '%ft%';
Статьи:
http://dev.mysql.com/doc/refman/4.0/...xt-search.html - документация по 4.0 на русском
http://dev.mysql.com/doc/refman/4.1/...xt-search.html - документация по 4.0 на английском
http://xpoint.ru/know-how/PHP/GotovyieResheniya/Poisk?1 - "Поиск по сайту" - пример скрипта-индексатора сайта

Отправлено: 02:11, 14-11-2005 | #17


Ночной странник


Contributor


Сообщения: 4050
Благодарности: 83

Профиль | Сайт | Отправить PM | Цитировать


mar
я пробовал fulltext, в каталоге программ он вел себя не лучьшим образом, по этому мне пришлось писать свой собственный поиск + свою собственную индексацию.

-------
можно практически все, но просто мы это еще не знаем.
главный враг програмиста это копипастинг
За хорошее сообщение не забываем нажимать ссылочку "Полезное сообщение"!


Отправлено: 12:37, 14-11-2005 | #18

mar mar вне форума Автор темы

Аватара для mar

just mar


Moderator


Сообщения: 3905
Благодарности: 164

Профиль | Отправить PM | Цитировать


Vlad Drakula
ну, индексатор и поиск мне тоже писать пришлось Я просто показала запрос, покрывающий бОльшую часть потребностей посетителей сайта. В принципе мне приходилось писать и разные поисковые системы, но в данном случае fulltext мне действительно понравился. (Посмотрим, правда, что скажет тестирование) Вопрос к тебе - можешь поподробней написать, что именно тебя не устроило? Если можно с примерами. (Может, есть какие-то незамеченные мной грабли)

Отправлено: 14:38, 14-11-2005 | #19


Ночной странник


Contributor


Сообщения: 4050
Благодарности: 83

Профиль | Сайт | Отправить PM | Цитировать


mar
ну... мне он полностью не подошол!

fulltext ищет только слова целиком, а мне нужно было чтобы и части слов искал.

-------
можно практически все, но просто мы это еще не знаем.
главный враг програмиста это копипастинг
За хорошее сообщение не забываем нажимать ссылочку "Полезное сообщение"!


Отправлено: 14:43, 14-11-2005 | #20



Компьютерный форум OSzone.net » Компьютеры + Интернет » Вебмастеру » поиск по сайту (статические страницы)

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
поиск по сайту на PHP Vlad Drakula Вебмастеру 5 02-04-2008 11:30
Как лучше попадать в расширенный поиск по сайту Greyman О сайте и форуме 4 30-09-2005 13:32
Как организовать поиск по сайту Vampire Вебмастеру 4 30-01-2004 01:52
Скрипт php - поиск по сайту tradeukraine Вебмастеру 10 19-07-2003 08:50
Поиск по сайту lehha Вебмастеру 10 25-12-2002 07:13




 
Переход