Имя пользователя:
Пароль:
 | Правила  

Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Программирование и базы данных » Прочие БД - Василиса, Баба-Яга и тэги

Ответить
Настройки темы
Прочие БД - Василиса, Баба-Яга и тэги

Новый участник


Сообщения: 2
Благодарности: 0

Профиль | Отправить PM | Цитировать


Изменения
Автор: Тупая блондинка
Дата: 28-07-2010
Уважаемые господа хакеры,

Пожалуйста, дайте тупой блондинке совет, как поступить: она не может справиться с заданием.

А задание таково.

У начальства есть много текстов из разных источников, очень разных по содержанию, стилю, тематике и длине. Их больше четырёх или даже пяти тысяч.

Все эти тексты надо снабдить метками и рассортировать. На каждом тексте будет пять-шесть меток, характеризующих его по разным параметрам: например, авторство, тематика, происхождение, и т.п. Метки ставить придётся вручную, тут уж ничего не поделаешь.

Но вот как потом их сортировать?

Задание -- вроде как в русской народной сказке, где Баба-Яга дала Василисе мешок с пшеном, овсом и ячменем, и велела разложить по трем мешкам: пшено отдельно, овёс отдельно...

Мне тоже надо сделать так, чтобы высокое начальство смогло нажать на метку, например, «Швеция» - и получить подряд все тексты с меткой «швеция». Кликнуть на метку «Климат» - получить все тексты с тэгом «климат». Кликнуть на «Вася Пупкин» - и получить сразу всё с пометкой «вас-пуп», независимо от того, автор ли текста этот Вася, или он его редактировал, или он его перевел и принёс в бюро, или там просто о нём рассказывается.

Шеф говорит, что сделать такое проще простого, и что с этим может справиться любой болван, который способен включить компьютер, поэтому, мол, даже такой блондинке как я это должно быть по силам.

Но я спросила у знатоков - они говорят, для этого надо установить SQL. Ладно. Смотрю в описание SQL. Ого! Нет, я бы не поленилась, ...но жаль терять столько времени на изучение того, что никогда в жизни не понадобится - все эти многоплановые и многофункциональные базы данных!

А нужно-то всего: простая возможность делать выборку по одной-единственной метке. Не надо сложной формулы многослойной фильтрации (например, задавать четыре тэга, «Европа» + «секс» + «Вася» + «1988», и получить выборку текстов, где присутствуют все четыре метки -- по географии, по тематике, по авторству и по году). Нет! Не надо cross-reference! Не надо подвижной базы данных! Не надо тройного и даже двойного отбора! Достаточно, чтоб можно было сортировать по одному тэгу - и всё. Как Василисе с её тремя мешками с тэгами «пше», «овё» и «ячм»! Или как в Живом Журнале, где у каждого дневника есть список тэгов, и можно одним кликом мышки вывести на экран все тексты, отмеченные любым из этих тэгов.

Наверно же существует какая-то функция в «Ворде» или какая-нибудь программа, которая справилась бы с этим казалось бы довольно простым заданием?

Посоветуйте, пожалуйста.



Простите, что получилось такое длинное и занудное описание. Но когда я пыталась изложить проблему кратко - иногда просто не понимали, что требуется: ведь есть же, мол, в "Ворде" удобная функция "поиск", - чего ей еще надо?

Отправлено: 22:57, 27-07-2010

 

Аватара для Delirium

Ветеран


Сообщения: 5624
Благодарности: 936

Профиль | Отправить PM | Цитировать


Тупая блондинка, а тексты в каком виде? Необходимо выводить список документов по тегам или же содержимое?
Теоретически есть одна платная программа моего друга (немного рекламы ), которая позволяет делать именно то, что вам необходимо плюс куча всего другого очень удобного. Если есть желание, напишите в PM, отпишу что и как.

А вообще можно написать небольшое приложение, которое будет сканировать указанные папки с документами, выводить их список и присваивать теги....

-------

Пройденные курсы:
[Microsoft №10174 Sharepoint], [SharePoint]
Мои проекты:[CheckAdmins], [NetSend7], [System Uptime], [Remote RAdmin LogViewer],[Netdom GDI], [Holidays - напоминалка о днях рождения]

А я офис-гуру :)


Отправлено: 02:47, 28-07-2010 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Новый участник


Сообщения: 2
Благодарности: 0

Профиль | Отправить PM | Цитировать


Цитата Delirium:
тексты в каком виде? Необходимо выводить список документов по тегам или же содержимое? »
Выводить надо всё содержимое. Это не столько документы целиком, сколько кусочки текста. Все они сейчас в разных файлах, но можно перебросить все в один огромный файл. Объём каждого - от 20 до 20 000 символов, но в основном - около тысячи (включая пробелы). Сканировать ничего не надо, все тэги мне придётся присваивать им вручную: не по наличию слова в тексте, а по смыслу, из-за специфики содержания. У каждого текстового элемента будет по 3 - 6 тэгов, реже один-два, из 50 - 100 возможных.

Последний раз редактировалось Тупая блондинка, 28-07-2010 в 04:24.


Отправлено: 03:39, 28-07-2010 | #3



Компьютерный форум OSzone.net » Программирование, базы данных и автоматизация действий » Программирование и базы данных » Прочие БД - Василиса, Баба-Яга и тэги

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
[решено] Русские тэги mp3-файлов в AmaroK Coutty Программное обеспечение Linux и FreeBSD 1 18-10-2007 19:32
id3 тэги из mp3 средствами php Guest Вебмастеру 1 25-06-2004 02:07
ТЭГИ Guest Хочу все знать 3 10-02-2004 13:11




 
Переход