Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] Распознование текста

Ответить
Настройки темы
[решено] Распознование текста
nautonnier


Сообщения: n/a

Профиль | Цитировать


Люди! Помогите, пожалуйста, далеко не молодому человеку…
Проблема с распознаванием текста на русском.
WIN XP, OFFICE XP- лицензионные, English.
Lingvo 8.0-лицензионная, Proofing Tools 2000 - скаченный, но работает, т.е. проверяет ошибки на Русском….
Office Document Imaging не распознает русский текст, т.к. в языках распознавания нет Russian.
Может быть, можно как-то добавить Русский или из Lingvo или из Proofing Tools, а может еще откуда?
Подскажите, как заставить распознавать русский в Office Document Imaging.
Заранее благодарю,
Сергей.

Отправлено: 13:39, 22-10-2003

 
MKN MKN вне форума

Ветеран


Сообщения: 2381
Благодарности: 565

Профиль | Отправить PM | Цитировать


Добавлю такой вопрос в тему - а что есть приличного в мире ПО для распознавания рукописных текстов ?
FineReader никуда не годен... Теоретически его можно научить , натравливая на разноманерные буквы-символы и создавая из них "базу", но это мука адская. Недавно мучился сканируя одно письмо. Так там только у буквы "а" получилось 36 вариантов написания... Ужас.

Отправлено: 15:13, 08-09-2011 | #41



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Аватара для lunar

Старожил


Сообщения: 435
Благодарности: 15

Профиль | Отправить PM | Цитировать


Цитата MKN:
а что есть приличного в мире ПО для распознавания рукописных текстов ? »
А ведь действительно если платить ,то уж за такой продукт денег не жалко...

Последний раз редактировалось lunar, 09-09-2011 в 08:04.


Отправлено: 20:58, 08-09-2011 | #42


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


MKN, я делал именно FineReader'ом (сомневаюсь, что для рукописного русского текста будет ещё что-то внятное). Научить его распознавать рукописный текст можно, но:

* почерк должен быть приличным и однородным;
* учить его надо долго и на достаточно большом объёме текста.

Всё равно работа получается жутко занудная. Так что, смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком

Отправлено: 22:00, 08-09-2011 | #43


Ветеран


Сообщения: 3806
Благодарности: 824

Профиль | Отправить PM | Цитировать


Forest Gump, одну-две странички набрать быстрее. Для разового распознавания можно воспользоваться онлайн версией FineReader'а. Раньше давал пробные первые 40 или 50 страниц распознать бесплатно, как сейчас - не знаю.
Это сообщение посчитали полезным следующие участники:

Отправлено: 09:12, 09-09-2011 | #44

MKN MKN вне форума

Ветеран


Сообщения: 2381
Благодарности: 565

Профиль | Отправить PM | Цитировать


Цитата Iska:
учить его надо долго и на достаточно большом объёме текста »
К сожалению именно так... И в этой связи у меня есть некоторые соображения, которые я как то уже высказывал, но не представляю как претворить в жизнь... Точнее это могли бы сделать программисты, если бы захотели...

А мысль такова : Одна и та же рукописная буква в тексте, в зависимости от почерка и др. "факторов написания", отличается от "собратьев", как правило, геметрическими вариациями - наклоном, размером и пр., которым нет числа... Собственно в этих вариациях написания и состоит мука обучения.

А что, если взять за основу для обучения, наиболее типичный для данного почерка, вариант буквы, и сделать из него базу из множества "морфинг-вариантов". Т.е. создать базу из множества геометрических разновидностей, выбранной буквы.
Десяток (или более) вариантов смещения вправо, влево, приплюснутость, вытянутость, наклон и пр. И так для всех букв данного почерка. Ессно программным способом.

А распознавание-сравнение будет происходить на основе этой созданой базы. Думаю, что точность распознавания при этом резко возрастёт, а главное сократится время рутинных операций обучения.
Цитата Iska:
смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком »
Вот и у меня есть такой "смысл" в виде рукописной тетради воспоминаний одного хорошего человека.

Последний раз редактировалось MKN, 09-09-2011 в 10:19.


Отправлено: 09:12, 09-09-2011 | #45


Ветеран


Сообщения: 3806
Благодарности: 824

Профиль | Отправить PM | Цитировать


lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.
Это сообщение посчитали полезным следующие участники:

Отправлено: 09:16, 09-09-2011 | #46


Аватара для lunar

Старожил


Сообщения: 435
Благодарности: 15

Профиль | Отправить PM | Цитировать


Цитата Busla:
lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.
------- »
А где среди прог MS можно найти OCR ...может в меню где-то

Отправлено: 15:52, 09-09-2011 | #47


Аватара для yurfed

Ветеран


Сообщения: 20133
Благодарности: 3145

Профиль | Отправить PM | Цитировать


Цитата lunar:
А где среди прог MS можно найти OCR »
Ставите полный пакет MS Office и будет вам счастье при помощи OneNote (пример использования)

-------
Хочу ли я - Могу ли я - Говно ли я - Магнолия

Это сообщение посчитали полезным следующие участники:

Отправлено: 16:50, 09-09-2011 | #48


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


lunar, для Microsoft Office 2003 это: «\Пуск\Программы\Microsoft Office\Средства Microsoft Office\Microsoft Office Document Imaging» («%ProgramFiles%\Common Files\Microsoft Shared\MODI\11.0\mspview.exe»). Отсканировать или открыть документ, затем «\Сервис\Распознать текст…».
Это сообщение посчитали полезным следующие участники:

Отправлено: 17:17, 09-09-2011 | #49


Аватара для lunar

Старожил


Сообщения: 435
Благодарности: 15

Профиль | Отправить PM | Цитировать


Интересно,а как полностью удалить OCR CUNEIFORM (даже с помоощью спец проги что-то остаётся ,а что не пойму) и потом так прога была платная ,а теперь бесплатна не стану ли я случайно бета тестером?

Отправлено: 14:16, 13-09-2011 | #50



Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] Распознование текста

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
Офис и Текст - Замена текста Котяра Программное обеспечение Windows 1 29-09-2008 13:51
форматирование текста Surround Вебмастеру 4 28-04-2008 10:40
Перекодировка текста PJFry Хочу все знать 3 20-03-2008 21:21
копирование текста volin Хочу все знать 10 08-01-2007 00:18
Захват текста Guest Вебмастеру 5 28-03-2004 04:44




 
Переход