|
Компьютерный форум OSzone.net » Компьютеры + Интернет » Хочу все знать » [решено] Распознование текста |
|
[решено] Распознование текста
|
nautonnier
Сообщения: n/a |
Люди! Помогите, пожалуйста, далеко не молодому человеку…
Проблема с распознаванием текста на русском. WIN XP, OFFICE XP- лицензионные, English. Lingvo 8.0-лицензионная, Proofing Tools 2000 - скаченный, но работает, т.е. проверяет ошибки на Русском…. Office Document Imaging не распознает русский текст, т.к. в языках распознавания нет Russian. Может быть, можно как-то добавить Русский или из Lingvo или из Proofing Tools, а может еще откуда? Подскажите, как заставить распознавать русский в Office Document Imaging. Заранее благодарю, Сергей. |
|
Отправлено: 13:39, 22-10-2003 |
Ветеран Сообщения: 2381
|
Профиль | Отправить PM | Цитировать Добавлю такой вопрос в тему - а что есть приличного в мире ПО для распознавания рукописных текстов ?
FineReader никуда не годен... Теоретически его можно научить , натравливая на разноманерные буквы-символы и создавая из них "базу", но это мука адская. Недавно мучился сканируя одно письмо. Так там только у буквы "а" получилось 36 вариантов написания... Ужас. |
Отправлено: 15:13, 08-09-2011 | #41 |
Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети. Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля. |
![]() Старожил Сообщения: 435
|
Профиль | Отправить PM | Цитировать Цитата MKN:
|
|
Последний раз редактировалось lunar, 09-09-2011 в 08:04. Отправлено: 20:58, 08-09-2011 | #42 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать MKN, я делал именно FineReader'ом (сомневаюсь, что для рукописного русского текста будет ещё что-то внятное). Научить его распознавать рукописный текст можно, но:
* почерк должен быть приличным и однородным; * учить его надо долго и на достаточно большом объёме текста. Всё равно работа получается жутко занудная. Так что, смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком |
Отправлено: 22:00, 08-09-2011 | #43 |
Ветеран Сообщения: 3806
|
Профиль | Отправить PM | Цитировать Forest Gump, одну-две странички набрать быстрее. Для разового распознавания можно воспользоваться онлайн версией FineReader'а. Раньше давал пробные первые 40 или 50 страниц распознать бесплатно, как сейчас - не знаю.
|
Отправлено: 09:12, 09-09-2011 | #44 |
Ветеран Сообщения: 2381
|
Профиль | Отправить PM | Цитировать Цитата Iska:
А мысль такова : Одна и та же рукописная буква в тексте, в зависимости от почерка и др. "факторов написания", отличается от "собратьев", как правило, геметрическими вариациями - наклоном, размером и пр., которым нет числа... Собственно в этих вариациях написания и состоит мука обучения. А что, если взять за основу для обучения, наиболее типичный для данного почерка, вариант буквы, и сделать из него базу из множества "морфинг-вариантов". Т.е. создать базу из множества геометрических разновидностей, выбранной буквы. Десяток (или более) вариантов смещения вправо, влево, приплюснутость, вытянутость, наклон и пр. И так для всех букв данного почерка. Ессно программным способом. А распознавание-сравнение будет происходить на основе этой созданой базы. Думаю, что точность распознавания при этом резко возрастёт, а главное сократится время рутинных операций обучения. Цитата Iska:
|
||
Последний раз редактировалось MKN, 09-09-2011 в 10:19. Отправлено: 09:12, 09-09-2011 | #45 |
Ветеран Сообщения: 3806
|
Профиль | Отправить PM | Цитировать lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.
|
Отправлено: 09:16, 09-09-2011 | #46 |
![]() Старожил Сообщения: 435
|
Профиль | Отправить PM | Цитировать Цитата Busla:
|
|
Отправлено: 15:52, 09-09-2011 | #47 |
Ветеран Сообщения: 20133
|
Профиль | Отправить PM | Цитировать |
------- Отправлено: 16:50, 09-09-2011 | #48 |
Ветеран Сообщения: 27449
|
Профиль | Отправить PM | Цитировать lunar, для Microsoft Office 2003 это: «\Пуск\Программы\Microsoft Office\Средства Microsoft Office\Microsoft Office Document Imaging» («%ProgramFiles%\Common Files\Microsoft Shared\MODI\11.0\mspview.exe»). Отсканировать или открыть документ, затем «\Сервис\Распознать текст…».
|
Отправлено: 17:17, 09-09-2011 | #49 |
![]() Старожил Сообщения: 435
|
Профиль | Отправить PM | Цитировать Интересно,а как полностью удалить OCR CUNEIFORM (даже с помоощью спец проги что-то остаётся ,а что не пойму) и потом так прога была платная ,а теперь бесплатна не стану ли я случайно бета тестером?
|
Отправлено: 14:16, 13-09-2011 | #50 |
![]() |
Участник сейчас на форуме |
![]() |
Участник вне форума |
![]() |
Автор темы |
![]() |
Сообщение прикреплено |
| |||||
Название темы | Автор | Информация о форуме | Ответов | Последнее сообщение | |
Офис и Текст - Замена текста | Котяра | Программное обеспечение Windows | 1 | 29-09-2008 13:51 | |
форматирование текста | Surround | Вебмастеру | 4 | 28-04-2008 10:40 | |
Перекодировка текста | PJFry | Хочу все знать | 3 | 20-03-2008 21:21 | |
копирование текста | volin | Хочу все знать | 10 | 08-01-2007 00:18 | |
Захват текста | Guest | Вебмастеру | 5 | 28-03-2004 04:44 |
|