[решено] Распознование текста

MKN · Отправлено: **15:13, 08-09-2011** | #41

Добавлю такой вопрос в тему - а что есть приличного в мире ПО для распознавания рукописных текстов ?
FineReader никуда не годен... Теоретически его можно научить , натравливая на разноманерные буквы-символы и создавая из них "базу", но это мука адская. Недавно мучился сканируя одно письмо. Так там только у буквы "а" получилось 36 вариантов написания... Ужас.

lunar · Конфигурация компьютера

Цитата MKN:

а что есть приличного в мире ПО для распознавания рукописных текстов ? »

А ведь действительно если платить ,то уж за такой продукт денег не жалко...

Iska · Отправлено: **22:00, 08-09-2011** | #43

MKN, я делал именно FineReader'ом (сомневаюсь, что для рукописного русского текста будет ещё что-то внятное). Научить его распознавать рукописный текст можно, но:

* почерк должен быть приличным и однородным;
* учить его надо долго и на достаточно большом объёме текста.

Всё равно работа получается жутко занудная. Так что, смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком

Busla · Отправлено: **09:12, 09-09-2011** | #44

Forest Gump, одну-две странички набрать быстрее. Для разового распознавания можно воспользоваться онлайн версией FineReader'а. Раньше давал пробные первые 40 или 50 страниц распознать бесплатно, как сейчас - не знаю.

MKN · Отправлено: **09:12, 09-09-2011** | #45

Цитата Iska:

учить его надо долго и на достаточно большом объёме текста »

К сожалению именно так... И в этой связи у меня есть некоторые соображения, которые я как то уже высказывал, но не представляю как претворить в жизнь... Точнее это могли бы сделать программисты, если бы захотели...

А мысль такова : Одна и та же рукописная буква в тексте, в зависимости от почерка и др. "факторов написания", отличается от "собратьев", как правило, геметрическими вариациями - наклоном, размером и пр., которым нет числа... Собственно в этих вариациях написания и состоит мука обучения.

А что, если взять за основу для обучения, наиболее типичный для данного почерка, вариант буквы, и сделать из него базу из множества "морфинг-вариантов". Т.е. создать базу из множества геометрических разновидностей, выбранной буквы.
Десяток (или более) вариантов смещения вправо, влево, приплюснутость, вытянутость, наклон и пр. И так для всех букв данного почерка. Ессно программным способом.

А распознавание-сравнение будет происходить на основе этой созданой базы. Думаю, что точность распознавания при этом резко возрастёт, а главное сократится время рутинных операций обучения.

Цитата Iska:

смысл есть, только если потребно распознать какой-то большой архив текста, написанного одним человеком »

Вот и у меня есть такой "смысл" в виде рукописной тетради воспоминаний одного хорошего человека.

Busla · Отправлено: **09:16, 09-09-2011** | #46

lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.

lunar · Конфигурация компьютера

Цитата Busla:

lunar, т.к. вы предполагаете редактировать документы, наверняка не обойдётся без MS Ofiice - со старшими редакциями идёт OCR. Правда, никогда сам не пользовался.
------- »

А где среди прог MS можно найти OCR ...может в меню где-то

yurfed · Отправлено: **16:50, 09-09-2011** | #48

Цитата lunar:

А где среди прог MS можно найти OCR »

Ставите полный пакет MS Office и будет вам счастье при помощи OneNote (пример использования)

Iska · Отправлено: **17:17, 09-09-2011** | #49

lunar, для Microsoft Office 2003 это: «\Пуск\Программы\Microsoft Office\Средства Microsoft Office\Microsoft Office Document Imaging» («%ProgramFiles%\Common Files\Microsoft Shared\MODI\11.0\mspview.exe»). Отсканировать или открыть документ, затем «\Сервис\Распознать текст…».

lunar · Конфигурация компьютера

Интересно,а как полностью удалить OCR CUNEIFORM (даже с помоощью спец проги что-то остаётся ,а что не пойму) и потом так прога была платная ,а теперь бесплатна не стану ли я случайно бета тестером?