Компьютерный форум OSzone.net  

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)
-   Программирование и базы данных (http://forum.oszone.net/forumdisplay.php?f=21)
-   -   Как работает Fine reader? (http://forum.oszone.net/showthread.php?t=30399)

drGreen 09-07-2003 09:12 208478

Подскажите, плз, где можно прочитать про механизм работы Fine Reader, или другой OCR. В инете шарил, но нашел только общие фразы… Нужна конкретика. Конечно, всё это коммерческая тайна, и всё такое, но всё же...
Спасибо

ivank 09-07-2003 11:40 208479

drGreen
Нейронные сети, вроде как. Сначала бьём всё на отдельные буквы и каждую буквочку отдельно пропускаем через специально обученную сеть. На http://programme.ru была статья с простым примером распознавалки буковок.

Полезно посмотреть на сурцы open-source'ных аналогов. Гугл рулит

http://www.claraocr.org/
http://jocr.sourceforge.net/
и т. д.

Подозреваю, что теорию можно найти с помомощью того же гугла.

pauluss 16-07-2003 19:15 208480

Первое, что приходит в голову:  Бъём на буквы, потом сравниваем с заранее приготовленной базой букв, последовательно буква за буквой (предворительно поравняв букву из базы по размеру с оригиналом). Буква в которой совпадает наибольшее количество пикселей и есть искомая. Потом (сравнивая величину пробелов) выходим на слова и проверяем орфографию (это уже совсем другой алгоритм), исправляя таким образом ошибки. (Например буква "Н" при таком алгоритме будет часто путаться с "И", "Ш" с "Щ"). Я полагаю, что при таком подходе коэффициент правильности распознавания будет довольно высок.

Если подумать, то можно "наваять" и векторный способ, но так сразу не могу сказать, подумать надо


Время: 05:10.

Время: 05:10.
© OSzone.net 2001-