Как работает Fine reader? - Компьютерный форум OSzone.net

Компьютерный форум OSzone.net (http://forum.oszone.net/index.php)

- Программирование и базы данных (http://forum.oszone.net/forumdisplay.php?f=21)

- - Как работает Fine reader? (http://forum.oszone.net/showthread.php?t=30399)

Подскажите, плз, где можно прочитать про механизм работы Fine Reader, или другой OCR. В инете шарил, но нашел только общие фразы… Нужна конкретика. Конечно, всё это коммерческая тайна, и всё такое, но всё же...
Спасибо

drGreen
Нейронные сети, вроде как. Сначала бьём всё на отдельные буквы и каждую буквочку отдельно пропускаем через специально обученную сеть. На http://programme.ru была статья с простым примером распознавалки буковок.

Полезно посмотреть на сурцы open-source'ных аналогов. Гугл рулит

http://www.claraocr.org/
http://jocr.sourceforge.net/
и т. д.

Подозреваю, что теорию можно найти с помомощью того же гугла.

Первое, что приходит в голову:  Бъём на буквы, потом сравниваем с заранее приготовленной базой букв, последовательно буква за буквой (предворительно поравняв букву из базы по размеру с оригиналом). Буква в которой совпадает наибольшее количество пикселей и есть искомая. Потом (сравнивая величину пробелов) выходим на слова и проверяем орфографию (это уже совсем другой алгоритм), исправляя таким образом ошибки. (Например буква "Н" при таком алгоритме будет часто путаться с "И", "Ш" с "Щ"). Я полагаю, что при таком подходе коэффициент правильности распознавания будет довольно высок.

Если подумать, то можно "наваять" и векторный способ, но так сразу не могу сказать, подумать надо