Показать полную графическую версию : Как работает Fine reader?
Подскажите, плз, где можно прочитать про механизм работы Fine Reader, или другой OCR. В инете шарил, но нашел только общие фразы… Нужна конкретика. Конечно, всё это коммерческая тайна, и всё такое, но всё же...
Спасибо
drGreen
Нейронные сети, вроде как. Сначала бьём всё на отдельные буквы и каждую буквочку отдельно пропускаем через специально обученную сеть. На http://programme.ru была статья с простым примером распознавалки буковок.
Полезно посмотреть на сурцы open-source'ных аналогов. Гугл рулит (http://www.google.com.ru/search?q=Open-source+OCR&ie=UTF-8&oe=UTF-8&hl=ru&lr=)
http://www.claraocr.org/
http://jocr.sourceforge.net/
и т. д.
Подозреваю, что теорию можно найти с помомощью того же гугла.
Первое, что приходит в голову: Бъём на буквы, потом сравниваем с заранее приготовленной базой букв, последовательно буква за буквой (предворительно поравняв букву из базы по размеру с оригиналом). Буква в которой совпадает наибольшее количество пикселей и есть искомая. Потом (сравнивая величину пробелов) выходим на слова и проверяем орфографию (это уже совсем другой алгоритм), исправляя таким образом ошибки. (Например буква "Н" при таком алгоритме будет часто путаться с "И", "Ш" с "Щ"). Я полагаю, что при таком подходе коэффициент правильности распознавания будет довольно высок.
Если подумать, то можно "наваять" и векторный способ, но так сразу не могу сказать, подумать надо
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.