![]() |
Подскажите, плз, где можно прочитать про механизм работы Fine Reader, или другой OCR. В инете шарил, но нашел только общие фразы… Нужна конкретика. Конечно, всё это коммерческая тайна, и всё такое, но всё же...
Спасибо |
drGreen
Нейронные сети, вроде как. Сначала бьём всё на отдельные буквы и каждую буквочку отдельно пропускаем через специально обученную сеть. На http://programme.ru была статья с простым примером распознавалки буковок. Полезно посмотреть на сурцы open-source'ных аналогов. Гугл рулит http://www.claraocr.org/ http://jocr.sourceforge.net/ и т. д. Подозреваю, что теорию можно найти с помомощью того же гугла. |
Первое, что приходит в голову: Бъём на буквы, потом сравниваем с заранее приготовленной базой букв, последовательно буква за буквой (предворительно поравняв букву из базы по размеру с оригиналом). Буква в которой совпадает наибольшее количество пикселей и есть искомая. Потом (сравнивая величину пробелов) выходим на слова и проверяем орфографию (это уже совсем другой алгоритм), исправляя таким образом ошибки. (Например буква "Н" при таком алгоритме будет часто путаться с "И", "Ш" с "Щ"). Я полагаю, что при таком подходе коэффициент правильности распознавания будет довольно высок.
Если подумать, то можно "наваять" и векторный способ, но так сразу не могу сказать, подумать надо |
Время: 05:10. |
Время: 05:10.
© OSzone.net 2001-