Войти

Показать полную графическую версию : Распознать ПДФ-таблицу


cahes
19-05-2020, 20:06
Люди - как перенести в Word и распознавать таблицу в PDF-е кроме как Finereader-ом? То-есть - не распознавание - как изображение, а PDF-распознавальщик. Я использую Infix - он текст переводит а линии - нет. Может я чё-то не понимаю, может - особенности технологии, может это возможно только через распознавание текста - как растрового изображения, - прошу пояснить.

a_axe
19-05-2020, 20:20
Коллеги меня поправят, если я не прав - у меня в голове уверенность, что сам PDF формат не воспринимает таблицу как некое единое целое, в рамках этого формата таблица - это набор никак не связанных между собой линий и текста. Соответственно, распознование все равно так или иначе сведется к реалиям файнридера.

Стоит попробовать открыть пдф через word последних версий, если исходная таблица не является картинкой - может и получится приемлемый результат, но это сомнительно.




© OSzone.net 2001-2012