Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  

Показать сообщение отдельно

Динохромный


Contributor


Сообщения: 690
Благодарности: 317

Профиль | Отправить PM | Цитировать


flev45, полагаю между пунктами 3 и 4 у вас неизбежно должен возникнуть пункт "Распознать", иначе Finereader просто не даст сохранить pdf. Это краеугольный момент.

По нажатию этой кнопки весь текст вашего pdf переводится в картинку, а затем распознается. Над картинкой с отображением исходного текста помещается невидимый текстовой слой.Что характерно, если снаачала распознать документ, а потом применить ластик - страница становится нераспознанной,т.к. ластик просто замазывает изображение, а с текстом не работает.

При приближении текста в первом pdf гладкий, тк это действительно текст. В рпспознанном - текст уже состоит из квадратиков, тк это лишь изображение текста, которое вы видите, но скопировать не можете, а над ним - текстовой слой, который вы не видите, но можете выделить и скопировать. При этом текст может быть распознан неправильно - например с лишними пробелами или буквой не в той раскладке.

С практической точки зрения - в распознанном pdf в качестве подложки вставлена картинка, и размером она ровно в вашу страницу. Чтобы текст, расположенный над вашей картинкой, сместился, нужно вырезать кусок изображения в середине листа. Не думаю, что это возможно, но если да - вы все равно получите отдельный лист меньшего формата, который будет отдельным от листа перед и листа после. Это не тот результат, который вам нужен, а сделать иначе формат не позволяет, если только не собирать нужные фрагменты вручную, а потом распознавать.

Не вижу другого варианта, как сначала получить результат по содержанию (копируя из html или редактируя html), а потом переводить в pdf, и не вижу объективных причин, которые вынуждали бы вас делать по-другому.

Добавлено:
Кстати, если открыть редактированный pdf через word, там все это очень хорошо видно: и рамочка с невидимым текстом, которую можно сдвинуть относительно видимого текста, и картинка с текстом, которую можно обрезать - границы у нее по листу.

-------
[Форум Word и Excel] - [Как запустить Word, Excel и Outlook в безопасном режиме?] - [Как удалить шаблон Word Normal.dotm?]


Последний раз редактировалось a_axe, 13-05-2019 в 20:53.

Это сообщение посчитали полезным следующие участники:

Отправлено: 19:59, 13-05-2019 | #21