Войти

Показать полную графическую версию : [решено] Пакетный экспорт pdf в docx с помощью Acrobat Pro


The_Immortal
01-03-2019, 09:53
Господа, кто-нибудь в курсе каким образом сделать с помощью Adobe Acrobat Pro DC 2019 пакетное преобразование pdf-файлов в docx в указанном каталоге и всех вложенных подкаталогов?

Что я делаю:

1. Инструменты - Мастер действий - Новое действие.
2. В правом столбце создаваемого действия выбираю "Добавить папку...".
3. В левом столбце создаваемого действия выбираю Перейти - Экспорт PDF.

Теперь пытаюсь воспользоваться данным действием: выбираю каталог, далее появляется окно "Экспортируйте файлы PDF в любой формат" (там выбираю Microsoft Word -> Документ Word), жму Экспорт и... Мне предлагается указать наименование экспортируемого файла. Одного. И на этом "пакетная" обработка заканчивается.

В общем, как запустить автоматический экспорт всего в каталоге?

Спасибо!

Busla
01-03-2019, 10:45
The_Immortal, PDF - это картинка в векторном формате. А Word - система семантической разметки текста. Чтобы картинку преобразовать в текст нужна OCR, например Abbyy FireReader, а не программа вёрстки типа Adobe Acrobat Pro

The_Immortal
01-03-2019, 11:07
Busla,PDF - это картинка в векторном формате »Не всегда.
а не программа вёрстки типа Adobe Acrobat Pro »
Вероятно, как раз-таки содержит OCR, т.к. Adobe Acrobat распознает текст налету в случае необходимости.


В общем, проблему решил:
В левом столбце создаваемого действия выбираю Перейти - Экспорт PDF. »Тут надо выбрать пункт Сохранить и экспортировать - Сохранить, а далее уже в настройках добавленного меню указать внизу Экспортировать файлы в другой формат - Документ Word.

Iska
01-03-2019, 19:13
The_Immortal, PDF - это картинка в векторном формате. »
Не так. PDF — это, фактически, проприентарный язык описания страниц (такой же, как PostScript, PCL, EPS & etc). И, если, например, текст pdf-файла был сформирован непосредственно из приложения (неважно, будь то непосредственное сохранение в формат pdf, або печать на виртуальный PDF-принтер, суть одно и то же) — последние версии того же Word'а легко открывают такой pdf-файл и извлекают из него текст в нужном начертании и расположении, поскольку таковой там реально присутствует. А вот если содержимое pdf-файла было создано тупо прямым сканированием — здесь лучше не экспериментировать, а зараз брать какой-нибудь приличный OCR.

The_Immortal, а с Word'ом не пробовали — скриптом/макросом?

mwz
01-03-2019, 22:45
поскольку таковой там реально присутствует »

Угу. Причём в специальном текстовом слое PDF-файла. Которого не будет при простом сканировании в PDF.

Busla
02-03-2019, 01:10
И, если, например, текст pdf-файла был сформирован непосредственно из приложения — последние версии того же Word'а легко открывают такой pdf-файл »
Это в случае простого форматирования - пока совпадают возможности исходного формата, pdf и Word'а. Если к примеру текст в несколько колонок да ещё с фигурным обтеканием, есть вероятность, что порядок текста не сохранится.

Причём в специальном текстовом слое PDF-файла. »
AFAIK в исходно цифровых документах "текстовый слой" отсутствует

PDF - открытый формат

PCL - язык управления принтером. Он, конечно, тоже в итоге графические примитивы описывает, но всё-таки немножко из другой оперы

Iska
02-03-2019, 09:42
PDF - открытый формат »
Да, Вы правы, а я — нет.

Если к примеру текст в несколько колонок да ещё с фигурным обтеканием, есть вероятность, что порядок текста не сохранится. »
Смотреть-пробовать надо. У меня «шашнадцатый» Office токмо на работе.




© OSzone.net 2001-2012