Показать полную графическую версию : [решено] Пакетный экспорт pdf в docx с помощью Acrobat Pro
The_Immortal
01-03-2019, 09:53
Господа, кто-нибудь в курсе каким образом сделать с помощью Adobe Acrobat Pro DC 2019 пакетное преобразование pdf-файлов в docx в указанном каталоге и всех вложенных подкаталогов?
Что я делаю:
1. Инструменты - Мастер действий - Новое действие.
2. В правом столбце создаваемого действия выбираю "Добавить папку...".
3. В левом столбце создаваемого действия выбираю Перейти - Экспорт PDF.
Теперь пытаюсь воспользоваться данным действием: выбираю каталог, далее появляется окно "Экспортируйте файлы PDF в любой формат" (там выбираю Microsoft Word -> Документ Word), жму Экспорт и... Мне предлагается указать наименование экспортируемого файла. Одного. И на этом "пакетная" обработка заканчивается.
В общем, как запустить автоматический экспорт всего в каталоге?
Спасибо!
The_Immortal, PDF - это картинка в векторном формате. А Word - система семантической разметки текста. Чтобы картинку преобразовать в текст нужна OCR, например Abbyy FireReader, а не программа вёрстки типа Adobe Acrobat Pro
The_Immortal
01-03-2019, 11:07
Busla,PDF - это картинка в векторном формате »Не всегда.
а не программа вёрстки типа Adobe Acrobat Pro »
Вероятно, как раз-таки содержит OCR, т.к. Adobe Acrobat распознает текст налету в случае необходимости.
В общем, проблему решил:
В левом столбце создаваемого действия выбираю Перейти - Экспорт PDF. »Тут надо выбрать пункт Сохранить и экспортировать - Сохранить, а далее уже в настройках добавленного меню указать внизу Экспортировать файлы в другой формат - Документ Word.
The_Immortal, PDF - это картинка в векторном формате. »
Не так. PDF — это, фактически, проприентарный язык описания страниц (такой же, как PostScript, PCL, EPS & etc). И, если, например, текст pdf-файла был сформирован непосредственно из приложения (неважно, будь то непосредственное сохранение в формат pdf, або печать на виртуальный PDF-принтер, суть одно и то же) — последние версии того же Word'а легко открывают такой pdf-файл и извлекают из него текст в нужном начертании и расположении, поскольку таковой там реально присутствует. А вот если содержимое pdf-файла было создано тупо прямым сканированием — здесь лучше не экспериментировать, а зараз брать какой-нибудь приличный OCR.
The_Immortal, а с Word'ом не пробовали — скриптом/макросом?
поскольку таковой там реально присутствует »
Угу. Причём в специальном текстовом слое PDF-файла. Которого не будет при простом сканировании в PDF.
И, если, например, текст pdf-файла был сформирован непосредственно из приложения — последние версии того же Word'а легко открывают такой pdf-файл »
Это в случае простого форматирования - пока совпадают возможности исходного формата, pdf и Word'а. Если к примеру текст в несколько колонок да ещё с фигурным обтеканием, есть вероятность, что порядок текста не сохранится.
Причём в специальном текстовом слое PDF-файла. »
AFAIK в исходно цифровых документах "текстовый слой" отсутствует
PDF - открытый формат
PCL - язык управления принтером. Он, конечно, тоже в итоге графические примитивы описывает, но всё-таки немножко из другой оперы
PDF - открытый формат »
Да, Вы правы, а я — нет.
Если к примеру текст в несколько колонок да ещё с фигурным обтеканием, есть вероятность, что порядок текста не сохранится. »
Смотреть-пробовать надо. У меня «шашнадцатый» Office токмо на работе.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.