Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Закрытая тема
Настройки темы
2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Аватара для flev45

Ветеран


Сообщения: 553
Благодарности: 9


Конфигурация

Профиль | Отправить PM | Цитировать


Изменения
Автор: flev45
Дата: 16-05-2019
При преобразовании из PDF в DOCX, в Word не удаётся что-то делать, например удалить строки.
Посмотрите приложение, этот текст выглядит как фото-PDF... маркер никуда не устанавливается.
Как перейти из этого режима в текстовый режим?
Текстовый редактор, в котором ничего редактировать не получается...

Отправлено: 18:10, 11-05-2019

 

Динохромный


Contributor


Сообщения: 690
Благодарности: 317

Профиль | Отправить PM | Цитировать


flev45, полагаю между пунктами 3 и 4 у вас неизбежно должен возникнуть пункт "Распознать", иначе Finereader просто не даст сохранить pdf. Это краеугольный момент.

По нажатию этой кнопки весь текст вашего pdf переводится в картинку, а затем распознается. Над картинкой с отображением исходного текста помещается невидимый текстовой слой.Что характерно, если снаачала распознать документ, а потом применить ластик - страница становится нераспознанной,т.к. ластик просто замазывает изображение, а с текстом не работает.

При приближении текста в первом pdf гладкий, тк это действительно текст. В рпспознанном - текст уже состоит из квадратиков, тк это лишь изображение текста, которое вы видите, но скопировать не можете, а над ним - текстовой слой, который вы не видите, но можете выделить и скопировать. При этом текст может быть распознан неправильно - например с лишними пробелами или буквой не в той раскладке.

С практической точки зрения - в распознанном pdf в качестве подложки вставлена картинка, и размером она ровно в вашу страницу. Чтобы текст, расположенный над вашей картинкой, сместился, нужно вырезать кусок изображения в середине листа. Не думаю, что это возможно, но если да - вы все равно получите отдельный лист меньшего формата, который будет отдельным от листа перед и листа после. Это не тот результат, который вам нужен, а сделать иначе формат не позволяет, если только не собирать нужные фрагменты вручную, а потом распознавать.

Не вижу другого варианта, как сначала получить результат по содержанию (копируя из html или редактируя html), а потом переводить в pdf, и не вижу объективных причин, которые вынуждали бы вас делать по-другому.

Добавлено:
Кстати, если открыть редактированный pdf через word, там все это очень хорошо видно: и рамочка с невидимым текстом, которую можно сдвинуть относительно видимого текста, и картинка с текстом, которую можно обрезать - границы у нее по листу.

-------
[Форум Word и Excel] - [Как запустить Word, Excel и Outlook в безопасном режиме?] - [Как удалить шаблон Word Normal.dotm?]


Последний раз редактировалось a_axe, 13-05-2019 в 20:53.

Это сообщение посчитали полезным следующие участники:

Отправлено: 19:59, 13-05-2019 | #21



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Ветеран


Сообщения: 27449
Благодарности: 8086

Профиль | Отправить PM | Цитировать


Цитата a_axe:
flev45, полагаю между пунктами 3 и 4 у вас неизбежно должен возникнуть пункт "Распознать", иначе Finereader просто не даст сохранить pdf. »
Именно pdf — даст. А вот так, как хочет автор — сохранить в html — действительно не позволит.

Цитата flev45:
ПС: с autocad, в том числе, я работал 40 лет тому, на самых первых персоналках Apple... тогда ещё никому не известных »
«Нэ вэрю!»™. Во времена Шекспира Сорок лет назад не было сигарет «Друг» ёще не существовало программного продукта под названием AutoCAD.

Отправлено: 22:54, 13-05-2019 | #22


Динохромный


Contributor


Сообщения: 690
Благодарности: 317

Профиль | Отправить PM | Цитировать


Iska, ну может быть и так - значит я не тот порядок действий выбрал
У меня любая попытка сохранить pdf - через кнопку отправить, или через меню "сохранить как" - давало диалог "Страница не распознана, распознать" и из опций либо распознать, либо отменить сохранение. По-раздумью, не в первый раз слышу, что через Finereader можно редактировать pdf, надо с этим поразбираться

-------
[Форум Word и Excel] - [Как запустить Word, Excel и Outlook в безопасном режиме?] - [Как удалить шаблон Word Normal.dotm?]


Отправлено: 23:24, 13-05-2019 | #23


Ветеран


Сообщения: 27449
Благодарности: 8086

Профиль | Отправить PM | Цитировать


a_axe, в восьмой версии это выглядит так:
Скрытый текст

в четырнадцатой версии так:
Скрытый текст


Цитата a_axe:
По-раздумью, не в первый раз слышу, что через Finereader можно редактировать pdf, надо с этим поразбираться »
Неа, нельзя. Токмо после распознавания (если не считать редактированием использование Ластика [я — не считаю]).

Отправлено: 18:03, 14-05-2019 | #24


Динохромный


Contributor


Сообщения: 690
Благодарности: 317

Профиль | Отправить PM | Цитировать


Цитата Iska:
в восьмой версии это выглядит так: »
В 11 аналогично, но следующий шаг доступен только если документ распознан.
Если например открыть pdf и переставить местами странички, и попытаться сохранить через ctrl+alt+s, то попросит либо распознать, либо отказаться от сохранения.
Поэтому ТС в 11 версии обязательно должен был его распознать, иначе бы не сохранил.

-------
[Форум Word и Excel] - [Как запустить Word, Excel и Outlook в безопасном режиме?] - [Как удалить шаблон Word Normal.dotm?]


Отправлено: 18:36, 14-05-2019 | #25


Ветеран


Сообщения: 27449
Благодарности: 8086

Профиль | Отправить PM | Цитировать


a_axe, в четырнадцатой версии данная операция:
Цитата a_axe:
Если например открыть pdf и переставить местами странички, »
не вызвала необходимости распознавания при сохранении. В восьмой версии перемещение страниц из открытого pdf не поддерживается.

Отправлено: 19:03, 14-05-2019 | #26


(*.*)


Сообщения: 36490
Благодарности: 6675

Профиль | Сайт | Отправить PM | Цитировать


Закрываю, поскольку ТС открыл уже третью тему по вопросу, а здесь развели оффтоп.

-------
Канал Windows 11, etc | Чат @winsiders


Отправлено: 21:04, 14-05-2019 | #27



Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - Печать всех файлов pdf, doc, docx, xls, xlsx из папки Sisin Скриптовые языки администрирования Windows 7 05-03-2019 01:51
2016 - Microsoft Office 2016, Windows 10, Word документ не отправляется из Word Irmi Microsoft Office (Word, Excel, Outlook и т.д.) 1 19-11-2016 08:50
2010 - Проблемы с добавлением файла PDF в Microsoft Office 2010 x64 vikinga Microsoft Office (Word, Excel, Outlook и т.д.) 5 02-07-2014 10:29
Microsoft Office 2013 позволит просматривать и редактировать PDF OSZone News Новости и события Microsoft 5 02-07-2012 15:24
2010 - Word 2010 - преобразовать файл DOCX с полями в файл PDF с сохранением полей senglory Microsoft Office (Word, Excel, Outlook и т.д.) 2 28-03-2012 13:27




 
Переход