Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Закрытая тема
Настройки темы
2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8


Конфигурация

Профиль | Отправить PM | Цитировать


Изменения
Автор: flev45
Дата: 16-05-2019
При преобразовании из PDF в DOCX, в Word не удаётся что-то делать, например удалить строки.
Посмотрите приложение, этот текст выглядит как фото-PDF... маркер никуда не устанавливается.
Как перейти из этого режима в текстовый режим?
Текстовый редактор, в котором ничего редактировать не получается...

Отправлено: 18:10, 11-05-2019

 
mwz mwz сейчас на форуме

Аватара для mwz

Ветеран


Contributor


Сообщения: 8487
Благодарности: 2074

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
При преобразовании из PDF в DOCX »
Чем преобразуете?

В исходном PDF есть текстовый слой (грубо говоря, можно ли выделить в документе и скопировать в Word кусочки текста)? Если нет — надо программами OCR преобразовывать, которые переводят рисунок текста в текст: например — в FineReader.

-------
Mikhail Zhilin

Это сообщение посчитали полезным следующие участники:

Отправлено: 18:21, 11-05-2019 | #2



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Цитата mwz:
Если нет — надо программами OCR преобразовывать, которые переводят рисунок текста в текст: например — в FineReader. »
Загрузил ПВФ в FineReader, переслал в Word 2010, всё равно не получается редактировать.
Может мне стоит поискать простенький PDF-редактор?
Мне всего-то надо убрать лишние строки в PDF-документе... например, оставить только строки с продажами в PayPal. Что посоветуете? Спасибо.

Последний раз редактировалось flev45, 16-05-2019 в 12:39.


Отправлено: 18:38, 11-05-2019 | #3

mwz mwz сейчас на форуме

Аватара для mwz

Ветеран


Contributor


Сообщения: 8487
Благодарности: 2074

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
Загрузил ПВФ »
А кто это такой? Пенсионный военный фонд?

Упакуйте свой PDF в архив и выложите на файлообменник: пощупать его.

-------
Mikhail Zhilin


Отправлено: 19:00, 11-05-2019 | #4


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Мне кажется, что в FineReader удастся удалить ненужное.
Делаю это при помощи функции "Ластик".
Удалил не нужные области, но теперь надо всё ужать, удалив пустые области документа.
Если просто запомнить в pdf, то эти поля остаются. Можно это сделать в самом FineReader?
Или надо искать какую-то другую прогу?

Отправлено: 19:13, 11-05-2019 | #5


Ветеран


Contributor


Сообщения: 24411
Благодарности: 7090

Профиль | Отправить PM | Цитировать


flev45, мы ж с Вами вроде в прошлой теме (2010 - [решено] Microsoft Office 2010. Как убрать 1/3 пустого места на каждой странице?) пришли к соглашению, что достаточно простого html→doc, разве нет?

Отправлено: 21:55, 11-05-2019 | #6


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Цитата Iska:
пришли к соглашению, что достаточно простого html→doc, разве нет? »
Конечно нет
Там была проблема: после объединения кучи скринов в один docx файл, в конце каждой страницы возникали пустые зоны. После html→pdf эти пустые места исчезли. Т.е. Та проблема была решена, хоть и косвенно.

Тут совсем другая проблема: мне нужно в документе (html, pdf, docx), где отображены купли/продажи на eBay, удалить строки к примеру, все купли и получить документ "продажи".
Я так понял, что даже при html(pdf)→docx я получаю строки не в текстовом виде, а в графическом.
Которые в Word 2010 нельзя корректировать.
Тогда я взял FineReader и удалил в pdf-файле всё ненужное при помощи функции "Ластик".
Всё хорошо, но в любом выходном файле, pdf или docx, образовались пустые зоны (после "Ластик")... которые опять-таки надо удалить. Проблема та же, что в указанной выше теме, но как её решить?
В каком "графическом" редакторе, если такой существует?
ПС: редактор PDF-файлов, который это делает, я пока не нашёл... подскажите.

Отправлено: 10:06, 12-05-2019 | #7

mwz mwz сейчас на форуме

Аватара для mwz

Ветеран


Contributor


Сообщения: 8487
Благодарности: 2074

Профиль | Сайт | Отправить PM | Цитировать


flev45, так вы образец PDF-файла приложите — или так и будем ходить вокруг да около?

-------
Mikhail Zhilin


Отправлено: 10:31, 12-05-2019 | #8


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


PDF- исходник и PDF, полученный из исходника в ABBYY FineReader 11, после удаления в pdf-файле всё ненужное при помощи функции "Ластик".
Именно в нём мне нужно удалить пустые зоны.

Последний раз редактировалось flev45, 16-05-2019 в 12:39.


Отправлено: 11:17, 12-05-2019 | #9

mwz mwz сейчас на форуме

Аватара для mwz

Ветеран


Contributor


Сообщения: 8487
Благодарности: 2074

Профиль | Сайт | Отправить PM | Цитировать


Вложения
Тип файла: zip 2019 PayPal Aktivitäten.zip
(232.3 Kb, 2 просмотров)

Цитата flev45:
PDF- исходник »
Странный PDF... При автораспознавании Файнридер берёт часть его как текст — а часть как картинку. Чем вы его создавали (какой программой)?

Результат приложен (в zip-архиве).

-------
Mikhail Zhilin


Последний раз редактировалось mwz, 12-05-2019 в 12:07.


Отправлено: 11:43, 12-05-2019 | #10



Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - Печать всех файлов pdf, doc, docx, xls, xlsx из папки Sisin Скриптовые языки администрирования Windows 7 05-03-2019 01:51
2016 - Microsoft Office 2016, Windows 10, Word документ не отправляется из Word Irmi Microsoft Office (Word, Excel, Outlook и т.д.) 1 19-11-2016 08:50
2010 - Проблемы с добавлением файла PDF в Microsoft Office 2010 x64 vikinga Microsoft Office (Word, Excel, Outlook и т.д.) 5 02-07-2014 10:29
Microsoft Office 2013 позволит просматривать и редактировать PDF OSZone News Новости и события Microsoft 5 02-07-2012 15:24
2010 - Word 2010 - преобразовать файл DOCX с полями в файл PDF с сохранением полей senglory Microsoft Office (Word, Excel, Outlook и т.д.) 2 28-03-2012 13:27




 
Переход