Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Закрытая тема
Настройки темы
2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8


Конфигурация

Профиль | Отправить PM | Цитировать


Изменения
Автор: flev45
Дата: 16-05-2019
При преобразовании из PDF в DOCX, в Word не удаётся что-то делать, например удалить строки.
Посмотрите приложение, этот текст выглядит как фото-PDF... маркер никуда не устанавливается.
Как перейти из этого режима в текстовый режим?
Текстовый редактор, в котором ничего редактировать не получается...

Отправлено: 18:10, 11-05-2019

 

Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Я его получил конвертированием из файла HTML to PDF на этом сайте:
https://html2pdf.com/ru/
Может есть какие-то ресурсы лучше этого?

Отправлено: 12:04, 12-05-2019 | #11



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.

mwz mwz вне форума

Аватара для mwz

Ветеран


Contributor


Сообщения: 8620
Благодарности: 2118

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
Может есть какие-то ресурсы лучше этого? »
Даже без ресурсов — есть масса способов. Например, сохранить страницу как HTML и открыть сохранённый файл в Word — на что уже намекалось в предыдущей теме.

-------
Mikhail Zhilin


Отправлено: 12:16, 12-05-2019 | #12


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Уважаемый,
я это уже делал, посмотрите сами на результаты. выход тогда нашёл в HTML to PDF.
Никогда не думал, что настолько сложно/невозможно удалить часть текста из страниц pdf-файла.
Предложите ещё пару-тройку других способов. Намекните. Спасибо.

Последний раз редактировалось flev45, 16-05-2019 в 12:39.


Отправлено: 12:36, 12-05-2019 | #13

mwz mwz вне форума

Аватара для mwz

Ветеран


Contributor


Сообщения: 8620
Благодарности: 2118

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
посмотрите сами на результаты »
Ну надо не только на текст смотреть... Можно поднять глаза чуть выше и увидеть в Word-2010:

-------
Mikhail Zhilin


Отправлено: 12:47, 12-05-2019 | #14


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


...я знаю, что вы не любите "картинок"
Но всё-же посмотрите на скрин того, что у меня показывает Word-2010
А если серьёзно, то главное: как и чем можно удалить "пустые" зоны на страницах pdf-документа?

ПС: кажется и тут я нашёл решение -прога priprinter, это то, что мне надо?

Последний раз редактировалось flev45, 16-05-2019 в 12:39.


Отправлено: 13:04, 12-05-2019 | #15

mwz mwz вне форума

Аватара для mwz

Ветеран


Contributor


Сообщения: 8620
Благодарности: 2118

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
на скрин того, что у меня показывает Word-2010 »
И что, не редактируется?

Посмотрите на скрин Word-2010 до (слева от красной черты) и после (справа) редактирования в нём двух страниц вашего предыдущего вложения. Я что-то не то, что вы имеете в виду, делал?

Кстати, есть масса PDF-принтеров и редакторов, в т.ч. бесплатных, например:
— doPDF
— pdf24-creator
— PDFCreator
— SumatraPDF
и т.д.

-------
Mikhail Zhilin


Отправлено: 13:51, 12-05-2019 | #16


Ветеран


Contributor


Сообщения: 24484
Благодарности: 7116

Профиль | Отправить PM | Цитировать


flev45, я в очередной раз пытаюсь донести до Вас простую мысль, что Вам нужно было просто скопировать потребное текстовое содержимое из браузера, вставить его в документ Microsoft Word, отредактировать, и только потом пытаться делать pdf из откорректированного документа Microsoft Word.
Это сообщение посчитали полезным следующие участники:

Отправлено: 14:01, 12-05-2019 | #17


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Цитата Iska:
flev45, я в очередной раз пытаюсь донести до Вас простую мысль »
Уважаемые, а я пытаюсь донести мысль, что мне нужен не просто текст из страницы блаузера, а получить такой же документ. как по форме, так и по содержанию из HTML/PDF - файлов, но БЕЗ не нужных мне "строк". В шапке и далее я прикреплял файло-документы, из которых мне, к примеру, надо удалить все строки, не относящиеся к продажам... мне это удалось, но осталась куча "пустых" областей на страницах.
В этом проблема... надеюсь, что была. Буду пробовать прогу priprinter...
Цитата mwz:
И что, не редактируется? »
Что там редактировать? Текст, который сикось-накось.

Отправлено: 14:20, 12-05-2019 | #18


Ветеран


Contributor


Сообщения: 513
Благодарности: 231

Профиль | Отправить PM | Цитировать


Цитата flev45:
Уважаемые, а я пытаюсь донести мысль, что мне нужен не просто текст из страницы блаузера, а получить такой же документ. как по форме, так и по содержанию из HTML/PDF »
flev45, вам выше вам предложен именно этот результат, просто для этого нужно выполнять все ваши действия, но в другом порядке.
Есть такое избитое выражение: картошку сначала моют, потом чистят, потом режут, потом кидают в суп. Теоретически можно сначала порезать, потом почистить, но на практике...
Цитата flev45:
но БЕЗ не нужных мне "строк". »
Вот не уверен, что это строки.
В Word текстовое содержимое к страницам никак не привязано (это очень ощутимо при доступе к тексту на VBA). Без проблем можно поменять ориентацию или даже формат каждого листа - Word "перенарежет" содержимое, и всего делов.
В pdf - наоборот, документ изначально побит на страницы, содержимое каждой страницы привязано к этой самой странице. То есть "строки" удалить со сдвигом всего содержимого вверх просто не получится - последующее содержание от предыдущего никак не зависит. Даже содержимое pdf вроде выносок можно таскать в пределах страницы, но нельзя перетащить на соседнюю - выноску нужно вырезать через ctrl+x, и вставить уже на другой странице. А со страницы на страницу - никак. И формат страницы тоже уже не поменять.

Тут правда вопрос тонкий - возможно в Corel Draw или Acrobat Pro это и реализуемо, давно не имел дела.

Цитата flev45:
Что там редактировать? Текст, который сикось-накось. »
Это результат преобразования pdf, а не сам исходный файл как таковой, однако в моем восприятии pdf примерно так и устроен.

Текст в pdf занимает конкретное место страницы, и в вашем Word получается полная аналогия: рамки с текстовым содержимым, которые как раз таки можно зафиксировать на странице - можно хоть весь текст удалить, а рамка будет висеть на своем месте. Вы в word можете выполнить весь документ с помощью текстовых блоков (рамочки с текстом) и получить ровно те же проблемы: блоки можно зафиксировать, и тогда удаление лишних блоков соседние блоки не заденет.

В pdf это четко видно при работе с чертежами из autocad - весь текст полученный из автокадовских шрифтов в редакторе отображается с рамочкой, которая показывает границы текстового объекта, а совсем не "строка", вот именно текстовой объект (в acrobate правда отображение по умолчанию отключено). Как я понимаю, даже таблицу pdf воспринимает просто как набор текста и линий, никак друг с другом не связанных.

Цитата flev45:
Я его получил конвертированием из файла HTML to PDF на этом сайте: »
Соответственно, если его открыть например в html редакторе и обработать в нем, а потом перевести в pdf?

-------
[Форум Word и Excel] - [Как запустить Word, Excel и Outlook в безопасном режиме?] - [Как удалить шаблон Word Normal.dotm?]

Это сообщение посчитали полезным следующие участники:

Отправлено: 19:42, 12-05-2019 | #19


Аватара для flev45

Старожил


Сообщения: 487
Благодарности: 8

Профиль | Отправить PM | Цитировать


Цитата a_axe:
Соответственно, если его открыть например в html редакторе и обработать в нем, а потом перевести в pdf? »
Я практик, не теоретик. Вот с этим я согласен безоговорочно. больше того, в моём случае, чтобы легче было ориентироваться и удалять "области" в html редакторе, алгоритм должен быть такой:
1. Перевод HTML to PDF
2. PDF to ABBYY FineReader 11
3. При помощи функции "Ластик" удаляем со страниц всё лишнее
4. Полученный PDF to HTML
5. В HTML удаляем эти пустые области в редакторе
6. Полученный HTML переводим в PDF
Всё. Я должен получить PDF, в моём случае документ "Продажи", без инфы (строк) по покупкам.
ПС: с autocad, в том числе, я работал 40 лет тому, на самых первых персоналках Apple... тогда ещё никому не известных

Отправлено: 10:06, 13-05-2019 | #20



Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - Печать всех файлов pdf, doc, docx, xls, xlsx из папки Sisin Скриптовые языки администрирования Windows 7 05-03-2019 01:51
2016 - Microsoft Office 2016, Windows 10, Word документ не отправляется из Word Irmi Microsoft Office (Word, Excel, Outlook и т.д.) 1 19-11-2016 08:50
2010 - Проблемы с добавлением файла PDF в Microsoft Office 2010 x64 vikinga Microsoft Office (Word, Excel, Outlook и т.д.) 5 02-07-2014 10:29
Microsoft Office 2013 позволит просматривать и редактировать PDF OSZone News Новости и события Microsoft 5 02-07-2012 15:24
2010 - Word 2010 - преобразовать файл DOCX с полями в файл PDF с сохранением полей senglory Microsoft Office (Word, Excel, Outlook и т.д.) 2 28-03-2012 13:27




 
Переход