Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Закрытая тема
Настройки темы
2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Аватара для flev45

Ветеран


Сообщения: 500
Благодарности: 8


Конфигурация

Профиль | Отправить PM | Цитировать


Изменения
Автор: flev45
Дата: 16-05-2019
При преобразовании из PDF в DOCX, в Word не удаётся что-то делать, например удалить строки.
Посмотрите приложение, этот текст выглядит как фото-PDF... маркер никуда не устанавливается.
Как перейти из этого режима в текстовый режим?
Текстовый редактор, в котором ничего редактировать не получается...

Отправлено: 18:10, 11-05-2019

 

Аватара для flev45

Ветеран


Сообщения: 500
Благодарности: 8

Профиль | Отправить PM | Цитировать


Я его получил конвертированием из файла HTML to PDF на этом сайте:
https://html2pdf.com/ru/
Может есть какие-то ресурсы лучше этого?

Отправлено: 12:04, 12-05-2019 | #11



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.

mwz mwz вне форума

Аватара для mwz

Ушел из жизни


Contributor


Сообщения: 8628
Благодарности: 2124

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
Может есть какие-то ресурсы лучше этого? »
Даже без ресурсов — есть масса способов. Например, сохранить страницу как HTML и открыть сохранённый файл в Word — на что уже намекалось в предыдущей теме.

-------
Mikhail Zhilin


Отправлено: 12:16, 12-05-2019 | #12


Аватара для flev45

Ветеран


Сообщения: 500
Благодарности: 8

Профиль | Отправить PM | Цитировать


Уважаемый,
я это уже делал, посмотрите сами на результаты. выход тогда нашёл в HTML to PDF.
Никогда не думал, что настолько сложно/невозможно удалить часть текста из страниц pdf-файла.
Предложите ещё пару-тройку других способов. Намекните. Спасибо.

Последний раз редактировалось flev45, 16-05-2019 в 12:39.


Отправлено: 12:36, 12-05-2019 | #13

mwz mwz вне форума

Аватара для mwz

Ушел из жизни


Contributor


Сообщения: 8628
Благодарности: 2124

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
посмотрите сами на результаты »
Ну надо не только на текст смотреть... Можно поднять глаза чуть выше и увидеть в Word-2010:

-------
Mikhail Zhilin


Отправлено: 12:47, 12-05-2019 | #14


Аватара для flev45

Ветеран


Сообщения: 500
Благодарности: 8

Профиль | Отправить PM | Цитировать


...я знаю, что вы не любите "картинок"
Но всё-же посмотрите на скрин того, что у меня показывает Word-2010
А если серьёзно, то главное: как и чем можно удалить "пустые" зоны на страницах pdf-документа?

ПС: кажется и тут я нашёл решение -прога priprinter, это то, что мне надо?

Последний раз редактировалось flev45, 16-05-2019 в 12:39.


Отправлено: 13:04, 12-05-2019 | #15

mwz mwz вне форума

Аватара для mwz

Ушел из жизни


Contributor


Сообщения: 8628
Благодарности: 2124

Профиль | Сайт | Отправить PM | Цитировать


Цитата flev45:
на скрин того, что у меня показывает Word-2010 »
И что, не редактируется?

Посмотрите на скрин Word-2010 до (слева от красной черты) и после (справа) редактирования в нём двух страниц вашего предыдущего вложения. Я что-то не то, что вы имеете в виду, делал?

Кстати, есть масса PDF-принтеров и редакторов, в т.ч. бесплатных, например:
— doPDF
— pdf24-creator
— PDFCreator
— SumatraPDF
и т.д.

-------
Mikhail Zhilin


Отправлено: 13:51, 12-05-2019 | #16


Ветеран


Contributor


Сообщения: 26158
Благодарности: 7612

Профиль | Отправить PM | Цитировать


flev45, я в очередной раз пытаюсь донести до Вас простую мысль, что Вам нужно было просто скопировать потребное текстовое содержимое из браузера, вставить его в документ Microsoft Word, отредактировать, и только потом пытаться делать pdf из откорректированного документа Microsoft Word.
Это сообщение посчитали полезным следующие участники:

Отправлено: 14:01, 12-05-2019 | #17


Аватара для flev45

Ветеран


Сообщения: 500
Благодарности: 8

Профиль | Отправить PM | Цитировать


Цитата Iska:
flev45, я в очередной раз пытаюсь донести до Вас простую мысль »
Уважаемые, а я пытаюсь донести мысль, что мне нужен не просто текст из страницы блаузера, а получить такой же документ. как по форме, так и по содержанию из HTML/PDF - файлов, но БЕЗ не нужных мне "строк". В шапке и далее я прикреплял файло-документы, из которых мне, к примеру, надо удалить все строки, не относящиеся к продажам... мне это удалось, но осталась куча "пустых" областей на страницах.
В этом проблема... надеюсь, что была. Буду пробовать прогу priprinter...
Цитата mwz:
И что, не редактируется? »
Что там редактировать? Текст, который сикось-накось.

Отправлено: 14:20, 12-05-2019 | #18


Ветеран


Contributor


Сообщения: 546
Благодарности: 256

Профиль | Отправить PM | Цитировать


Цитата flev45:
Уважаемые, а я пытаюсь донести мысль, что мне нужен не просто текст из страницы блаузера, а получить такой же документ. как по форме, так и по содержанию из HTML/PDF »
flev45, вам выше вам предложен именно этот результат, просто для этого нужно выполнять все ваши действия, но в другом порядке.
Есть такое избитое выражение: картошку сначала моют, потом чистят, потом режут, потом кидают в суп. Теоретически можно сначала порезать, потом почистить, но на практике...
Цитата flev45:
но БЕЗ не нужных мне "строк". »
Вот не уверен, что это строки.
В Word текстовое содержимое к страницам никак не привязано (это очень ощутимо при доступе к тексту на VBA). Без проблем можно поменять ориентацию или даже формат каждого листа - Word "перенарежет" содержимое, и всего делов.
В pdf - наоборот, документ изначально побит на страницы, содержимое каждой страницы привязано к этой самой странице. То есть "строки" удалить со сдвигом всего содержимого вверх просто не получится - последующее содержание от предыдущего никак не зависит. Даже содержимое pdf вроде выносок можно таскать в пределах страницы, но нельзя перетащить на соседнюю - выноску нужно вырезать через ctrl+x, и вставить уже на другой странице. А со страницы на страницу - никак. И формат страницы тоже уже не поменять.

Тут правда вопрос тонкий - возможно в Corel Draw или Acrobat Pro это и реализуемо, давно не имел дела.

Цитата flev45:
Что там редактировать? Текст, который сикось-накось. »
Это результат преобразования pdf, а не сам исходный файл как таковой, однако в моем восприятии pdf примерно так и устроен.

Текст в pdf занимает конкретное место страницы, и в вашем Word получается полная аналогия: рамки с текстовым содержимым, которые как раз таки можно зафиксировать на странице - можно хоть весь текст удалить, а рамка будет висеть на своем месте. Вы в word можете выполнить весь документ с помощью текстовых блоков (рамочки с текстом) и получить ровно те же проблемы: блоки можно зафиксировать, и тогда удаление лишних блоков соседние блоки не заденет.

В pdf это четко видно при работе с чертежами из autocad - весь текст полученный из автокадовских шрифтов в редакторе отображается с рамочкой, которая показывает границы текстового объекта, а совсем не "строка", вот именно текстовой объект (в acrobate правда отображение по умолчанию отключено). Как я понимаю, даже таблицу pdf воспринимает просто как набор текста и линий, никак друг с другом не связанных.

Цитата flev45:
Я его получил конвертированием из файла HTML to PDF на этом сайте: »
Соответственно, если его открыть например в html редакторе и обработать в нем, а потом перевести в pdf?

-------
[Форум Word и Excel] - [Как запустить Word, Excel и Outlook в безопасном режиме?] - [Как удалить шаблон Word Normal.dotm?]

Это сообщение посчитали полезным следующие участники:

Отправлено: 19:42, 12-05-2019 | #19


Аватара для flev45

Ветеран


Сообщения: 500
Благодарности: 8

Профиль | Отправить PM | Цитировать


Цитата a_axe:
Соответственно, если его открыть например в html редакторе и обработать в нем, а потом перевести в pdf? »
Я практик, не теоретик. Вот с этим я согласен безоговорочно. больше того, в моём случае, чтобы легче было ориентироваться и удалять "области" в html редакторе, алгоритм должен быть такой:
1. Перевод HTML to PDF
2. PDF to ABBYY FineReader 11
3. При помощи функции "Ластик" удаляем со страниц всё лишнее
4. Полученный PDF to HTML
5. В HTML удаляем эти пустые области в редакторе
6. Полученный HTML переводим в PDF
Всё. Я должен получить PDF, в моём случае документ "Продажи", без инфы (строк) по покупкам.
ПС: с autocad, в том числе, я работал 40 лет тому, на самых первых персоналках Apple... тогда ещё никому не известных

Отправлено: 10:06, 13-05-2019 | #20



Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » 2010 - Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - Печать всех файлов pdf, doc, docx, xls, xlsx из папки Sisin Скриптовые языки администрирования Windows 7 05-03-2019 01:51
2016 - Microsoft Office 2016, Windows 10, Word документ не отправляется из Word Irmi Microsoft Office (Word, Excel, Outlook и т.д.) 1 19-11-2016 08:50
2010 - Проблемы с добавлением файла PDF в Microsoft Office 2010 x64 vikinga Microsoft Office (Word, Excel, Outlook и т.д.) 5 02-07-2014 10:29
Microsoft Office 2013 позволит просматривать и редактировать PDF OSZone News Новости и события Microsoft 5 02-07-2012 15:24
2010 - Word 2010 - преобразовать файл DOCX с полями в файл PDF с сохранением полей senglory Microsoft Office (Word, Excel, Outlook и т.д.) 2 28-03-2012 13:27




 
Переход