Показать полную графическую версию : Поиск возможности автокоррекции выравнивания по ширине
Здравствуйте!
Подскажите пожалуйста, еще не придумали программу авторедактирования текста.
Например, если копируешь текст из pdf в блокнот или word, текст автоматически форматируется по левую сторону и приходится руками каждую часть строки возвращать в предложение - т.е. приводить в удобочитаемый формат. Предлагаемые онлайн конвекторы, кстати тоже далеко не всегда нормально позиционируют текст
Вот я и подумал, может уже предумали какой-то редактор, который сделает это за меня)) Абзацы я готов сам выделить, даже если будет сплошной многостраничный текст))
Может быть плагин подключаемый непосредственно в Word через который можно корректно (с сохранением основных элементов форматирования) переносить текст из pdf
Заранее спасибо!
Grabber2006
09-09-2023, 21:34
Попробуйте распознать PDF в Word с помощью, например, ABBYY Fine Reader. Есть большая вероятность что и редактировать ничего не придётся.
Так распознавать не нужно, pdf файл редактируемый, но после cntrl+A и V весь текст остается слева
Абзацы я готов сам выделить, даже если будет сплошной многостраничный текст)) »
Work700, попробуйте в Word заменить без галки "подстановочные знаки" запрос ^p не пробел.
pdf файл редактируемый »
Есть вариант открыть pdf прямо через Word.
В настройках Finereader есть пункт, на что ориентироваться при создании файла - на распознование или имеющийся в pdf текстовой слой. В случае, если из pdf требуется получить нормальные таблицы, это обычно удобный вариант, при условии что около получаса нужно потратить при первом запуске Finereader, чтобы понять, как что в нем работает. Я например отключаю автосоздание макета, и вручную выделяю нужные области, присваивая им нужный тип - рисунок, текст или таблица. И да - результат получается более близкий к ожидаемому.
Например, если копируешь текст из pdf в блокнот или word, текст автоматически форматируется по левую сторону и приходится руками каждую часть строки возвращать в предложение - т.е. приводить в удобочитаемый формат. »
ПДФ не знает понятия "автоперенос слов". Он знает понятие "конец строки", ^p
И если вы включите непечатные символы - вы их увидите.
Как решение - самое ленивое и простое - абзацы отделять сдвоенными переводами строки, потом в ворде ctrl+H - заменить ^p^p на ^p<p>, после чего заменить ^p на " " (пробел), а после <p> -> ^p
Смысл - чтоб не искать потом, где были абзацы.
Когда на чужих (или рабочей) машинах редакчу - уж лет 20 этим пользуюсь.
bredych,
К сожалению Word не находит ^p^p, соответственно ни чего не заменяет
Буду премного благодарен, если проделаете на примере моего файла и затем объясните, как сделали
https://docs.google.com/document/d/1l_mdU2CdKongvSqr9SfbwVw_5jOlFGTN/edit?usp=sharing&ouid=104596126961931280984&rtpof=true&sd=true
Work700, попробуйте ^l заменить на пробел.
Кроме того, попробуйте открыть Word, нажать ctrl+o и в диалоге открытия файла указать ваш исходный pdf. Очень сильно зависит от содержимого файла и метода преобразования в pdf, но если он просто сохранен из Word в pdf, то открыться он может с сохранением структуры и таблиц.
Руки все равно придется приложить, но в целом это будет быстрее, чем копировать весь текст и переформатировать.
a_axe,
Открытие pdf в word помогло, действительно нормально открылось
Спасибо!
К сожалению Word не находит ^p^p, соответственно ни чего не заменяет »
возможно, у вас разрывы строки ^l, попробуйте их. Обычно абзацы, но случается и так.
с гуглом я не дружу, оттуда ничего скачать не смогу, увы.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.