Войти

Показать полную графическую версию : Поиск возможности автокоррекции выравнивания по ширине


Work700
09-09-2023, 21:18
Здравствуйте!
Подскажите пожалуйста, еще не придумали программу авторедактирования текста.
Например, если копируешь текст из pdf в блокнот или word, текст автоматически форматируется по левую сторону и приходится руками каждую часть строки возвращать в предложение - т.е. приводить в удобочитаемый формат. Предлагаемые онлайн конвекторы, кстати тоже далеко не всегда нормально позиционируют текст

Вот я и подумал, может уже предумали какой-то редактор, который сделает это за меня)) Абзацы я готов сам выделить, даже если будет сплошной многостраничный текст))
Может быть плагин подключаемый непосредственно в Word через который можно корректно (с сохранением основных элементов форматирования) переносить текст из pdf

Заранее спасибо!

Grabber2006
09-09-2023, 21:34
Попробуйте распознать PDF в Word с помощью, например, ABBYY Fine Reader. Есть большая вероятность что и редактировать ничего не придётся.

Work700
09-09-2023, 22:35
Так распознавать не нужно, pdf файл редактируемый, но после cntrl+A и V весь текст остается слева

a_axe
10-09-2023, 08:53
Абзацы я готов сам выделить, даже если будет сплошной многостраничный текст)) »
Work700, попробуйте в Word заменить без галки "подстановочные знаки" запрос ^p не пробел.
pdf файл редактируемый »
Есть вариант открыть pdf прямо через Word.
В настройках Finereader есть пункт, на что ориентироваться при создании файла - на распознование или имеющийся в pdf текстовой слой. В случае, если из pdf требуется получить нормальные таблицы, это обычно удобный вариант, при условии что около получаса нужно потратить при первом запуске Finereader, чтобы понять, как что в нем работает. Я например отключаю автосоздание макета, и вручную выделяю нужные области, присваивая им нужный тип - рисунок, текст или таблица. И да - результат получается более близкий к ожидаемому.

bredych
11-09-2023, 01:14
Например, если копируешь текст из pdf в блокнот или word, текст автоматически форматируется по левую сторону и приходится руками каждую часть строки возвращать в предложение - т.е. приводить в удобочитаемый формат. »
ПДФ не знает понятия "автоперенос слов". Он знает понятие "конец строки", ^p
И если вы включите непечатные символы - вы их увидите.

Как решение - самое ленивое и простое - абзацы отделять сдвоенными переводами строки, потом в ворде ctrl+H - заменить ^p^p на ^p<p>, после чего заменить ^p на " " (пробел), а после <p> -> ^p
Смысл - чтоб не искать потом, где были абзацы.

Когда на чужих (или рабочей) машинах редакчу - уж лет 20 этим пользуюсь.

Work700
11-09-2023, 15:38
bredych,
К сожалению Word не находит ^p^p, соответственно ни чего не заменяет

Буду премного благодарен, если проделаете на примере моего файла и затем объясните, как сделали

https://docs.google.com/document/d/1l_mdU2CdKongvSqr9SfbwVw_5jOlFGTN/edit?usp=sharing&ouid=104596126961931280984&rtpof=true&sd=true

a_axe
11-09-2023, 16:25
Work700, попробуйте ^l заменить на пробел.

Кроме того, попробуйте открыть Word, нажать ctrl+o и в диалоге открытия файла указать ваш исходный pdf. Очень сильно зависит от содержимого файла и метода преобразования в pdf, но если он просто сохранен из Word в pdf, то открыться он может с сохранением структуры и таблиц.

Руки все равно придется приложить, но в целом это будет быстрее, чем копировать весь текст и переформатировать.

Work700
11-09-2023, 18:23
a_axe,
Открытие pdf в word помогло, действительно нормально открылось
Спасибо!

bredych
13-09-2023, 11:58
К сожалению Word не находит ^p^p, соответственно ни чего не заменяет »
возможно, у вас разрывы строки ^l, попробуйте их. Обычно абзацы, но случается и так.
с гуглом я не дружу, оттуда ничего скачать не смогу, увы.




© OSzone.net 2001-2012