PDA

Показать полную графическую версию : [решено] HTML/PDF-Документ. Как удалить ненужную "инфу" при помощи notepad++


flev45
13-05-2019, 10:51
Столкнулся с проблемой удаления "лишней" инфы из документа. В моём случае это покупки и продажи через ПайПал.
В другой теме вышел на то, что переводы в другие форматы и удаление при помощи текстовых редакторов невозможно.
Кому интересна пред.история: http://forum.oszone.net/thread-340480-2.html
Там же вышел на такой алгоритм, который должен сработать:
В моём случае, чтобы легче было ориентироваться и удалять "области" в html редакторе, алгоритм должен быть такой:
1. Перевод HTML to PDF
2. PDF to ABBYY FineReader 11
3. При помощи функции "Ластик" удаляем со страниц всё лишнее
4. Полученный PDF to HTML
5. В HTML удаляем эти пустые области в редакторе
6. Полученный HTML переводим в PDF
Всё. Я должен получить PDF, в моём случае документ "Продажи", без инфы (строк) по покупкам.
Главный вопрос: какой лучший HTML редактор для этих целей?
Если это notepad++, то как выглядят эти "пустые области" и можно ли их удалить "групповым" способом? Спасибо.
ПС: прикреплённый PDF (рабочий файл) уже прошёл обработку по п. 1 - 3.

Iska
13-05-2019, 17:23
flev45, в Вашем случае алгоритм может быть таков:

устанавливаете Mozilla Firefox;
устанавливаете какое-нибудь расширение наподобие Page Hacker (https://addons.mozilla.org/en-US/firefox/addon/page-hacker/);
открываете страницу;
редактируете её;
сохраняете/распечатываете в pdf.


Либо:

открываете страницу в браузере;
копируете содержимое в буфер обмена;
вставляете в документ Microsoft Word;
редактируете его;
сохраняете/распечатываете в pdf.


А описанное Вами уж очень напоминает старое выражение, уж простите, «Удаление гланд через заднепроходное отверстие».

frous
10-06-2019, 23:59
Прикольно, оджнозначно в закладжки




© OSzone.net 2001-2012