Имя пользователя:
Пароль:  
Помощь | Регистрация | Забыли пароль?  | Правила  

Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » Разное - Как в файле Word найти дубликаты наборов символов (кусков текста)

Ответить
Настройки темы
Разное - Как в файле Word найти дубликаты наборов символов (кусков текста)

Пользователь


Сообщения: 58
Благодарности: 1

Профиль | Сайт | Отправить PM | Цитировать


Изменения
Автор: sl.oleg@fb
Дата: 20-11-2016
Здравствуйте.
Подскажите, кто знает:
Как в файле Word найти дубликаты наборов символов (кусков текста) с минимальной длиной, заданной в качестве параметра. Сами наборы символов не задаются - они программно обнаруживаются в тексте, ограничиваясь лишь их минимальной длиной.
Возьмем для примера такой тест:

"Мой дядя самых честных правил,
Когда не в шутку занемог,
Он уважать себя заставил
И лучше выдумать не мог самых честных.
Его пример другим наука;
Но, боже мой, какая скука
С больным сидеть и день и ночь,
самых честных Не отходя ни шагу прочь!"

В качестве параметра минимальной длины набора совпадающих символов примем например 10.
Тогда программа должна найти и указать (подсветкой или еще как-то) три вхождения "самых чест" (отмечены жирным шрифтом на примере).
Если таких дубликатов (разных дубликатов имеется ввиду) будет несколько, то программа должна сначала показать их список, а потом, когда пользователь выберет интересующее его текст дубликата, показать в общем тексте все его вхождения (напр.все тем же цветом). Далее можно посмотреть второй набор дубликатов и т.д.
Существуют ли в природе такие программы?

Отправлено: 15:30, 20-11-2016

 

Пользователь


Сообщения: 58
Благодарности: 1

Профиль | Сайт | Отправить PM | Цитировать


Цитата Iska:
мы так и не увидели даже образца с текстом, ничего не услышали про его объёмы. »
Объем неархивированного текста - от 100 кБ до 1 МБ, образец - возьмите напр.любой текст из статей в интернете с данным объемом. Поиск дублей может понадобится - от поиска 10 символов (включая точки, запятые, пробелы и знаки конца абзаца (перевод каретки)) до 30-50 символов.

Отправлено: 16:20, 26-11-2016 | #21



Для отключения данного рекламного блока вам необходимо зарегистрироваться или войти с учетной записью социальной сети.

Если же вы забыли свой пароль на форуме, то воспользуйтесь данной ссылкой для восстановления пароля.


Ветеран


Сообщения: 27449
Благодарности: 8087

Профиль | Отправить PM | Цитировать


sl.oleg@fb, я не стану брать «напр.любой текст из статей в интернете с данным объемом». Я жду от Вас образец реального файла.

Отправлено: 07:18, 02-12-2016 | #22


Пользователь


Сообщения: 58
Благодарности: 1

Профиль | Сайт | Отправить PM | Цитировать


Цитата Iska:
я не стану брать «напр.любой текст из статей в интернете с данным объемом». Я жду от Вас образец реального файла. »
Это женский каприз?

Отправлено: 23:21, 02-12-2016 | #23



Компьютерный форум OSzone.net » Сфера Microsoft » Microsoft Office (Word, Excel, Outlook и т.д.) » Разное - Как в файле Word найти дубликаты наборов символов (кусков текста)

Участник сейчас на форуме Участник сейчас на форуме Участник вне форума Участник вне форума Автор темы Автор темы Шапка темы Сообщение прикреплено

Похожие темы
Название темы Автор Информация о форуме Ответов Последнее сообщение
CMD/BAT - [решено] в файле найти дату, скопировать символы, дописать перед символами в другом файле sucher Скриптовые языки администрирования Windows 7 10-03-2016 17:42
VBS/WSH/JS - [решено] Замена определённых символов и вставка текста. aggressor_ Скриптовые языки администрирования Windows 9 29-05-2012 15:06
CMD/BAT - Как проверить наличие текста в файле mamont1 Скриптовые языки администрирования Windows 6 16-09-2010 16:32
[решено] Найти и заменить в текстовом файле. Как? Pozia AutoIt 15 11-03-2010 19:12
Разное - Различные кодировки символов в одном файле EvgeniyQQQ Программирование и базы данных 3 21-05-2009 06:49




 
Переход