![]() |
Программа для поиска дублей с кириллическими именами
В хранилище (8 Гб размером) имеется большое количество файлов (средний размер файла 500 Кб) с расширениями doc, fb2, rtf. Задача: Подсказать программу, способную найти дубли (которые точно там имеются). Утилиты, перечисленные здесь http://www.oszone.net/5896/, а также соответствующий модуль Auslogics практически бесполезны, т.к. имена всех файлов на русском и они их не воспринимают. Единственно DupKiller через пень-колоду нашел отдельные дубли (ручная проверка тогда еще объема в 1 Гб показала, что найдено всего около 30% дублей, включая и ложные срабатывания).
|
gorill, странно, что те программы не работают. Могу написать свой велосипед - обращайтесь в скайп apozlevich.
|
Цитата:
![]() |
Угу. Сам пользую CloneSpy. Либо у автора особое представление о дубликатах, либо что-то с настройками.
|
Цитата:
Цитата:
Цитата:
Если кто-то думает, что я создал тему от нечего делать, тот может пойти покурить, ибо эта проблема достала по самое немогу- место в хранилище ограничено, поэтому вопрос дублей стоит остро. Как происходит : Работаю с файлами, вот случайно обнаруживаю два дубля, и еще два другого файла и т.д. Запускаю утилиты НЕ УДАЛЯЯ случайно найденных и получаю в ответ, что дублей не найдено. Даже тех, что я вижу перед собой. |
|
Цитата:
Цитата:
|
Цитата:
2. Каким образом Вы сами определяете, что это дубликаты? |
Цитата:
Цитата:
Цитата:
|
Цитата:
Если есть два файла один в djvu, а другой в пдфе и оба содержат одинаковый скан одного и того же документа. Пример 2 Допустим имеем 2 документа отсканенные в разном разрешении в пдф, но названные одинаково и положенные в разные папки. С точки зрения человека - информация в этих фалах одинаковая. С точки зрения "компьютера" - нет. Просто фраза про Цитата:
10 % файлов с неодинаковым размером не дубликаты. Одинаковое имя - вообще не признак. |
Цитата:
Выложите несколько пар таких файлов с кириллическими именами, которые, по Вашему мнению заведомо одинаковые, но которые приложения из указанного списка (Программы для поиска дубликатов файлов) не определяют, как дубликаты. |
Проблема решена и корень ее был, весьма вероятно, в службе индексирования Windows. Описание вероятного решения здесь: http://forum.oszone.net/post-2117767-195.html
|
Время: 19:31. |
Время: 19:31.
© OSzone.net 2001-