Показать полную графическую версию : поиск уникальных файлов
Foreigner
30-05-2020, 22:08
с символическими ссылками тоже возможны коллизии
greg zakharov
30-05-2020, 22:33
Если dummy.txt ссылается на dummy.exe, понятное дело хэши совпадут (причем не только SHA-256, можно браться за любой алгоритм, хоть даже KECCAK), так как обрабатываться будет не ссылка как таковая, а конечный объект ФС, - это не коллизия. Чтобы получить хэш самой ссылки, вам придется обратиться к потокам.
DJ Mogarych
31-05-2020, 15:58
Хоба! »
Ещё раз: в данном случае это несущественно, потому что, помимо хэша, сравнение идёт и по именам файлов, и по их размеру. В вашем примере файлы неодинаковы по всем параметрам, кроме хэша.
greg zakharov
31-05-2020, 17:20
это несущественно, потому что, помимо хэша, сравнение идёт и по именам файловЕще раз перечитайте название темы, также перечитайте мои прежние сообщения, дабы уяснить что имя файла - в грубом округлении, - метка для идентификации последовательности байтов, также как и количество байтов не является уникальной величиной. Вы прямо как Иринушка из рассказа Пантелеева "Буква 'ты'".
DJ Mogarych
31-05-2020, 20:14
Также и вы уясните, что в данном случае речь идёт об одновременном сравнении двух или трёх параметров, которые, не являясь уникальными по отдельности, вместе дают достаточную точность.
greg zakharov
31-05-2020, 20:37
DJ Mogarych, популярно, на пальцах. Допустим, есть три файла с названием dummy с одинаковым размером. В вашем понимании файлы являются просто дубликатами, однако, заглянув в содержимое, вы вдруг обнаруживаете различный порядок байтов. Потенциально хэши (если речь о SHA256) будут различны и потому такие файлы можно считать уникальными, они не будут удалены. А теперь представьте кучу разных файлов с разными именами, но одинаковым содержимом разбросанные по папкам. Будут ли они уникальны? Ответ - нет. Почему? Уникальностью называют содержимое, а не внешние факторы. Вы же не станете утверждать, что каждый человек уникален по-своему лишь потому, что он или она - человек?! Говоря об уникальности, вы разумеете содержание.
Удачи вам в ваших заблуждениях.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.