Показать полную графическую версию : [решено] Хеш группы чисел
crashtuak
09-05-2013, 22:50
Есть набор групп чисел(допустим, массивы). Необходимо быстро и однозначно найти данные, уникальные для каждой группы. Для такой задачи отлично подходят хеш-карты. Но вот проблема - как вычислить хеш для массива чисел? В данный момент у меня работает такой быдлокод: сортирую массив чисел, байты массива перегоняю в строку, считаю хеш для строки. Может быть есть более быстрое решение?
crashtuak, массив чисел от строки отличается носителем буквы. Допусти это массив 32-разрядных знаковых целых. Тогда можно применить любой алгоритм хеширования, какой придёт в голову. Например:
typedef unsigned long array_hash;
array_hash make_hash(const long *first, const long *last) {
array_hash hash = 0;
for(; first<last; ++first) {hash=(array_hash)(hash*91284645 + *first);}
/*число вбил от балды, желательно нечётное*/
return hash;
}
если процессор 32-разрядный, то использовать array_hash = unsigned long, Если 64-, то array_hash = unsigned long long
Качество хеша - так себе, но есть большая вероятность, что будут отбиваться последовательности с одинаковым началом, что поможет при последующем линейном поиске. Массивы хранить уже сортированными.
crashtuak
10-05-2013, 19:21
pva, спасибо, пробил на имеющихся данных - работает хорошо, повторений не было.
© OSzone.net 2001-2012
vBulletin v3.6.4, Copyright ©2000-2025, Jelsoft Enterprises Ltd.