05.10.2011 6:28, Андрей Кручинин пишет:
Выдаст наличие совпадений по значению хеша, хотя строки все отличаются.
Я понимаю, что вероятность совпадения значений хеша при разных входных
данных допускается, но не такая же большая.
Ну есть два варианта:
1. Добей пробелами до определенной длины.
2. Забей на хеши - справочник медикаментов не настолько большой чтобы
дать реальное ускорение с использованием хеша. Сам юзаю MD5, но он имеет
смысл только в синтаксическом разборе, а не в прямом поиске. А прямой
поиск тупо делается на индексах по строкам. Даже при моих объемах
тормозов особенных не замечено (а объемы поболее чем даже аптечная сеть
:-) )
Наши объемы - это все зарегистрированные лек. средства Украины. :)
В наших проектах уже давно используем SHA1, - совпадений пока не
замечал. Просто с появлением встроенной функции HASH решили ее
попробовать, но в результате получилось хуже. Все-таки будем
использовать классический поиск и группировку по индексам на значения
строк, а не по хешу.
--
Роман Ярошенко
http://www.morion.ua