05.10.2011 6:28, Андрей Кручинин пишет:
Выдаст наличие совпадений по значению хеша, хотя строки все отличаются.
Я понимаю, что вероятность совпадения значений хеша при разных входных
данных допускается, но не такая же большая.

Ну есть два варианта:

1. Добей пробелами до определенной длины.

2. Забей на хеши - справочник медикаментов не настолько большой чтобы
дать реальное ускорение с использованием хеша. Сам юзаю MD5, но он имеет
смысл только в синтаксическом разборе, а не в прямом поиске. А прямой
поиск тупо делается на индексах по строкам. Даже при моих объемах
тормозов особенных не замечено (а объемы поболее чем даже аптечная сеть
:-) )

Наши объемы - это все зарегистрированные лек. средства Украины. :)
В наших проектах уже давно используем SHA1, - совпадений пока не замечал. Просто с появлением встроенной функции HASH решили ее попробовать, но в результате получилось хуже. Все-таки будем использовать классический поиск и группировку по индексам на значения строк, а не по хешу.

--
Роман Ярошенко
http://www.morion.ua

Ответить