Re: Вопрос по встроенной функции HASH()

Roman Yaroshenko Tue, 04 Oct 2011 23:39:34 -0700

05.10.2011 6:28, Андрей Кручинин пишет:

Выдаст наличие совпадений по значению хеша, хотя строки все отличаются.
Я понимаю, что вероятность совпадения значений хеша при разных входных
данных допускается, но не такая же большая.


Ну есть два варианта:

1. Добей пробелами до определенной длины.

2. Забей на хеши - справочник медикаментов не настолько большой чтобы
дать реальное ускорение с использованием хеша. Сам юзаю MD5, но он имеет
смысл только в синтаксическом разборе, а не в прямом поиске. А прямой
поиск тупо делается на индексах по строкам. Даже при моих объемах
тормозов особенных не замечено (а объемы поболее чем даже аптечная сеть
:-) )

Наши объемы - это все зарегистрированные лек. средства Украины. :)

В наших проектах уже давно используем SHA1, - совпадений пока незамечал. Просто с появлением встроенной функции HASH решили еепопробовать, но в результате получилось хуже. Все-таки будемиспользовать классический поиск и группировку по индексам на значениястрок, а не по хешу.


--
Роман Ярошенко
http://www.morion.ua

Re: Вопрос по встроенной функции HASH()

Ответить