"Константин"
BA> была у меня такая фигня ЕГРН называлась
а по русски ? ^^^^
Единый Государственный Реестр Налогоплательщиков
BA> решилось введением понятия "весовой коэфф совпадения"
А вот сдесь поподробней, пожалуйста ...
задача - набор объектов налогообложения с произвольным составом атрибутов и
возможностью изменения любого из них
поиск дубликатов, наличие нескольких ИНН и пр.
совпадение по 10 атрибутам из 20 возможных - коэфф 10
инспектора сначала отбирали очевидные результаты, потом начали уменьшать
коэфф совпадений.
при этом приходили новые данные (коррекция фамилий, имен, дат рождения, ИНН)
объем - около 1 млн объектов + 20 (в среднем) значений атрибутов, есс-но с
историей
BA> хранение данных:
{Skip}
BA> поиск:
BA> select ID
BA> where (ID_атрибута = :искомый атрибут and
BA> значение_атрибута = :искомое значение) or | далее по кругу
Тут всё понятно, НО! Непонятно только одно таким образом ты
найдёшь если ID ЛЮБОЕ из полей попадает под условие, а мне
в данном случае надо найти если ВСЕ поля воответствуют
заданным условиям ... Или я что-то проглядел ?
задаю , допустим, 5 атрибутов и пять значений к ним, интересуюсь всем, что
имеет кол-во совпадений 4 и больше
да, если еще не дошло: полей всего 2 - ID типа атрибута и его значение (на
самом деле есть - документ-основание, признак актуальности и дата появления)
таким образом может быть несколько фамилий (только одна актуальная),
несколько ИНН - все актуальные
--
Булычев Алексей
http://www.stella-npf.ru
--~--~---------~--~----~------------~-------~--~----~
-~----------~----~----~----~------~----~------~--~---