"Константин"

BA> была у меня такая фигня ЕГРН называлась
    а по русски ?           ^^^^

Единый Государственный Реестр Налогоплательщиков

BA> решилось введением понятия "весовой коэфф совпадения"
    А вот сдесь поподробней, пожалуйста ...

задача - набор объектов налогообложения с произвольным составом атрибутов и 
возможностью изменения любого из них
поиск дубликатов, наличие нескольких ИНН и пр.

совпадение по 10 атрибутам из 20 возможных - коэфф 10

инспектора сначала отбирали очевидные результаты, потом начали уменьшать 
коэфф совпадений.
при этом приходили новые данные (коррекция фамилий, имен, дат рождения, ИНН)

объем - около 1 млн объектов + 20 (в среднем) значений атрибутов, есс-но с 
историей

BA> хранение данных:
{Skip}

BA> поиск:

BA> select ID
BA> where (ID_атрибута = :искомый атрибут and
BA>            значение_атрибута = :искомое значение) or  | далее по кругу

    Тут всё понятно, НО! Непонятно только одно таким образом ты
    найдёшь если ID ЛЮБОЕ из полей попадает под условие, а мне
    в данном случае надо найти если ВСЕ поля воответствуют
    заданным условиям ... Или я что-то проглядел ?


задаю , допустим, 5 атрибутов и пять значений к ним, интересуюсь всем, что 
имеет кол-во совпадений 4 и больше

да, если еще не дошло: полей всего 2 - ID типа атрибута и его значение (на 
самом деле есть - документ-основание, признак актуальности и дата появления)

таким образом может быть несколько фамилий (только одна актуальная), 
несколько ИНН - все актуальные



-- 
Булычев Алексей
http://www.stella-npf.ru



--~--~---------~--~----~------------~-------~--~----~
-~----------~----~----~----~------~----~------~--~---

Ответить