Muchas gracias, voy a revisarlo para ver que tal.
Saludos,
M.Sc. Ing. Esneiker Enriquez Cabrera
Esp. B en Ciencias Informáticas
Desoft en Ciego de Ávila. Joaquín de Aguero esq. Calle 2. Ciego de Ávila. Cuba.
Telf.: 266200 Ext 119, email.: [email protected]
<mailto:[email protected]>
De: Eduardo Arenas C. [mailto:[email protected]]
Enviado el: martes, 13 de noviembre de 2018 14:24
Para: [email protected]
Asunto: Re: Duda en consolidación de información
Esneiker,
Entonces https://www.openempi.org/ te sirve ya que contiene algoritmos
automatizados y semi automatizados para des duplicar personas entregando un ID
único que luego puedes manejar en todos sistemas. Quizás es muy específicos
para salud y ahí tendrías que buscar otro para el área de negocio que manejas,
sino ver si puedes incorporar las reglas de negocio basadas en el caso que
quieres trabajar, o al menos intentar descubrir la lógica que hay detrás de un
Maestro de Personas y sus algoritmos de des duplicación para hacer un
desarrollo local.
pero creo que esto ya se sale un poco de esta lista de correos sobre
postgresql, salvo que quieras implementar algún algoritmo basado tsearch2, y
correctores ortográficos basados en postgresql como esto
https://www.postgresql.org/docs/9.1/fuzzystrmatch.html que te permiten comprar
palabras que están mal escritas o que el sonido de la pronunciación es similar
pero que están escritas de otra forma para determinar si son la misma, ejemplo
para comparar nombres, domicilios, etc... y determinar si dos personas son o
parecen ser la misma persona.
Saludos
Eduardo
El mar., 13 de nov. de 2018 a la(s) 13:49, Esneiker Enriquez Cabrera
([email protected] <mailto:[email protected]> ) escribió:
Muchas gracias a todos los que me han ayudado con sus sugerencias. Respondiendo
a algunas cuestiones que no dejé claras, el número de clientes registrados está
en más de 4 millones y en bases de datos diferentes, por supuesto hay muchos
metadatos que habría que analizar tales como nombre, dirección, etc. Imaginen
una empresa de servicios que tenga varios sistemas independientes y en cada uno
de ellos se registran los clientes, pero en cada uno se pueden registrar con
incongruencias. Ese es el escenario.
Saludos,
M.Sc. Ing. Esneiker Enriquez Cabrera
Esp. B en Ciencias Informáticas
Desoft en Ciego de Ávila. Joaquín de Aguero esq. Calle 2. Ciego de Ávila. Cuba.
Telf.: 266200 Ext 119, email.: [email protected]
<mailto:[email protected]>
--
Eduardo Arenas
+56 9 6629 1618