Io mi son trovato molto bene con ElasticSearch.
L’obiettivo era quello di effettuare una ricerca di un soggetto anagrafico
all’interno di una serie di liste sanction ( criminali, politici ecc.. )
per valutarne il rischio. La ricerca viene fatta per nome, cognome, ragione
sociale, località nascita e anno o data di nascita ed altri campi. Il
nostro problema è che ognuno di questi dati poteva essere un po’ ovunque
perché sono liste diverse tra loro e contengono estratti di articoli di
giornale e molti nomi sono molto stile arabo.

Facilissima integrazione con le API per Java, accessibili anche via REST
direttamente.
Per ora gira su un nodo solo ma nel caso dovessimo incrementare il volume
delle ricerche o la quantità di dati sappiamo già che possiamo scalare
orizzontalmente.

Forse è un po’ complessa la struttura delle query che è possibile fare ma
lo abbiamo trovato molto ben documentato e ci ha salvato la vita :)



Il giorno mar 3 mar 2020 alle 23:05 Uberto Barbini [email protected]
[it-torino-java-jug] <[email protected]> ha scritto:

>
>
> Mah no, noi siamo andati in produzione con quello e funzionava bene per un
> CMS.
>
> Uberto
>
> On Tue, 3 Mar 2020 at 18:00, Matteo Vaccari [email protected]
> [it-torino-java-jug] <[email protected]> wrote:
>
>>
>>
>>
>>
>> On Mon, Mar 2, 2020 at 8:22 PM Uberto Barbini [email protected]
>> [it-torino-java-jug] <[email protected]> wrote:
>>
>>>
>>>
>>> Concettualmente è abbastanza facile farlo a mano :
>>> Prendi tutti i campi di testo, li metti insieme e spesso le parole, poi
>>> fai stamming per ignorare parole simili e dalla pronuncia uguale, e poi
>>> filtri via congiunzioni, articoli e simili.
>>>
>>>
>> stai scherzando vero? :-D
>>
>> 
>
-- 
Response to : [email protected]

Reply via email to