Io mi son trovato molto bene con ElasticSearch. L’obiettivo era quello di effettuare una ricerca di un soggetto anagrafico all’interno di una serie di liste sanction ( criminali, politici ecc.. ) per valutarne il rischio. La ricerca viene fatta per nome, cognome, ragione sociale, località nascita e anno o data di nascita ed altri campi. Il nostro problema è che ognuno di questi dati poteva essere un po’ ovunque perché sono liste diverse tra loro e contengono estratti di articoli di giornale e molti nomi sono molto stile arabo.
Facilissima integrazione con le API per Java, accessibili anche via REST direttamente. Per ora gira su un nodo solo ma nel caso dovessimo incrementare il volume delle ricerche o la quantità di dati sappiamo già che possiamo scalare orizzontalmente. Forse è un po’ complessa la struttura delle query che è possibile fare ma lo abbiamo trovato molto ben documentato e ci ha salvato la vita :) Il giorno mar 3 mar 2020 alle 23:05 Uberto Barbini [email protected] [it-torino-java-jug] <[email protected]> ha scritto: > > > Mah no, noi siamo andati in produzione con quello e funzionava bene per un > CMS. > > Uberto > > On Tue, 3 Mar 2020 at 18:00, Matteo Vaccari [email protected] > [it-torino-java-jug] <[email protected]> wrote: > >> >> >> >> >> On Mon, Mar 2, 2020 at 8:22 PM Uberto Barbini [email protected] >> [it-torino-java-jug] <[email protected]> wrote: >> >>> >>> >>> Concettualmente è abbastanza facile farlo a mano : >>> Prendi tutti i campi di testo, li metti insieme e spesso le parole, poi >>> fai stamming per ignorare parole simili e dalla pronuncia uguale, e poi >>> filtri via congiunzioni, articoli e simili. >>> >>> >> stai scherzando vero? :-D >> >> > -- Response to : [email protected]
