On Mon, Mar 2, 2020 at 9:46 PM Raf [email protected] [it-torino-java-jug] <[email protected]> wrote:
> > > On Mon, Mar 2, 2020 at 8:22 PM Uberto Barbini [email protected] > [it-torino-java-jug] <[email protected]> wrote: > >> >> >> Concettualmente è abbastanza facile farlo a mano : >> Prendi tutti i campi di testo, li metti insieme e spesso le parole, poi >> fai stamming per ignorare parole simili e dalla pronuncia uguale, e poi >> filtri via congiunzioni, articoli e simili. >> > > Concettualmente sì, praticamente ni. > La difficoltà inizia già dal primo passo: cosa significa spezzare le > "parole"? Separi sugli spazi? E la punteggiatura? Con i trattini tieni i > termini uniti o li separi (e-mail o e mail, che poi butterà via la prima > *e* o email)? L'apostrofo separa due token oppure no (l'amico vs > Moody's)? Potrei continuare per ore... :) > > Per esperienza, sconsiglierei caldamente il fai da te sulla ricerca > full-text. Soprattutto se devi (o pensi in futuro di dover) gestire più > lingue! > Sembri una che ne sa. Hai lavorato recentemente con Lucene? ahahahahahah -- Roberto Franchini "The impossible is inevitable" https://github.com/robfrank/ https://twitter.com/robfrankie https://www.linkedin.com/in/robfrank
