On Mon, Mar 2, 2020 at 9:46 PM Raf [email protected]
[it-torino-java-jug] <[email protected]> wrote:

>
>
> On Mon, Mar 2, 2020 at 8:22 PM Uberto Barbini [email protected]
> [it-torino-java-jug] <[email protected]> wrote:
>
>>
>>
>> Concettualmente è abbastanza facile farlo a mano :
>> Prendi tutti i campi di testo, li metti insieme e spesso le parole, poi
>> fai stamming per ignorare parole simili e dalla pronuncia uguale, e poi
>> filtri via congiunzioni, articoli e simili.
>>
>
> Concettualmente sì, praticamente ni.
> La difficoltà inizia già dal primo passo: cosa significa spezzare le
> "parole"? Separi sugli spazi? E la punteggiatura? Con i trattini tieni i
> termini uniti o li separi (e-mail o e mail, che poi butterà via la prima
> *e* o email)? L'apostrofo separa due token oppure no (l'amico vs
> Moody's)?  Potrei continuare per ore... :)
>
> Per esperienza, sconsiglierei caldamente il fai da te sulla ricerca
> full-text. Soprattutto se devi (o pensi in futuro di dover) gestire più
> lingue!
>

Sembri una che ne sa.
Hai lavorato recentemente con Lucene?
ahahahahahah

-- 
Roberto Franchini
"The impossible is inevitable"
https://github.com/robfrank/
https://twitter.com/robfrankie
https://www.linkedin.com/in/robfrank

Reply via email to