Euler, na pratica nao sei como ele faz o calculo. Eu tinha uma rotina de calculo de similaridade, baseado no algoritimo ssnc, que da um peso para a comparacao baseado em janelas de caracteres. Nesse caso, eu ia comparando janelas de textos (ex.: rato roeu a roupa... tem 4 palavras, entao, ia verificando a similaridade em janelas com 4 palavras no texto). A janela que me desse a maior similaridade era aceita. Nesse caso, acho que terei que adotar a mesma tecnica, para identificar qual parte do texto foi responsavel pelo valor retornado. Eu preciso disso, pq eu preciso grifar o texto na hora de apresentar pro usuario.
>________________________________ > De: Euler Taveira <[email protected]> >Para: Comunidade PostgreSQL Brasileira <[email protected]> >Enviadas: Sexta-feira, 11 de Maio de 2012 7:07 >Assunto: Re: [pgbr-geral] Questao sobre operador <-> > >On 10-05-2012 21:29, Jean Domingues wrote: >> Pessoal, muito legal o novo operador <-> (extenção pg_trgm), funcionando >> junto >> com os indices gist. Se alguém souber me dizer, gostaria de saber se tem como >> eu saber a posição do texto no campo onde a maior similaridade foi >> encontrada. >> Por exemplo: >> >> texto: o rato roeu a roupa do rei de roma >> texto pesquisado: roupa do reu >> select 'roupa do reu' <-> 'o rato roeu a roupa do rei de roma' >> resultado: 0,789488 (por exemplo) >> >> Mas em que posição? >> >O cálculo é global. Ele usa o número de trigramas comuns e a quantidade total >deles para fazer o cálculo da similaridade. Vide contrib/pg_trgm/trgm_op.c -> >cnt_sml(). > > >-- > Euler Taveira de Oliveira - Timbira http://www.timbira.com.br/ > PostgreSQL: Consultoria, Desenvolvimento, Suporte 24x7 e Treinamento >_______________________________________________ >pgbr-geral mailing list >[email protected] >https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral > > >
_______________________________________________ pgbr-geral mailing list [email protected] https://listas.postgresql.org.br/cgi-bin/mailman/listinfo/pgbr-geral
