Felipe de Jesús Molina Bravo escribió:
> Que tal lista
> 
> Tengo postgresql 9.1.3 y con la configuracion a español del tsearch.
> 
> Al ejecutar:
> 
> des=# select strip(to_tsvector('spanish', 'Mujer'));
>  strip
> -------
>  'muj'
> (1 fila)

Esto a mí me parece un fallo en el stemmer.  Me imagino que se elimina
el "er" porque es una de las terminaciones verbales (-ar, -er, -ir).
Ignoro hasta qué punto el stemmer toma en cuenta las posibles
excepciones, pero si lo hace, a mí me parece claro que ésta debería
considerarse.

Postgres se apoya en el lenguaje Snowball para estas tareas. El
algoritmo para español está descrito en
http://snowball.tartarus.org/algorithms/spanish/stemmer.html y me parece
claro que esto ocurre, erróneamente, en el paso 2b.

Si te sientes con energía podrías tratar de contactar la lista
snowball-discuss y discutir el asunto.

-- 
Álvaro Herrera                http://www.2ndQuadrant.com/
PostgreSQL Development, 24x7 Support, Training & Services

-
Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org)
Para cambiar tu suscripción:
http://www.postgresql.org/mailpref/pgsql-es-ayuda

Responder a