Felipe de Jesús Molina Bravo escribió: > Que tal lista > > Tengo postgresql 9.1.3 y con la configuracion a español del tsearch. > > Al ejecutar: > > des=# select strip(to_tsvector('spanish', 'Mujer')); > strip > ------- > 'muj' > (1 fila)
Esto a mí me parece un fallo en el stemmer. Me imagino que se elimina el "er" porque es una de las terminaciones verbales (-ar, -er, -ir). Ignoro hasta qué punto el stemmer toma en cuenta las posibles excepciones, pero si lo hace, a mí me parece claro que ésta debería considerarse. Postgres se apoya en el lenguaje Snowball para estas tareas. El algoritmo para español está descrito en http://snowball.tartarus.org/algorithms/spanish/stemmer.html y me parece claro que esto ocurre, erróneamente, en el paso 2b. Si te sientes con energía podrías tratar de contactar la lista snowball-discuss y discutir el asunto. -- Álvaro Herrera http://www.2ndQuadrant.com/ PostgreSQL Development, 24x7 Support, Training & Services - Enviado a la lista de correo pgsql-es-ayuda (pgsql-es-ayuda@postgresql.org) Para cambiar tu suscripción: http://www.postgresql.org/mailpref/pgsql-es-ayuda