Salut,

Frédéric Glorieux wrote:

pour moi, un index doit contenir "Architecture -- Bâtiment cultuel -- Église", c'est au code à rendre (ou ne pas rendre) le terme à ceux qui cherchent "église".

Je ne suis pas d'accord : on parle de l'index, la chose qui apporte de la performance *en dernier ressort* : si on négocie, on la perd ipso facto.

Autant je suis d'accord avec toi sur ce type d'analyse lors d'une expansion de requête, autant je pense que si l'on cherche à récolter ce qu'il y a dans l'index, on doit aller vite.

Pour moi, un index Lucene est une source de données, au même titre qu'une base SQL.

Mmmh... As-tu un accès direct à test index SQL ? IMHO, on se trompe de cible. Si on veut des listes de termes cherchables, autant définir une autre base de documents et l'alimenter en greffant un pipeline lors de l'indexation du document "maître"... en n'oubliant pas de déclarer les terms commes des documents attachés, bien sûr. Bien sûr, ce pipeline peut faire des tas de manipulations... ou pas : garder la casse par exemple.

Mmmmh... <sdx:term> va carrément dans l'IndexReader et, de là, il peut renvoyer une TermDocs. A partir de là, on peut combiner (plus facile à écrire qu'à coder, je sais :-)

J'ai l'impression que c'est ce que fait fr.gouv.culture.sdx.search.lucene.query.Terms ?

Oui et non car il applique une seule et unique logique : un filtrage. Les requêtes standards permettent, elles, de combiner les requêtes de façon personnalisée.

A+

--
Pierrick Brihaye, informaticien
Service régional de l'Inventaire
DRAC Bretagne
mailto:[EMAIL PROTECTED]
+33 (0)2 99 29 67 78


_______________________________________________
sdx-users mailing list
[email protected]
http://lists.nongnu.org/mailman/listinfo/sdx-users

Répondre à