On Mon, Aug 11, 2003 at 08:56:52 +0200, Nicolas Ledez wrote: > Dans index, il falait bien comprendre : > J'ai un paquet de fichiers (je simplifie) et quand je lance en > grep-index�, il me trouve plus facillement les r�sultats.
sauf qu'on ne fait pas un grep, car un grep, �a rame. Il faudrait un algo par arbre de recherche ou similaire, et dans l'id�al indexer tous les suffixes des textes (et pouvoir faire une recherche par pr�fixe). Enfin, quelque chose du genre. Pour namazu2, il semble qu'il soit assez mauvais: d'apr�s la doc, on ne peut rechercher rapidement que des mots complets. > Si c'est rechercher dans les ent�tes, l'index est relativement facile � > faire. Mais quand il faut chercher dans le corps du message ? A-t-on > vraiment un gain en utilisant un index ? Sans index, c'est en temps lin�aire en fonction de la taille totale des documents (e.g. 100 Mo pour mes archives de mail). Avec un bon index (mais qui risque de prendre de la place), �a se fait en temps constant (en fait, en temps lin�aire en fonction de la longueur du terme recherch�). Il y a certainement un compromis entre ces deux solutions pour avoir un index qui ne prend pas �norm�ment de place et une recherche assez rapide (de l'ordre de la seconde). -- Vincent Lef�vre <[EMAIL PROTECTED]> - Web: <http://www.vinc17.org/> - 100% validated (X)HTML - Acorn Risc PC, Yellow Pig 17, Championnat International des Jeux Math�matiques et Logiques, TETRHEX, etc. Work: CR INRIA - computer arithmetic / SPACES project at LORIA

