Fran�ois TOURDE a �crit :
Le 12718i�me jour apr�s Epoch,
[EMAIL PROTECTED] �crivait:
Gestion Electronique de Documents
[...]
1 peu � part, mais pourquoi pas dig ?
http://www.scrounge.org/linux/htdig.html
Si mes souvenirs sont bons, ht://dig est plut�t un collecteur de
documents. Il surfe, enregistre, et je crois m�me qu'il indexe, mais
ce dont j'ai besoin est plus proche d'un m�lange de catalog et de
mnoGoSearch, en gros.
htdig comprend un indexeur de document (rundig) et un moteur de
recherche (htsearch).
En revanche, je ne sais pas si il est capable d'indexer depuis un
syst�me de fichier traditionnel (il faut lui sp�cifier l'url de d�part).
Je pense que cela soit �tre possible en utilisant une url de type
file:// mais je ne l'ai jamais test�.
Mais il poss�de pleins d'avantages :
- utilisation de parsers externes : dans mon cas, je l'utilise pour
indexer des doc M$ Office (xls,ppt,doc), OoO (sxc,sxw,sxi), swf, pdf,
sgml, ps, rtf mais aussi png,tiff,jpeg,gif,mp3 et ogg en utilisant les
tags. En gros, tu peux indexer n'importe quel type de document � partir
du moment o� tu poss�de un programme qui te permet d'afficher le contenu
en texte ou html.
- Il existe un kit de francisation (version 3.1) qui permet de faire une
recherche � la "fran�aise" : mots mal accentu�s, conjugaisons, synonymes.
J'ai fait des paquets debian (non officiels) pour installer tout �a.
Si �a t'int�resse, je te les enverrais.
Mais je vais quand m�me retourner voir l'URL.
Merci en tout cas � tous de vos r�ponses.