Fran�ois TOURDE a �crit :
Le 12718i�me jour apr�s Epoch,
[EMAIL PROTECTED] �crivait:


Gestion Electronique de Documents


[...]


1 peu � part, mais pourquoi pas dig ?
http://www.scrounge.org/linux/htdig.html


Si mes souvenirs sont bons, ht://dig est plut�t un collecteur de
documents. Il surfe, enregistre, et je crois m�me qu'il indexe, mais
ce dont j'ai besoin est plus proche d'un m�lange de catalog et de
mnoGoSearch, en gros.

htdig comprend un indexeur de document (rundig) et un moteur de recherche (htsearch). En revanche, je ne sais pas si il est capable d'indexer depuis un syst�me de fichier traditionnel (il faut lui sp�cifier l'url de d�part). Je pense que cela soit �tre possible en utilisant une url de type file:// mais je ne l'ai jamais test�.
Mais il poss�de pleins d'avantages :
- utilisation de parsers externes : dans mon cas, je l'utilise pour indexer des doc M$ Office (xls,ppt,doc), OoO (sxc,sxw,sxi), swf, pdf, sgml, ps, rtf mais aussi png,tiff,jpeg,gif,mp3 et ogg en utilisant les tags. En gros, tu peux indexer n'importe quel type de document � partir du moment o� tu poss�de un programme qui te permet d'afficher le contenu en texte ou html. - Il existe un kit de francisation (version 3.1) qui permet de faire une recherche � la "fran�aise" : mots mal accentu�s, conjugaisons, synonymes.
J'ai fait des paquets debian (non officiels) pour installer tout �a.
Si �a t'int�resse, je te les enverrais.

Mais je vais quand m�me retourner voir l'URL.

Merci en tout cas � tous de vos r�ponses.



Répondre à