On Fri, 14 Jan 2005 10:30:06 +0100, Jean-Max Reymond wrote
> bonjour,
> Je viens de regarder un petit peu tous les outils commerciaux (et
> gratuits) de recherche d'information sur disque dur comme Copernic,
> Google Desktop search, etc et je m'interrogeais sur la disponibilité
> de tels outils en Open Source. Pour ma part, je fus longtemps
> satisfait de glimpse qui était un vrai bonheur pour se promener dans
> les sources d'AIX (uniquement des fichiers textes). Hélas, ce produit
> n'était pas libre, est devenu payant avant de repasser gratuit mais
> semble t'il toujours pas libre. Alors, est ce que quelqu'un
> utiliserait un outil permettant d'aller dans les mp3, les OpenOffice,
> fichiers HTML, etc et tout ceci sous notre linux favori ?

Salut,

Pour du desktop search, je ne connais pas trop. Ces outils recents indexent
tout ce qui passe entre tes mains, y compris les emails et leurs pieces 
attachees.

Par contre, en trichant un peu, j'utilise avec satisfaction htdig
(http://www.htdig.org/) dans un cadre professionnel.
J'ai mis en place un serveur web (Linux + Apache bien sur), ou je place tout
ce qu'il y a a indexer : quelques docs aux formats HTML et PDF, des tonnes de
fichiers textes, des exports de fichiers outolook .pst au format mbox, etc.
Le tout doit etre navigable par un robot, c'est le comportement d'htdig.
L'indexation n'est pas permanente, il faut la lancer (je le fait tous les
week-end dans un cron).
Dans mon script d'indexation, nous avons plusieurs routines de recuperation
d'information ici et la, ou de traitement (conversion entre differents
formats). Certains des documents indexes, aux formats PDF, DOC, PPT, etc.,
sont mis par les personnes de l'equipe directement sur le serveur, par un
Share Samba.

Yann
-- 
___________________________________________________________________
     Yann Cochard, [EMAIL PROTECTED], http://yanncochard.com/
         Au Cactus Francophone : http://www.cactuspro.com/

Linux-Azur :      http://www.linux-azur.org
Désinscriptions: http://www.linux-azur.org/liste.php3
**** Pas de message au format HTML, SVP ****

Répondre à