Bonsoir Philippe,
Le 17/12/2014 18:32, Philippe CLEMENT a écrit :
Le 17/12/2014 18:11, Bernard Ribot a écrit :
Bonjour Philippe,
Je l'avais essayé il y a longtemps et n'avais pas été convaincu, mais
j'avoue ne plus me souvenir pour quelle(s) raison(s).
Ce que j'apprécie dans DocFetcher, outre sa rapidité et sa simplicité
, c'est son langage de requête :
- support des opérateurs logiques : AND, OR, NOT,
- recherche d'expressions / phrases
- recherche de mots proches (à une certaine distance dans le texte)
d'un mot donné
- recherche de mots similaires à un mot donné (recherche floue),
- support des caractères de substitution ? *
- rechercha dans certaines meta-don/nées : ///filename, title, author
ou subject, sender, recipients pour les e-mails.
/Bernard
Bonsoir Bernard,
J'avais utilisé cet utilitaire pour recréer une GED (propriétaire)
existante dans un service (sur un dossier réseau comprenant plusieurs
Go de documents). L'avantage de Wilbur est qu'il est open source,
d'une part, et d'autre part qu'il lit dans dans les fichiers
compressés (zip, odt, ods etc.) à partir d'une requête et affiche un
aperçu (txt) pour chaque résultat.
Le fait que tu n'avais pas été convaincu résidait peut être dans le
fait que nativment Wilbur ne lit pas dans les pdf ; pour cela il faut
installer la petite extension pdftotext (à décompacter dans le
répertoire d'installation de Wilbur)
http://philia.online.fr/wilbur/fiche_wilbur_fr.pdf
Amicalement,
Philippe
Pour en terminer avec ce presque hors-sujet :-) et pour information,
voici la liste des formats que peut ouvrir DocFetcher :
* AbiWord (abw, abw.gz, zabw)
* EPUB (epub)
* FLAC (flac)
* HTML (htmi, htm, ..)
* JPEG (jpg, jpeg)
* HP3 (mp3)
* MS Compiled HTML Help (chm)
* MS Excel (xls)
* MS Powerpoint (ppt)
* MS Powerpoint 2007 (pptx, pptm)
* MS Visio (vsd)
* MS Word (doc)
* MS Word 2007 (docx, docm)
* OpenOffice.org Cale (ods, ots)
* OpenOffice.org Draw (odg, otg)
* OpenOffice.org Impress (odp, otp)
* OpenOffice.org Writer (odt, ott)
* PDF Document (pdf)
* Rich Text Format (rtf)
* Scalable Vector Graphics (svg)
* Simple texte
Il affiche un aperçu en format texte, certains dans leur format
d'origine, tel HTML. Pour les images il affiche les propriétés
(dimensions, etc.). Je n'ai pas tout essayé (et pas tout indexé), seuls
les documents ODF, MS, PDF et texte m'intéressant.
Un bon point pour Wilbur en ce qui concerne les zip, DocFetcher a
beaucoup de mal. Il y a aussi quelques problèmes avec les CHM. Je n'ai
jamais pris le temps de remonter ces problèmes à l'éditeur.
Mais je vais réessayer Wilbur "un de ces quatre..." :-)
Bernard
--
Bernard Ribot
LibreOffice 4.3.5.1 / Windows 7 x86
--
Envoyez un mail à [email protected] pour savoir comment vous
désinscrire
Les archives de la liste sont disponibles à
http://listarchives.libreoffice.org/fr/users/
Tous les messages envoyés sur cette liste seront archivés publiquement et ne
pourront pas être supprimés