Salut Philippe:

On Tue, Nov 25, 2008 at 11:36:39AM +0100, Philippe Delavalade wrote:
> Je viens de recevoir une pièce jointe de type .docx ; pensant que c'était
> du microsoft word, j'ai voulu lire avec antiword mais ça ne lui plaît pas.

Ce problème a déjà été abordé et résolu de deux façons, dont une grâce à
Tarik, cf. donc:
- soit l'archive CBLX
- soit: http://blinux.blinuxman.net/

et tu devrais y retrouver deux solutions:
- docx2txt et 
- undocx.tar.gz

Je les mets en pj car il y a des problèmes avec Apache chez mon hébergeur,
et parfois certains fichiers n'apparaissent pas dans ton navigateur alors
qu'ils sont pourtant bien là sur le disque (vérifié par ftp et ssh).

Aldo.

#!/bin/bash
# DOCX2TXT converter 
# by Tarik Fdil - member of the CarrefourBLinuX Mailing List 
#               - posted at CBLX on 06-02-2008 - rev. 14-02-2008 
# Layout + English translations by O. La Rosa - http://blinuxman.net/ 
# Do uncomment the right lines if you want the warnings to be in English

clear
echo "DOCX2TXT converter - by Tarik Fdil "

# Vérifier que le fichier est spécifié, sinon sortir avec un message sur la
# manière d'utiliser le script
if test $# -ne 1 
then
        echo Usage: docx2txt fichier.docx
#       echo Usage: docx2txt file.docx
        exit 1
fi

# Vérifier que le fichier existe et est lisible
if ! test -r $1
then
        echo Fichier $1 inexistant ou illisible
#       echo "File $1 does not exist or can't be written"
        exit 2
fi

# Récupérer le nom du fichier, remplace l'extension docx par txt
nom=`basename $1 .docx`.txt

# Unzipper et récupérer juste le contenu xml
if ! unzip $1 word/document.xml
then
        echo Problème avec unzip
#       echo Unzip problem
        exit 3
fi

# Copie le contenu xml dans le fichier d'extension txt
if ! mv word/document.xml $nom
then
        echo Impossible de récupérer le contenu xml
#       echo Xml-content unextractable
        exit 4
fi

# Supprimer le répertoire créé par unzip
if ! rmdir word
then 
        echo Warning : impossible de supprimer le répertoire word
#       echo Warning : can't delete word/-map
fi


# Editer le fichier avec vi en mode ligne et en redirigeant l'entrée vers le
# script en cours
# ensuite remplacer toutes les balises par un retour chariot
# après supprimer les lignes vides
# finalement sauvagerder le fichier et sortir
vi -E $nom << FIN
1,\$s/<[^>]*>/\r/g
1,\$g/^$/d
w
q
FIN

echo Conversion terminée 
#echo Conversion finished
exit 0

Attachment: undocx.tar.gz
Description: Binary data

_______________________________________________
Liste de diffusion CarrefourBLinuX 
    [email protected]
    http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Pour s'inscrire par courriel : 
    'mailto:[EMAIL PROTECTED]'
Pour se retirer de la liste par courriel : 
    'mailto:[EMAIL PROTECTED]'

Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
    http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi

Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu

Répondre à