Jean-Philippe Mengual <[EMAIL PROTECTED]> writes:

> Sur braillenet, j'ai récupéré un livre. links le lit bien, donc je
> supposais qu'il était html. Donc, html2text x.htm >>x.txt.
> Mais le txt final a des  accents mal faits, et son en-tête est:
> <?xml version="1.0" encoding="UTF-8"?>

C'est donc juste un pb d'encodage...
html2text ne doit pas être utf8-"aware"...

Pourquoi n'utilises-tu pas links -dump file:///mon fichier...
Cela ne corrigerait-il pas le pb?

Ensuite, tu peux lancer "convert" sur ton fichier texte, convert transforme les
caractères d'un jeu à l'autre
           recode  UTF-8..Latin-1 MonFichier

>
> Alors, je fais un file sur le .htm et le .txt, et j'obtiens:
> XML document text
>
> Donc  j'installe DocBook DSSSL Stylesheets-1.79 et DocBook XML
> DTD-4.4. Puis xsltproc x.htm.
> Et là:
> compilation error: file a.htm line 3 element html
> xsltParseStylesheetProcess : document is not a stylesheet

Ben où est ta stylesheet?? xsltproc devrait prendre 2 paramètres, la stylesheet
à passer sur le document ET le document...

> Donc, pensez-vous qu'un package docbook est mal configuré? Ca je peux
> reprendre. Mais sinon que se passe-t-il? Comment convertir ce fichier
> en txt?

-- 
Bruno Marmol.

Email: [EMAIL PROTECTED] - Tel: 04 76 61 53 04 - Fax: 04 76 61 52 52
Braillenet - Inria Rhône Alpes.    
ZIRST - 655 Av de l'Europe.  - Montbonnot St Martin 
38334 St Ismier Cedex - France

_______________________________________________
Liste de diffusion CarrefourBLinuX 
    [email protected]
    http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu
Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
    http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi
Pour s'inscire par courriel : 
    'mailto:[EMAIL PROTECTED]'
Pour se desinscrire par courriel : 
    'mailto:[EMAIL PROTECTED]'

Répondre à