Jean-Philippe Mengual <[EMAIL PROTECTED]> writes:
> Sur braillenet, j'ai récupéré un livre. links le lit bien, donc je
> supposais qu'il était html. Donc, html2text x.htm >>x.txt.
> Mais le txt final a des accents mal faits, et son en-tête est:
> <?xml version="1.0" encoding="UTF-8"?>
C'est donc juste un pb d'encodage...
html2text ne doit pas être utf8-"aware"...
Pourquoi n'utilises-tu pas links -dump file:///mon fichier...
Cela ne corrigerait-il pas le pb?
Ensuite, tu peux lancer "convert" sur ton fichier texte, convert transforme les
caractères d'un jeu à l'autre
recode UTF-8..Latin-1 MonFichier
>
> Alors, je fais un file sur le .htm et le .txt, et j'obtiens:
> XML document text
>
> Donc j'installe DocBook DSSSL Stylesheets-1.79 et DocBook XML
> DTD-4.4. Puis xsltproc x.htm.
> Et là:
> compilation error: file a.htm line 3 element html
> xsltParseStylesheetProcess : document is not a stylesheet
Ben où est ta stylesheet?? xsltproc devrait prendre 2 paramètres, la stylesheet
à passer sur le document ET le document...
> Donc, pensez-vous qu'un package docbook est mal configuré? Ca je peux
> reprendre. Mais sinon que se passe-t-il? Comment convertir ce fichier
> en txt?
--
Bruno Marmol.
Email: [EMAIL PROTECTED] - Tel: 04 76 61 53 04 - Fax: 04 76 61 52 52
Braillenet - Inria Rhône Alpes.
ZIRST - 655 Av de l'Europe. - Montbonnot St Martin
38334 St Ismier Cedex - France
_______________________________________________
Liste de diffusion CarrefourBLinuX
[email protected]
http://lists.freearchive.org/mailman/listinfo/carrefourblinux
Fiches EDU : http://blinuxwiki.pbwiki.com/FichesEdu
Signets : http://fr.groups.yahoo.com/group/carrefourblinux/links/
Archives : http://lists.freearchive.org/pipermail//carrefourblinux
Anciennes archives (Yahoogroupes) :
http://fr.groups.yahoo.com/group/carrefourblinux/messages
Rechercher : http://lists.freearchive.org/cgi-bin/search.cgi
Pour s'inscire par courriel :
'mailto:[EMAIL PROTECTED]'
Pour se desinscrire par courriel :
'mailto:[EMAIL PROTECTED]'