merci a vous, en fait le probleme n'etait pas de l'encoding mais de la
donnee reellement pourrie et comment l'exploiter avec un fichier XML de
4Go, vue la volumetrie du fichier j'avais abaisse mon niveau de traces ....
Navre ..mais du coup j'ai fait mumuse avec iconv, que j'avais precedemment
cherche avec aptitude et qui en fait vient preinstalle avec la libc...

merci encore
jerome

J.MOLIERE - Mentor/J



Le 23 juillet 2013 18:04, Bernard Schoenacker
<bernard.schoenac...@free.fr>a écrit :

> Le Tue, 23 Jul 2013 17:22:58 +0200,
> jerome moliere <jerome.moli...@gmail.com> a écrit :
>
> > Bonjour a tous,
> > j'ai un souci avec un fichier (export enorme en XMl de data venant
> > d'un systeme proprio sous Windows) je dois parser ce fichier et j'ai
> > des plantages ...
> > J'ai tente un :
> > file -bi <monfic>
> > il me dit ISO-8859-1
> >
> > les editeurs de texte genre UltraEdit le voient en ISO-8859-15
> >
> > j'ai tente un recode -f UTF-8 <fic>
> > et apres 15mn de moulinage mon parser se plante au meme endroit...
> >
> > D'ou ma question, il y a t'il des outils plus avances que file /
> > recode pour manipuler les charsets ?des algos de detection plus
> > aboutis... bref je ne sais pas quelle tactique adoptee car changer le
> > file.encoding de ma JVM ne marche pas en fonctionnant a tatons
> >
> > cordialement
> > J.MOLIERE - Mentor/J
>
> Bonjour,
>
>         ne serait pas possible d'employer Iconv et de réencoder
>         le fichier originel balte 1252 vers utf8 ?
>
>
>         slt
>         bernard
>
> --
> Lisez la FAQ de la liste avant de poser une question :
> http://wiki.debian.org/fr/FrenchLists
>
> Pour vous DESABONNER, envoyez un message avec comme objet "unsubscribe"
> vers debian-user-french-requ...@lists.debian.org
> En cas de soucis, contactez EN ANGLAIS listmas...@lists.debian.org
> Archive:
> http://lists.debian.org/20130723180431.75f8122d.bernard.schoenac...@free.fr
>
>

Répondre à