Bonjour,

J'ai un fichier dont je ne sais pas exactement la provenance où tous les
caractères ascii 7 bits sont bien représentés par un seul octet, mais les
caractères accentués par 4 octets, dont les trois premiers sont   "c3  83
c2" , seul le 4ème est vraiment significatif et correspond, pour ceux que
j'ai essayés, au 2ème octet de l'UTF-8.

Exemple : "ç" est représenté par "c3  83  c2 a7" (hex).

À quel encodage ai-je affaire ?

J'ai essayé d'utiliser "iconv" et "piconv" mais ils ne savent
pas reconnaître cette séquence. Selon la sortie demandée, ils se bloquent
sur la séquence "c3 83".  Avez-vous une autre suggestion ?

Toute aide sera appréciée !

Bonnes salutations,     Paul
_______________________________________________
gull mailing list
[email protected]
http://forum.linux-gull.ch/mailman/listinfo/gull

Répondre à