Bonjour, J'ai un fichier dont je ne sais pas exactement la provenance où tous les caractères ascii 7 bits sont bien représentés par un seul octet, mais les caractères accentués par 4 octets, dont les trois premiers sont "c3 83 c2" , seul le 4ème est vraiment significatif et correspond, pour ceux que j'ai essayés, au 2ème octet de l'UTF-8.
Exemple : "ç" est représenté par "c3 83 c2 a7" (hex). À quel encodage ai-je affaire ? J'ai essayé d'utiliser "iconv" et "piconv" mais ils ne savent pas reconnaître cette séquence. Selon la sortie demandée, ils se bloquent sur la séquence "c3 83". Avez-vous une autre suggestion ? Toute aide sera appréciée ! Bonnes salutations, Paul
_______________________________________________ gull mailing list [email protected] http://forum.linux-gull.ch/mailman/listinfo/gull
