Le 05.12.2006 09:43,, le perspicace Lilian Robert s'exprimait en ces termes:
> Bonjour,
> 
> J'ai une petite question, tu parles de conversion. Après conversion d'un
> encodage à un autre, les fameux petits losanges noirs surmontés d'un point
> d'interrogation sont remplacés par le caractère d'origine ? Et ceci dans le
> nom du fichier comme à l'intérieur ?
> 
> Merci d'avance
Bonjour,

Comme Romain le précise, le code du caractère sera transformé. Mais il
faut garder un truc à l'esprit : il n'y a pas d'erreur dans le fichier.

Prenons un exemple avec des valeurs factices.
Supposons que le caractère € (symbole de l'euro) soit dans le fichier
txt de départ, fichier encodé en iso-8859-15. Supposons que dans ce code
iso, la valeur numérique 123 corresponde à ce caractère.

Si j'ouvre le fichier dans mon Ubuntu (qui utilise l'encodage utf-8,
plus moderne et universel), je verrais l'un de ces caractères bizarres
comme le petit point d'interrogation inscrit dans un losange noir.

L'utilitaire convmv devrait me permettre de convertir ce fichier txt
dans l'encodage utf-8 (j'utilise le conditionnel, n'ayant jamais utilisé
utf8). Pour cela, je devrais spécifier sur la ligne de commande que le
fichier txt de départ est encodé en iso-8859-15 et que je veux le
transformer en utf-8. Dans le nouveau fichier texte fabriqué par convmv,
 le caractère euro € aura vu son code 123 transformé en 3824 qui est la
valeur (toujours factice pour l'exemple!) du symbole euro dans le code
utf-8. Et bien évidemment, tous les autres caractères auront été
transformés pour garder la cohérence du fichier.

Si maintenant j'ouvre ce fichier txt dans gedit ou kate sous Ubuntu (qui
utilise utf-8 par défaut), le symbole euro sera affiché correctement.

Mais il faut garder à l'esprit que si j'ouvre ce nouveau fichier txt
nouvellement encodé en utf-8 sur une vieille distrib Linux ou un vieux
Windows (antérieur à XP je crois), le code 3824 (symbole euro exprimé en
utf-8 (valeur factice!)) sera interprété différemment et le système
affichera à nouveau des caractères fantaisistes à la place.

Pour répondre au problème initial, on pourra aussi jeter un œil sur
utf8-migration-tool qui devrait être capable de renommer les noms de
fichiers, au cas où convmv ne pourrait s'en acquitter.

A+
SW

PS : voici pour finir quelques caractères spéciaux :
œil, garçon, Établissement, Ô vieillesse ennemie, « ÇÀ »
Mon message est encodé en utf-8 : si votre client de messagerie n'est
pas réglé sur utf-8, vous verrez des caractères bizarres à la place.

-- 
ubuntu-fr mailing list
ubuntu-fr@lists.ubuntu.com
https://lists.ubuntu.com/mailman/listinfo/ubuntu-fr

Répondre à