Re: [HS] UTF-8 ou ISO-8859-15 ?

Vincent Lefevre Sun, 09 Jan 2005 04:41:22 -0600

On 2005-01-07 19:04:24 +0100, Thomas Nemeth wrote:
>       Oui et non : comment sont g�r�es les chaines utf-8 lors de la
>       compilation ? (je suppose qu'il s'en fout comme de l'an 40 et
>       qu'il passe tous les octets de la chaine � la fonction de
>       traitement en wchar.


En C, les cha�nes sont apparent�es � des tableaux de char, o� 1 char
correspond � 1 caract�re. Donc UTF-8 n'est pas support� � la base
autrement que comme une suite d'octets. Le type wchar_t peut servir
� repr�senter les caract�res d'Unicode, mais � ce moment, il n'y a
plus de rapport avec UTF-8.

>       Maintenant suppose que tu es en phase de transition ISO->UTF. Tu
>       as des fichiers en latin0 et des fichiers en utf-8. Pour utiliser
>       l'utf-8 avec toutes tes applis tu as mis les locales
>       kivonbien��(tm) ([EMAIL PROTECTED] si ma m�moire est bonne). Les applis
>       (genre vim) r�ussissent-elles � �diter/modifier correctement des
>       fichiers Latin0 ?

Latin0? Tu veux dire latin1 (iso-8859-1) ou latin9 (iso-8859-15)?
�a d�pend des applications.

>       Les transforment-elles en utf-8 � la sauvegarde ?

Idem. Emacs est capable d'avoir un encodage d'entr�e (lecture fichier)
et un encodage de sortie (�criture fichier) diff�rents, ainsi que pour
les entr�es/sorties lorsqu'il est lanc� dans un terminal texte.

Pour le XML, les parseurs connaissent en g�n�ral tous ces encodages,
et c'est ind�pendant des locales. Idem en sortie d'un processeur XSLT
par exemple.

-- 
Vincent Lef�vre <[EMAIL PROTECTED]> - Web: <http://www.vinc17.org/>
100% accessible validated (X)HTML - Blog: <http://www.vinc17.org/blog/>
Work: CR INRIA - computer arithmetic / SPACES project at LORIA

Re: [HS] UTF-8 ou ISO-8859-15 ?

Répondre à