Le 09.01.05, Vincent Lefevre a tapot� :

| On 2005-01-07 19:04:24 +0100, Thomas Nemeth wrote:
| >     Oui et non : comment sont g�r�es les chaines utf-8 lors de la
| >     compilation ? (je suppose qu'il s'en fout comme de l'an 40 et
| >     qu'il passe tous les octets de la chaine � la fonction de
| >     traitement en wchar.
|
| En C, les cha�nes sont apparent�es � des tableaux de char, o� 1 char
| correspond � 1 caract�re. Donc UTF-8 n'est pas support� � la base
| autrement que comme une suite d'octets. Le type wchar_t peut servir
| � repr�senter les caract�res d'Unicode, mais � ce moment, il n'y a
| plus de rapport avec UTF-8.

        Justement ! Ma question (pas assez claire) �tait : est-ce qu'en
        utilisant les fonctions utilisant les wchar, le compilo
        comprennait bien les caract�res utf-8 comme �tant compos�s de 2
        caract�res et si l'utilisation combin�e putwchar() et d'une
        police utf-8 ne posait /a priori/ pas de pb.

        Je ne vois, par ailleurs, pas de printf avec un wchar dans
        /usr/include/wchar.h...

        Autre sujet d'inqui�tude : si mon source C est en utf-8, le noyau
        comprendra-t-il mes printk utilisant de l'utf-8 ou devrais-je me
        passer d'accents pour mes modules noyaux ? (je la sens mal,
        celle-l�).


| >     Maintenant suppose que tu es en phase de transition ISO->UTF. Tu
| >     as des fichiers en latin0 et des fichiers en utf-8. Pour utiliser
| >     l'utf-8 avec toutes tes applis tu as mis les locales
| >     kivonbien��(tm) ([EMAIL PROTECTED] si ma m�moire est bonne). Les applis
| >     (genre vim) r�ussissent-elles � �diter/modifier correctement des
| >     fichiers Latin0 ?
|
| Latin0? Tu veux dire latin1 (iso-8859-1) ou latin9 (iso-8859-15)?

        Latin0 est un alias de latin9 depuis belle lurette.


| �a d�pend des applications.

        �a ne m'avance pas beaucoup :)


| >     Les transforment-elles en utf-8 � la sauvegarde ?
|
| Idem. Emacs est capable d'avoir un encodage d'entr�e (lecture fichier)
| et un encodage de sortie (�criture fichier) diff�rents, ainsi que pour
| les entr�es/sorties lorsqu'il est lanc� dans un terminal texte.
|
| Pour le XML, les parseurs connaissent en g�n�ral tous ces encodages,
| et c'est ind�pendant des locales. Idem en sortie d'un processeur XSLT
| par exemple.
|
|

Thomas
-- 
BOFH excuse #308:
CD-ROM server needs recalibration.

Répondre à