On Thursday 4 September 2003, at 10 h 41, the keyboard of Laurence Colombet 
<[EMAIL PROTECTED]> wrote:

>   C'est dr�le, lynx s'en sort tr�s bien pour les pages web: il regarde ta
> locale (justement!) pour savoir quel est l'encodage que tu veux, et les
> caract�res qui n'en font pas partie, il les traduit pour te les afficher
> de mani�re "raisonnable".

Mais parce que le protocole HTTP indique le jeu de caract�res et l'encodage 
(idem pour MIME et le courrier). Pour les noms ou les contenus des fichiers 
locaux, l'application (ls, more, etc) ne peut pas deviner. La locale ne sert � 
rien dans ce cas puisque les fichiers peuvent avoir �t� cr��s par des 
utilisateurs diff�rents. La seule solution raisonnable est de normaliser (tout 
en UTF-8 et je ne veux voir qu'une t�te et tant pis si Erwan n'est pas 
content).

>   Au fait, est-ce que GTK-2 supporte l'UTF-16 (qui contrairement �
> l'UTF-8, n'est pas un esp�ce d'ignoble cludge o� la taille d'un caract�re
> d�pend du contexte)? 

La taille d'un caract�re change en fonction du contexte en UTF-16 aussi (si 
vous dites que non, regardez � "Surrogates" dans un glossaire Unicode : �a, 
c'est un kludge, une survivance du pass� d'Unicode). Vous devriez utiliser 
UTF-32, le seul o� le nombre de bits est constant.

> �a, �a pose probl�me � cause des caract�res "null" qui se baladent, 

C'est un euph�misme, de dire "�a pose un probl�me". UTF-16 et UTF-32 cassent 
tout simplement toutes les applications existantes et toutes les fonctions de 
la libc. Ce n'est pas �tonnant qu'UTF-8 soit l'encodage sp�cifi� dans tous les 
protocoles Internet qui utilisent Unicode (sauf IDN), malgr� les trolles qui le 
qualifient d'ignoble kludge.


Répondre à