On Tuesday 3 August 2004, at 1 h 6, the keyboard of Laurent Giroud 
<[EMAIL PROTECTED]> wrote:

> > Oui, enfin, rares sont les gens qui �crivent des textes m�lant le grec, 
> > l'arabe et le chinois.
...
> La quasi totalit� des sud-cor�en (99% d'entre eux ont l'ADSL) m�langent 
> anglais 
> et Hangul dans leurs messages.

Ce n'est pas par hasard que j'ai dit "grec, arabe et chinois". Et pas "hangul 
et anglais". La plupart des "vieux" jeux de caract�res, pr�-Unicode, incluent 
US-ASCII et permettent donc d'�crire des textes mixtes (anglais et X). Donc, 
hangul et anglais est sans doute possible sans Unicode (mais pas hangul et 
grec).

> (et j'oublie les arabes qui pour la plupart sont aussi francophones).

Euh, en Alg�rie, sans doute, mais pas en Jordanie ou aux �mirats...

> 2 - je ne vois pas en quoi j'ai cherch� � culpabiliser qui que ce soit, j'ai 
> �voqu� l'emploi d'un encodage qui simplifie *tous* les probl�mes de 
> conversion 

Il faut distinguer le potentiel d'Unicode (�norme) et la r�alit� (qui �volue 
chaque ann�e, heureusement). Aujourd'hui, passer � Unicode ne simplifie pas la 
vie, si on utilise juste les langues ouest-europ�ennes (celles qui sont bien 
repr�sent�es dans Latin-1).

Les utilisateurs de RedHat l'ont d�couvert � leurs d�pens quant RedHat est 
pass� � UTF-8 par d�faut sans pr�venir et sans tenter de r�cup�rer les 
fichiers existants.

> > savoir de quoi on parle. Cette phrase "de 8 � 32 bits" ne veut absolument 
> > rien 
> > dire.
...
> D'ailleurs pour �tre tatillon, c'est sur 31 bits max qu'un caract�re unicode 
> UTF-8 peut �tre encod�.

Ouh, l�, l�, c'est plut�t pire comme �a :-)

D'abord, un "caract�re Unicode UTF-8" ne veut rien dire. Un caract�re Unicode 
est un caract�re Unicode, quel que soit son encodage (UTF-8, UTF-16, UTF-32, 
whatever).

Ensuite, la phrase exacte serait cette fois "C'est sur 48 bits maximum qu'un 
caract�re Unicode peut �tre encod� en UTF-8". Je cite le RFC 2044 "UTF-8, a 
transformation format of Unicode and ISO 10646" : "In UTF-8, characters are 
encoded using sequences of 1 to 6 octets.".



Répondre à