On Saturday 18 October 2003, at 11 h 42, the keyboard of Mathias 
=?ISO-8859-1?Q?Andr=E9?= <[EMAIL PROTECTED]> wrote:

> Content-Transfer-Encoding: quoted-printable

A�e, exmh ne va pas aimer.

> J'ai des noms de fichiers qui d=E9connent. Des "=E9" qui s'affichent "=C3=
> =A9",

Oui, c'est bien de l'UTF-8.

> D'apr=E8s ce que j'ai compris UTF-8 permet d'encoder des langues comme le
> chinois... 

Unicode (et son encodage UTF-8) encodent des *�critures* (des caract�res), pas 
des langues (exemple, le turc s'�crivait avec l'alphabet arabe, il s'�crit 
d�sormais avec l'alphabet latin).

> J'ai pal mal "RTFMer", mais je n'ai rien trouv=E9 de tr=E8s probant donc
> voici mes quelques questions :=20

Il y a un excellent expos� sur Unicode � JRES 2003 <URL:http://www.jres.org/>. 
Le texte (pas les transparents, un vrai article) sera en ligne sous licence 
libre (GFDL) aussit�t apr�s JRES.

> - quel est la diff=E9rence entre UTF-8 et unicode?

Unicode est un jeu de caract�res (une liste, une table, un jeu, quoi). Il 
contient actuellement dans les 91 000 caract�res.

UTF-8 est un des encodages d'Unicode (une repr�sentation en m�moire). C'est 
sans doute le plus r�pandu dans le monde Unix/Internet.

> - j'ai lu dans les archives de la liste que de passer en UTF-8 ne
> perm=E9tait pas pour autant de lire tous les types de charact=E8res, dans c=
> e
> cas, que choisir?

Si vous n'�crivez qu'en fran�ais, il n'y a en effet pas de raison majeure de 
passer � Unicode tout de suite. D'autant plus que le syst�me des profils 
("locales") sur Unix pour g�rer les jeux de caract�res est fondamentalement 
invalide. Il ne permet en effet pas le travail en common d'utilisateurs ayant 
des profils diff�rents. Si trois personnes travaillent sur cette machine, un 
cor�en utilisant un profil UTF-8, un polonais utilisant un profil Latin-2 et 
un fran�ais utilisant un profil Latin-1, ils ne pourront s'�changer, ni 
fichiers textes (avec XML, �a marcherait), ni noms de fichiers.

La seule solution r�aliste est donc de d�cider une fois pour toutes que *tous* 
les fichiers sur une machine donn�e soient en XXX (avec XXX = UTF-8, Latin-1, 
KOI-8, etc). Et tant pis pour les profils.

> - j'ai aussi lu que le seul terminal qui g=E8re l'unicode est uxterm,

xterm tout court se d�brouille bien, avec un petit sous-ensemble d'Unicode (il 
ne g�re pas les �critures de droite � gauche, comme l'arabe, par exemple).

Il y a une tr�s bonne liste Linux-UTF-8 pour toutes ces questions (assez 
pointe, la liste). Sinon, trois documents � consulter (du plus g�n�rique au 
plus debianesqe) :

Unicode HOWTO http://www.linux.org/docs/ldp/howto/Unicode-HOWTO.html
UTF-8 and Unicode FAQ for Unix/Linux http://www.cl.cam.ac.uk/~mgk25/unicode.html

Step by step introduction to switching your debian installation to utf-8 
encoding http://melkor.dnp.fmph.uniba.sk/~garabik/debian-utf8/

Répondre à