On Saturday 18 October 2003, at 11 h 42, the keyboard of Mathias =?ISO-8859-1?Q?Andr=E9?= <[EMAIL PROTECTED]> wrote:
> Content-Transfer-Encoding: quoted-printable A�e, exmh ne va pas aimer. > J'ai des noms de fichiers qui d=E9connent. Des "=E9" qui s'affichent "=C3= > =A9", Oui, c'est bien de l'UTF-8. > D'apr=E8s ce que j'ai compris UTF-8 permet d'encoder des langues comme le > chinois... Unicode (et son encodage UTF-8) encodent des *�critures* (des caract�res), pas des langues (exemple, le turc s'�crivait avec l'alphabet arabe, il s'�crit d�sormais avec l'alphabet latin). > J'ai pal mal "RTFMer", mais je n'ai rien trouv=E9 de tr=E8s probant donc > voici mes quelques questions :=20 Il y a un excellent expos� sur Unicode � JRES 2003 <URL:http://www.jres.org/>. Le texte (pas les transparents, un vrai article) sera en ligne sous licence libre (GFDL) aussit�t apr�s JRES. > - quel est la diff=E9rence entre UTF-8 et unicode? Unicode est un jeu de caract�res (une liste, une table, un jeu, quoi). Il contient actuellement dans les 91 000 caract�res. UTF-8 est un des encodages d'Unicode (une repr�sentation en m�moire). C'est sans doute le plus r�pandu dans le monde Unix/Internet. > - j'ai lu dans les archives de la liste que de passer en UTF-8 ne > perm=E9tait pas pour autant de lire tous les types de charact=E8res, dans c= > e > cas, que choisir? Si vous n'�crivez qu'en fran�ais, il n'y a en effet pas de raison majeure de passer � Unicode tout de suite. D'autant plus que le syst�me des profils ("locales") sur Unix pour g�rer les jeux de caract�res est fondamentalement invalide. Il ne permet en effet pas le travail en common d'utilisateurs ayant des profils diff�rents. Si trois personnes travaillent sur cette machine, un cor�en utilisant un profil UTF-8, un polonais utilisant un profil Latin-2 et un fran�ais utilisant un profil Latin-1, ils ne pourront s'�changer, ni fichiers textes (avec XML, �a marcherait), ni noms de fichiers. La seule solution r�aliste est donc de d�cider une fois pour toutes que *tous* les fichiers sur une machine donn�e soient en XXX (avec XXX = UTF-8, Latin-1, KOI-8, etc). Et tant pis pour les profils. > - j'ai aussi lu que le seul terminal qui g=E8re l'unicode est uxterm, xterm tout court se d�brouille bien, avec un petit sous-ensemble d'Unicode (il ne g�re pas les �critures de droite � gauche, comme l'arabe, par exemple). Il y a une tr�s bonne liste Linux-UTF-8 pour toutes ces questions (assez pointe, la liste). Sinon, trois documents � consulter (du plus g�n�rique au plus debianesqe) : Unicode HOWTO http://www.linux.org/docs/ldp/howto/Unicode-HOWTO.html UTF-8 and Unicode FAQ for Unix/Linux http://www.cl.cam.ac.uk/~mgk25/unicode.html Step by step introduction to switching your debian installation to utf-8 encoding http://melkor.dnp.fmph.uniba.sk/~garabik/debian-utf8/

