Kaixo!

> On Tue, Aug 03, 2004 at 07:40:09AM +0200, zennnn wrote:

> > � propos de l'Unicode; qu'a t'il de particulier pour que Suse y soit
> > pass� ?

Unicode sera � terme le seul encodage utilis�; il est donc normal
qu'il y aie convergence vers son adoption.

Il y a trois fa�ons d'aborder le probl�me de la migration
1. migrer tout en masse et ne plus supporter les anciens encodage
   (ne plus supporter=ne pas considerer les probl�mes y li�s comme
   des bugs � corriger; pas que �a ne fonctionne plus)
2. migrer en douceur avec choix d'utiliser utf-8 ou non selon certains
   crit�res
3. ne rien faire, on verra plus tard :-)

SuSE a semble-t-il choisi la premi�re.

Chez Mandrakesoft on a choisi la deuxi�me; et on distingue pour les
langues deux cas:
1. les langues ayant une large tradition d'utilisation d'un encodage
   non unicode (eg: fran�ais, japonais, grec, etc); c�d avec une
   population d'utilsateurs importante voulant l'ancien encodage,
   et une quantit� impressionante de documents dans l'ancien encodage.
2. les langues n'ayant aucun autre encodage standardis� qu'UTF-8;
   ou bien n'ayant �t� support�es sous GNU/Linux que recemment, et donc
   il n'y a pas de tradition �tablie d'usage d'un autre encodage.

Pour le cas 2; UTF-8 est utilis� d'office.

Pour le cas 1, pour le momment c'est encore l'ancien encodage par
defaut; l'utilisateur peut cependant cocher une case pour demander 
� que ce soit UTF-8.

Enfin, si on choisit plusieures langues dont au moins deux utilisent
des encodages differents, alors c'est UTF-8 d'office aussi (eg: si on
veut le support pour le fran�ais et le grec, alors UTF-8 est la seule
solution)

Imposer UTF-8 partout est netemment plus simple;
mais �a fait des mecontants (surtout parmi les utilisateurs en fran�ais,
allemand et anglais; ce qui fait pas mal de monde).
En donnant le choix on menage la ch�vre et le chou.

Ceci dit, un jour il nous faudra bien mettre UTF-8 par d�faut (avec case
� coocher pour "encodage historique")

>> pourquoi les autres distributions utilisent encore les ISO8859-... si 
>> l'unicode est mieux ?

En fait la majorit� des grandes distributions sont pass�es � UTF-8;
Mandrakelinux est un peu particuli�re a garder les anciens encodages
par d�faut (avec choix UTF-8 quand m�me).

Il est possible que certaines distributions aient choisi l'option 3: ne
pas s'occuper du probl�me; apr�s tout on n'a qu'� utiliser le syst�me
en anglais, non? (c'est du sarcasme)

> J'imagine que �a repr�sente beaucoup de boulot pour pouvoir utiliser
> l'Unicode dans tout (de bonne foi, mais sans certitude, hein, c'est
> pas encore 100% clair dans ma t�te non plus).

Avec les programmes modernes non.
Avec de tr�s anciens programmes oui (mais c'�tait d�j� la gal�re avec
les m�mes pour supporter ne fusse-ce que le russe ou le grec)

groff (et donc les pages de man) est notamment dans ce cas; il ne
supporte *que* iso-8859-1, tout autre caract�re/encodage est impossible.
Dans le temps on faisait des bidouilles immondes pour faire semblant,
avec un encodag ecyrillique par exemple, que c'�tait une suite de
caract�res iso-8859-1; �a marchait plus ou moins; mais pas en utf-8
(car utf-8 est multi-octets). 

Bref, le probl�me n'est pas utf-8; un programme ne supportant pas
correctemment utf-8 est de toutes fa�ons un programme buggu� qui
ne peut supporter un tas de langues; simplement utf-8 mets cela
en �vidence m�me pour le fran�ais par exemple, alors que quand
on utilise iso-8859-1 les bugs sont occult�s.

>> et surtout, pourquoi des textes tap�s sous linux (�diteur basic de type Pico 
>> ou Kedit) sont merdiques sur un pc qui tourne sous windows ? (je pense que 
>> c'est la r�ponse � ma premi�re question)
> 
> Tu as tout sur une ligne ?

Peut-�tre aussi que Windows ne reconna�t pas que c'est de l'UTF-8;
car Windows est un gros nul, et a besoin d'un BOM (un caract�re
de contr�le special) en d�but de fichier (mais, du coup, ce n'est plus
un fichier texte simple!)

Il faut utiliser sous Windows des �diteurs de texte decents, capables
de travailler sur des fichiers UTF-8 standard (et non des UTF-8 � la
sauve Microsoft).

-- 
Ki �a vos v�ye b�n,
Pablo Saratxaga

http://chanae.walon.org/pablo/          PGP Key available, key ID: 0xD9B85466
[you can write me in Walloon, Spanish, French, English, Catalan or Esperanto]
[min povas skribi en valona, esperanta, angla aux latinidaj lingvoj]

Attachment: pgp6LFnZprVmZ.pgp
Description: PGP signature

_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/[EMAIL PROTECTED]
IRC: chat.unixtech.be:6667 - #unixtech

Répondre à