Kaixo!

> On Tue, Aug 03, 2004 at 07:40:09AM +0200, zennnn wrote:

> > à propos de l'Unicode; qu'a t'il de particulier pour que Suse y soit
> > passé ?

Unicode sera à terme le seul encodage utilisé; il est donc normal
qu'il y aie convergence vers son adoption.

Il y a trois façons d'aborder le problème de la migration
1. migrer tout en masse et ne plus supporter les anciens encodage
   (ne plus supporter=ne pas considerer les problèmes y liés comme
   des bugs à corriger; pas que ça ne fonctionne plus)
2. migrer en douceur avec choix d'utiliser utf-8 ou non selon certains
   critères
3. ne rien faire, on verra plus tard :-)

SuSE a semble-t-il choisi la première.

Chez Mandrakesoft on a choisi la deuxième; et on distingue pour les
langues deux cas:
1. les langues ayant une large tradition d'utilisation d'un encodage
   non unicode (eg: français, japonais, grec, etc); càd avec une
   population d'utilsateurs importante voulant l'ancien encodage,
   et une quantité impressionante de documents dans l'ancien encodage.
2. les langues n'ayant aucun autre encodage standardisé qu'UTF-8;
   ou bien n'ayant été supportées sous GNU/Linux que recemment, et donc
   il n'y a pas de tradition établie d'usage d'un autre encodage.

Pour le cas 2; UTF-8 est utilisé d'office.

Pour le cas 1, pour le momment c'est encore l'ancien encodage par
defaut; l'utilisateur peut cependant cocher une case pour demander 
à que ce soit UTF-8.

Enfin, si on choisit plusieures langues dont au moins deux utilisent
des encodages differents, alors c'est UTF-8 d'office aussi (eg: si on
veut le support pour le français et le grec, alors UTF-8 est la seule
solution)

Imposer UTF-8 partout est netemment plus simple;
mais ça fait des mecontants (surtout parmi les utilisateurs en français,
allemand et anglais; ce qui fait pas mal de monde).
En donnant le choix on menage la chèvre et le chou.

Ceci dit, un jour il nous faudra bien mettre UTF-8 par défaut (avec case
à coocher pour "encodage historique")

>> pourquoi les autres distributions utilisent encore les ISO8859-... si 
>> l'unicode est mieux ?

En fait la majorité des grandes distributions sont passées à UTF-8;
Mandrakelinux est un peu particulière a garder les anciens encodages
par défaut (avec choix UTF-8 quand même).

Il est possible que certaines distributions aient choisi l'option 3: ne
pas s'occuper du problème; après tout on n'a qu'à utiliser le système
en anglais, non? (c'est du sarcasme)

> J'imagine que ça représente beaucoup de boulot pour pouvoir utiliser
> l'Unicode dans tout (de bonne foi, mais sans certitude, hein, c'est
> pas encore 100% clair dans ma tête non plus).

Avec les programmes modernes non.
Avec de très anciens programmes oui (mais c'était déjà la galère avec
les mêmes pour supporter ne fusse-ce que le russe ou le grec)

groff (et donc les pages de man) est notamment dans ce cas; il ne
supporte *que* iso-8859-1, tout autre caractère/encodage est impossible.
Dans le temps on faisait des bidouilles immondes pour faire semblant,
avec un encodag ecyrillique par exemple, que c'était une suite de
caractères iso-8859-1; ça marchait plus ou moins; mais pas en utf-8
(car utf-8 est multi-octets). 

Bref, le problème n'est pas utf-8; un programme ne supportant pas
correctemment utf-8 est de toutes façons un programme buggué qui
ne peut supporter un tas de langues; simplement utf-8 mets cela
en évidence même pour le français par exemple, alors que quand
on utilise iso-8859-1 les bugs sont occultés.

>> et surtout, pourquoi des textes tapés sous linux (éditeur basic de type Pico 
>> ou Kedit) sont merdiques sur un pc qui tourne sous windows ? (je pense que 
>> c'est la réponse à ma première question)
> 
> Tu as tout sur une ligne ?

Peut-être aussi que Windows ne reconnaît pas que c'est de l'UTF-8;
car Windows est un gros nul, et a besoin d'un BOM (un caractère
de contrôle special) en début de fichier (mais, du coup, ce n'est plus
un fichier texte simple!)

Il faut utiliser sous Windows des éditeurs de texte decents, capables
de travailler sur des fichiers UTF-8 standard (et non des UTF-8 à la
sauve Microsoft).

-- 
Ki ça vos våye bén,
Pablo Saratxaga

http://chanae.walon.org/pablo/          PGP Key available, key ID: 0xD9B85466
[you can write me in Walloon, Spanish, French, English, Catalan or Esperanto]
[min povas skribi en valona, esperanta, angla aux latinidaj lingvoj]

Attachment: pgp6LFnZprVmZ.pgp
Description: PGP signature

_______________________________________________________
Linux Mailing List - http://www.unixtech.be
Subscribe/Unsubscribe: http://www.unixtech.be/mailman/listinfo/linux
Archives: http://www.mail-archive.com/[EMAIL PROTECTED]
IRC: chat.unixtech.be:6667 - #unixtech

Répondre à