Le Sat, 24 Apr 2010 21:16:34 +0200, laurent B a écrit dans le message
<4bd34392.1040...@yahoo.fr> :

> >> A ce propos, quel encodage choisir pour être le plus respectueux de la
> >> norme ?
> François : 

> > Ben si tu veux être conforme, tu as le choix entre ces trois possibilités :
> > [ ANSEL | UNICODE | ASCII ]

> > L'ascii est à éviter, car tu n'auras pas les caractères accentués.

Si l'ASCII Gedcom c'est du 8bits : l'ANSI US, ce qui doit correspondre à
Windows, ce n'est pas trop bien défini.

UNICODE on oublie, c'est le code 16 bits avec une grosse perte de place
pour tout ce qui est compatible ASCII 7 bits. Ce ne doit pas être lu par
beaucoup de programmes de généalogie.

> > L'encodage par défaut est l'ansel.

L'ANSEL est complètement obsolète depuis une dizaine d'années pour sa
fonction premières : les bibliographies américaines. Il a été remplacé
par UTF-8, même la draft gedcom 5.5.1 le reconnait en l'acceptant.
 
> > Mais pour ma part, j'utilise l'UTF-8.

Voila. 
 
> Il me semble que visuged (sous wine) accepte mal l'UTF-8, pour cette 
> raison j'étais repassé en ANSEL.

Visuged est une horreur qui ne comprend rien au gedcom quand il ne vient
pas de programme comme Hérédis. Effectivement, il ne lit pas UTF-8.

Si des éditions Visuged manquent dans GenJ, il faudrait les demander. Ce
sera une autre qualité de programmation.
 
> Quel est l'avantage de l'encodage en UTF-8 ?
> Quel inconvénient de rester en ANSEL ?

ANSEL n'est plus géré que par quelques programmes de généalogie. Comme
le dit François, il est impossible de lire un gedcom avec dans un
éditeur de texcte.

Il ne contient en plus que des caractères latins et aucun caractère
spécial (c'est une norme pour les bibliographies, titre-nom
d'auteur-éditeur, pas pour du texte) : il manque par exemple la croix
latine (officiellement c'est la dague) u2020 † indispensable pour
transcrire proprement des faire-parts. En UTF-8, on a même les épées
croisées pour la mort au combat u2694 : ⚔, le s long u017F : ſ...

La mère de Chopin s'appelait Tekla Justyna Krzyżanowska, le ż en ANSEL
ou en UTF-8 ne sera pas lu par les programmes qui ne gèrent que
Windows1252. Il ne faut pas s'arrêter à cela, tant pis pour leurs
utilisateurs.

-- 
Patrick Texier

---------------------------------------------------------------------
Utilisateurs de GenjFr, localisez-vous sur le site:
http://www.arvernes.com/wiki/index.php/Genj_-_Participants#Les_Utilisateurs

<*> Pour vous desinscrire de cette liste, envoyez un mail a :
    genj-unsubscr...@ml.arvernes.com
<*> Pour obtenir de l'aide sur les commandes de la liste :
    genj-h...@ml.arvernes.com



Répondre à