Le Sat, 24 Apr 2010 21:16:34 +0200, laurent B a écrit dans le message <4bd34392.1040...@yahoo.fr> :
> >> A ce propos, quel encodage choisir pour être le plus respectueux de la > >> norme ? > François : > > Ben si tu veux être conforme, tu as le choix entre ces trois possibilités : > > [ ANSEL | UNICODE | ASCII ] > > L'ascii est à éviter, car tu n'auras pas les caractères accentués. Si l'ASCII Gedcom c'est du 8bits : l'ANSI US, ce qui doit correspondre à Windows, ce n'est pas trop bien défini. UNICODE on oublie, c'est le code 16 bits avec une grosse perte de place pour tout ce qui est compatible ASCII 7 bits. Ce ne doit pas être lu par beaucoup de programmes de généalogie. > > L'encodage par défaut est l'ansel. L'ANSEL est complètement obsolète depuis une dizaine d'années pour sa fonction premières : les bibliographies américaines. Il a été remplacé par UTF-8, même la draft gedcom 5.5.1 le reconnait en l'acceptant. > > Mais pour ma part, j'utilise l'UTF-8. Voila. > Il me semble que visuged (sous wine) accepte mal l'UTF-8, pour cette > raison j'étais repassé en ANSEL. Visuged est une horreur qui ne comprend rien au gedcom quand il ne vient pas de programme comme Hérédis. Effectivement, il ne lit pas UTF-8. Si des éditions Visuged manquent dans GenJ, il faudrait les demander. Ce sera une autre qualité de programmation. > Quel est l'avantage de l'encodage en UTF-8 ? > Quel inconvénient de rester en ANSEL ? ANSEL n'est plus géré que par quelques programmes de généalogie. Comme le dit François, il est impossible de lire un gedcom avec dans un éditeur de texcte. Il ne contient en plus que des caractères latins et aucun caractère spécial (c'est une norme pour les bibliographies, titre-nom d'auteur-éditeur, pas pour du texte) : il manque par exemple la croix latine (officiellement c'est la dague) u2020 † indispensable pour transcrire proprement des faire-parts. En UTF-8, on a même les épées croisées pour la mort au combat u2694 : ⚔, le s long u017F : ſ... La mère de Chopin s'appelait Tekla Justyna Krzyżanowska, le ż en ANSEL ou en UTF-8 ne sera pas lu par les programmes qui ne gèrent que Windows1252. Il ne faut pas s'arrêter à cela, tant pis pour leurs utilisateurs. -- Patrick Texier --------------------------------------------------------------------- Utilisateurs de GenjFr, localisez-vous sur le site: http://www.arvernes.com/wiki/index.php/Genj_-_Participants#Les_Utilisateurs <*> Pour vous desinscrire de cette liste, envoyez un mail a : genj-unsubscr...@ml.arvernes.com <*> Pour obtenir de l'aide sur les commandes de la liste : genj-h...@ml.arvernes.com