Re: [de-dev] Codierung von Sonderzeichen in UTF-8

Regina Henschel Sun, 21 Aug 2005 04:20:17 -0700

Hallo Sigrid,

Sigrid Kronenberger schrieb:

Hallo zusammen,
gibt es eigentlich irgendwo eine Liste, wie die verschiedenen
Sonderzeichen / Umlaute in UTF-8 codiert werden?


Es sind mehrere Schritte.

(1) Unicode des Zeichens bestimmen. Den siehst du unten rechts imSonderzeichendialog.

(2) Den Unicode von hexadezimal nach dual umrechnen.

0=O, 1=L, 2=LO, 3=LL, 4=LOO, 5=LOL, 6=LLO, 7=LLL, 8=LOOO, 9=LOOL,a=LOLO, b=LOLL, c=LLOO, d=LLOL, e=LLLO, f=LLLL

(3) Die Bitfolge nach UTF-8 umkodieren. Da betrachtet man drei Bereiche:
(3a) Unicode 0000-007f
     Diese Werte haben 7 Datenbits (ggf. vorne mit O auffüllen) *******
     Der Code-Wert ist dann O*******
     Solche Werte sind 1 Byte lang.
(3b) Unicode 0080-07ff
     Diese Werte haben 11 Datenbits. Daraus werden 2 Byte gemacht.
     Der Code-Wert ist LLO***** LO******
(3c) Unicode 0800-ffff
     Diese Werte haben 16 Datenbits. Daraus werden 3 Byte gemacht
     Der Code-Wert ist LLLO**** LO****** LO******
(4)  Die neuen Bitfolgen wieder nach Hexadezimal umrechnen.


Zum Hintergrund: ich bin grad an einer Übersetzung einer po-Datei, die
als UTF-8 codiert sein soll (das habe ich auch schon eingestellt). Um
aber wirklich sicher zu gehen, dass die Umlaute und Sonderzeichen
richtig dargestellt werden, würde ich diese gerne (nach Möglichkeit
richtig) codieren.

Eigentlich sollte die Arbeit ein normaler Editor erledigen. Schaue dirmal jedit an von http://www.jedit.org/


Ich habe auch schon selbst Google bemüht, finde aber nichts, was mir
weiterhilft... Wenn da also jemand von euch einen Link für mich hätte...

Link habe ich nicht. Ich schlage solche Dinge im Buch nach: Peter A.Henning: Taschenbuch Multimedia.


mfG
Regina

---------------------------------------------------------------------
To unsubscribe, e-mail: [EMAIL PROTECTED]
For additional commands, e-mail: [EMAIL PROTECTED]

Re: [de-dev] Codierung von Sonderzeichen in UTF-8

Antwort per Email an