Re: [Neo] unicode.module für die Linuxer

Dennis Heidsiek Sat, 19 Sep 2009 17:40:47 -0700

Hallo allerseits,


Peter Eberhard ſchrieb am 18.09.2009 06:39 Uhr:

Die U0020-Konstante kann man vielleicht auch weglassen, keine Ahnung.
Aber die Anführungszeichen müssen sein. ;-)
Und einige Ausnahmen muss man wohl extra behandeln, wie "\"" statt """ und "\\" statt 
"\". Ich weiß nicht, ob das schon alle sind. Sieht so aus.

Vielen Dank für diese Fehleranalyse, Peter! Das kommt davon, wenn man»mal eben« ein Skript zusammenkleistert … sobald die anderen offenenFragen geklärt sind, werde ich eine entsprechend korrigierte Version insSVN stellen. Dann sollte alles so funktionieren wie gedacht :-).


Martin Roppelt ſchrieb am 18.09.2009 07:43 Uhr:

<Multi_key> <u> <u> <f> <0> <0> <0> <0> <space> : 󰀀 # <Plane 15 Private Use, 
First>
<Multi_key> <u> <u> <f> <f> <f> <f> <d> <space> : 󿿽 # <Plane 15 Private Use, 
Last>
<Multi_key> <u> <u> <1> <0> <0> <0> <0> <0> <space> : 􀀀 # <Plane 16 Private Use, 
First>
<Multi_key> <u> <u> <1> <0> <f> <f> <f> <d> <space> : 􏿽 # <Plane 16 Private Use, 
Last>

Hm, am Ende ist wohl was verloren gegangen.


Jein …

die Private Use Area ist ja extra geschaffen worden, damit man auchZeichen kodieren kann, die eben /keinen/ offiziellen Unicode-Codepointhaben (bspw. pIquD für tlhIngan Hol). Aber es handelt sich eben nicht umUnicode-Zeichen, weshalb ich sie lieber erst mal nicht mit in dieunicode.module aufgenommen hatte.

Wenn diese ›fehlenden‹ Cokos aber wirklich gewünscht sind, könnte ichsie durchaus in ein eigenes unicode_pua.module gießen. Allerdings: Dahier jeder machen kann was er will müsste man dann wohl auch wirklich/alle/ aufnehmen – ganz konkret wären das 2×(fffd-0-1) = 1FFF8 =(…(1*16+15)*16+15)*16+15)*16+8 = 131.064 Cokos. Über den Daumen gepeiltmacht das ungefähr [(0.5×1,6 MB)/19.281 Zeilen]×13.1064 ≈ 5,44 MB –wollt ihr das wirklich?

Da ist die Programm-technische NeoVars-Umsetzung doch wesentlicheleganter (bzw. platzsparender :-)).

Folgende Form würde auch reichen, das ist dann nicht so aufwändig (und die 
Datei wird bestimmt um die Hälfte kleiner).

<Multi_key> <u> <u> <1> <7> <f> <space> : "ſ"

Allerdings kann man die Datei auch schön durchsuchen. :)

Genau das war auch mein Gedanke, weshalb ich die offiziellenUnicode-Bezeichnungen auch als Kommentar (wie in den anderen Modulen)belassen hatte. Schließlich wird die Datei eh’ automatisch generiert …meine aktuelle Version (mit Kommentaren, ohne PUA) sieht jetzt so aus:

<Multi_key> <u> <u> <2> <0> <space> : " " U0020 # SPACE
<Multi_key> <u> <u> <2> <1> <space> : "!" U0021 # EXCLAMATION MARK
<Multi_key> <u> <u> <2> <2> <space> : "\"" U0022 # QUOTATION MARK
[…]


Kann ich das so einchecken oder gibt es noch Änderungswünsche?


Viele Grüße,
Dennis-ſ

Re: [Neo] unicode.module für die Linuxer

Antwort per Email an