Hallo allerseits,
Peter Eberhard ſchrieb am 18.09.2009 06:39 Uhr:
Die U0020-Konstante kann man vielleicht auch weglassen, keine Ahnung.
Aber die Anführungszeichen müssen sein. ;-)
Und einige Ausnahmen muss man wohl extra behandeln, wie "\"" statt """ und "\\" statt
"\". Ich weiß nicht, ob das schon alle sind. Sieht so aus.
Vielen Dank für diese Fehleranalyse, Peter! Das kommt davon, wenn man
»mal eben« ein Skript zusammenkleistert … sobald die anderen offenen
Fragen geklärt sind, werde ich eine entsprechend korrigierte Version ins
SVN stellen. Dann sollte alles so funktionieren wie gedacht :-).
Martin Roppelt ſchrieb am 18.09.2009 07:43 Uhr:
<Multi_key> <u> <u> <f> <0> <0> <0> <0> <space> : # <Plane 15 Private Use,
First>
<Multi_key> <u> <u> <f> <f> <f> <f> <d> <space> : # <Plane 15 Private Use,
Last>
<Multi_key> <u> <u> <1> <0> <0> <0> <0> <0> <space> : # <Plane 16 Private Use,
First>
<Multi_key> <u> <u> <1> <0> <f> <f> <f> <d> <space> : # <Plane 16 Private Use,
Last>
Hm, am Ende ist wohl was verloren gegangen.
Jein …
die Private Use Area ist ja extra geschaffen worden, damit man auch
Zeichen kodieren kann, die eben /keinen/ offiziellen Unicode-Codepoint
haben (bspw. pIquD für tlhIngan Hol). Aber es handelt sich eben nicht um
Unicode-Zeichen, weshalb ich sie lieber erst mal nicht mit in die
unicode.module aufgenommen hatte.
Wenn diese ›fehlenden‹ Cokos aber wirklich gewünscht sind, könnte ich
sie durchaus in ein eigenes unicode_pua.module gießen. Allerdings: Da
hier jeder machen kann was er will müsste man dann wohl auch wirklich
/alle/ aufnehmen – ganz konkret wären das 2×(fffd-0-1) = 1FFF8 =
(…(1*16+15)*16+15)*16+15)*16+8 = 131.064 Cokos. Über den Daumen gepeilt
macht das ungefähr [(0.5×1,6 MB)/19.281 Zeilen]×13.1064 ≈ 5,44 MB –
wollt ihr das wirklich?
Da ist die Programm-technische NeoVars-Umsetzung doch wesentlich
eleganter (bzw. platzsparender :-)).
Folgende Form würde auch reichen, das ist dann nicht so aufwändig (und die
Datei wird bestimmt um die Hälfte kleiner).
<Multi_key> <u> <u> <1> <7> <f> <space> : "ſ"
Allerdings kann man die Datei auch schön durchsuchen. :)
Genau das war auch mein Gedanke, weshalb ich die offiziellen
Unicode-Bezeichnungen auch als Kommentar (wie in den anderen Modulen)
belassen hatte. Schließlich wird die Datei eh’ automatisch generiert …
meine aktuelle Version (mit Kommentaren, ohne PUA) sieht jetzt so aus:
<Multi_key> <u> <u> <2> <0> <space> : " " U0020 # SPACE
<Multi_key> <u> <u> <2> <1> <space> : "!" U0021 # EXCLAMATION MARK
<Multi_key> <u> <u> <2> <2> <space> : "\"" U0022 # QUOTATION MARK
[…]
Kann ich das so einchecken oder gibt es noch Änderungswünsche?
Viele Grüße,
Dennis-ſ