Jörg Tewes <[EMAIL PROTECTED]> wrote on 21.11.05:

> Ich weiß gerade nicht ob der schon mal gemeldet wurde, aber ich meine
> ich habe einen Bug im UUZ gefunden.

Nicht wirklich, aber ich kenne das "Problem"...

> UUZ-Version steht im Header dieses Postings. Und zwar wird ein "Smilie
> nicht richtig decodiert.

Von "Decodierung" kann man hier nicht sprechen, nur von Konvertierung,
und da liegt auch genau der Knackpunkt.  Es handelt sich um einen nicht
codierten Body im Zeichensatz ISO-8859-1.

> Der Smilie sieht im Original aus wie nen Kreis mit nem senkrechten
> Strich links,

Dieses Zeichen nennt sich "LATIN SMALL LETTER THORN", das in CP437 nicht
existiert und daher, Du ahnst es schon, richtigerweise in ein kleines
"t" konvertiert wird.  Genauso wie z.B. ein "o" mit nem Strich durch
("LATIN SMALL LETTER O WITH STROKE") in ein "ö" konvertiert -- besser
gesagt transliteriert -- wird.

Genau genommen müßte der Thorn sogar in ein "th" konvertiert werden,
weil er ähnlich ei ein englisches "th" ausgesprochen wird, aber eine
Multibyte-Konvertierung existiert eingehend nicht (ausgehend schon).

> und Crosspoint stellt den als kleines t da.

Das ist so gewollt.  Es handelt sich nicht um einen Smilie, sondern um
ein ganz "normales" alphabetisches Zeichen (wird überwiegend in Island
verwendet), das aber von einigen immer wieder gerne als Smilie
"mißbraucht" wird (es soll eine rausgestreckte Zunge symbolisieren).   
Dafür verwendet man in plain ASCII "p" oder "P", und irgendwann ist
irgendwer darauf gekommen, den Thorn zu nehmen, weil die Zunge da
wenigstens mittig heraushängt. ;-)

Die Konvertierung des Thorn in ein "p" oder "P" wäre im Sinne einer
korrekten und sinnvollen Transliteration aber grundfalsch.  Und so
schlau, daß der UUZ aus dem Sinnzusammenhang erkennen könnte, ob es sich
hier um einen Text handelt, bei dem der Thorn auch als solcher gemeint
ist oder es sich doch um einen als Smilie mißbrauchten Thorn handelt,
ist er leider noch nicht...

Ich hatte aber in der Tat schon mal ganz heimlich überlegt zu prüfen, ob
unmittelbar vor dem Thorn smilie-typische Zeichenkombinationen wie ":-",
";-", ":", ";", "B-" usw. vorkommen und ihn in diesen Fällen tatsächlich
in ein "p" oder "P" zu konvertieren, aber bisher hatte ich Wichtigeres
am UUZ zu tun.  Zumal der Aufwand bei der Vielzahl der inzwischen vom
UUZ unterstützten Zeichensätze nicht ganz ohne wäre.  Aber Du kannst ja
schon mal alle denkbaren Kombinationen zusammenstellen, dann sehen wir
weiter. :-)

Die grundsätzliche Frage, die sich hier stellt, lautet: Wollen wir
korrekt und sinnvoll transliterieren oder bei der Konvertierung nach
einem Zeichen suchen, das optisch halbwegs ähnlich aussieht?  FreeXP hat
sich für ersteres entschieden, weil Texte sonst ziemlich unlesbar werden
könnten.

> Da ich nicht sagen kann wie das Zeichen innerhalb Crosspoints aussieht

"Innerhalb CrossPoints" gibt es dieses Zeichen nicht.  Jedenfalls nicht,
solange Codepage 437 der von XP verwendete Zeichensatz ist (in Codepage
850 hingegen existiert es).

> Ich werde das Posting mal gepackt UUEncoded ranhängen

Jo, danke.

> und die Mid für Michael mitliefern. Ich hoffe er ist noch bei
> T-Online.

Ja, bin ich auch noch, aber mit dem UUencode kam ich schon klar. ;-)


        Michael
------------------------------------------------------------------------
FreeXP Entwickler-Mailingliste
[email protected]
http://www.freexp.de/cgi-bin/mailman/listinfo/dev-list

Antwort per Email an