[Neo] Compose-Problem unter Gnome

2009-12-31 Diskussionsfäden Dennis Heidsiek

Hallo liebe Linux-Fraktion,


ich versuche gerade, Neo unter Ubuntu 9.10 (Netbook Remix) zum laufen zu 
bringen. Mit der Tastaturbelegung gab es auch keine Probleme, ich konnte 
»Neo 2 [RC]« bereits direkt bei der Installation auswählen und habe dann 
gemäß der Anleitung im Wiki die aktuelle xkb.tgz draufgespielt.


Aber Compose kriege ich einfach nicht richtig zum laufen: Die 
compose_gui.sh läuft problemlos und legt die von mir gewünschte 
~/.XCompose an. Allerdings wird sie – wie im Wiki bzw. in zwei Tickets 
erwähnt – erstmal von Gnome ignoriert, stattdessen wird eine 
Gnome-eigene Standard-Compose benutzt. Ich habe mich dann an die FAQ 
gehalten und die ~/.xinputrc mit folgendem Inhalt angelegt:

DISABLE_IMSETTINGS=yes
GTK_IM_MODULE=xim

Was aber keine Änderung gebracht hat. Ich habe dann die ~/.profile um 
diese beiden Zeilen ergänzt, und siehe da: Die Neo-spezifischen Cokos 
(wie ♫pf=₰, ♫|g=𝕘, ♫♫=♫) funktionieren jetzt – aber zu früh gefreut: 
Dafür werden jetzt die Standard-Cokos (wie ♫ae=æ, ♫oe=œ) ignoriert, 
/obwohl/ doch der Inhalt der enUS.module gleich am Anfang in meiner 
~/.XCompose enthalten ist. Und das ist jetzt der Punkt, wo ich mir die 
Augen reibe und etwas kompetente Linux-Starthilfe brauche …


Nochmal zusammengefasst: Ohne die beiden Zeilen oben funktionieren die 
Neo-Cokos nicht, und mit ihnen die Standard-Cokos nicht. Wie kriege ich 
/alle/ Cokos?



Viele Grüße und vielen Dank im Voraus,
Dennis-ſ (der Linux gerade eine Chance gibt)


PS: Ich hätte auch ein Ticket anlegen können, habe aber die Hoffnung, 
dass mein Problem eine offensichtliche Lösung hat bzw. einfach auf meine 
Linux-Inkompetenz zurückzuführen ist.





Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-31 Diskussionsfäden Karl Köckemann
Am Wed, 30 Dec 2009 17:12:55 schrieb wettstein...@solnet.ch:

> Zum Beispiel gibt es im Leipziger Korpus recht viele geraden
> Anführungszeichen ("), die anstelle typographisch korrekter
> Anführungszeichen benutzt werden.

Für den Leipziger Korpus wurde aus den Quellen jeweils ein Satz heraus
gepickt, was weitere Nachteile mit sich bringt. Deshalb kommt das "
im Leipziger Korpus reichlich oft lückenhaft vor, d. h. nicht als Paar,
wo ein Satz mit dem Zeichen beginnt oder endet. 

> Vor dem Problem der Korpusgröße steht bei Sonderzeichen, insbesondere
> seltenen, also das Problem der Quellenauswahl und allfälliger
> manueller Nachbesserung.  Auch ein 3G Leipziger Korpus würde hier
> nichts helfen, sondern im Gegenteil nur die manuelle Nachbesserung
> erschweren.

Die Leipziger Korpora basieren auf ISO-8859, also keine Unicodes, was
die Zeichenanzahl begrenzt.

Die Nachbesserung des Leipziger Korpus mit 3 Millionen Sätzen ist
weiterhin in Arbeit - schätzungsweise zu drei Viertel fertig gestellt.
Dabei versuche ich, folgende Kriterien umzusetzen:

an die Neue Rechtschreibung anpassen,
Teilkorrektur von Fehlern,
zeitungstypische Wiederholungen überarbeiten.

Das Gebiet der zeitungstypischen Wiederholungen ist weiter als zunächst
vermutet. Es umfasst in Großbuchstaben geschriebene Wörter,
Datums-/Autor-/Nachrichtenagenturangaben, Abkürzungen unter bestimmten
Bedingungen, Zwischengroßbuchstaben in Namen, Relevanzprüfung seltener
Zeichen, und Wiederholungen von Schlagzeileninhalten im darauffolgenden
Satz.

Bezogen auf Großbuchstaben und s bzw. ß sollte die Aussagekraft
anschließend sinnvoller sein. Ob sich der Aufwand des Nachbesserns
in weiteren Aspekten lohnen wird, vermag ich nicht abzuschätzen. 

Arbeitet jemand an der Erschließung eines anderen Textkörpers wie z. B.
Wikipedia?

Mit netten Grüßen
Karl