Re: [Neo] symmetrische Bigramme (was: Ergonomische Tastaturbelegung führt zu Weltmeisterschaft)
On Thursday 24 March 2011 01:10:12 Pascal Hauck wrote: Es wäre interessant, zu sehen, welchen Einfluss dieses Symmetrie‑Kriterium auf den Optimierer hätte. Um konkret zu fragen: Meinst du damit, dass möglichst oft beim Handwechsel die genau gespiegelte Taste genutzt wird? Liebe Grüße, Arne signature.asc Description: This is a digitally signed message part.
Re: [Neo] symmetrische Bigramme (was: Ergonomische Tastaturbelegung führt zu Weltmeisterschaft)
Am Donnerstag, 24. März 2011, 10:58:46 schrieben Sie: Um konkret zu fragen: Meinst du damit, dass möglichst oft beim Handwechsel die genau gespiegelte Taste genutzt wird? Ja, genau darauf läuft es hinaus. Vor allem bei „ch“ fällt mir das bei Neo2 immer wieder positiv auf und ich in mir sicher, dass das eine Belegung verbessert. Die Gewichtung im Vergleich zu gut liegenden Tasten, Bigrammen etc. ist natürlich noch zu finden – aber genau damit sammeln wir ja gerade Erfahrung. Gruß, Pascal
[Neo] [ticket] #255: Mod3+i in Kopete erzeugt nicht / sondern öffnet Schnellsuche
#255: Mod3+i in Kopete erzeugt nicht / sondern öffnet Schnellsuche -+-- Reporter: patrick@…| Owner: Type: Fehler/Defekt| Status: new Priority: normal | Milestone: Neo Version 2.0 Component: Treiber: Linux – Xkbmap | Version: 2.0 Final Keywords: KDE, Kopete | -+-- Seit KDE 4.6 (Vermutung!) kann ich in Kopete im Chat-Fenster keinen Slash / mehr mit Mod3+i erzeugen. Stattdessen öffnet sich immer die Schnellsuche. Da ich diesen Fehler erst seit wenigen Monaten bemerke, gehe ich davon aus, dass er erst seit KDE 4.6 auftritt und deshalb wollte ich ihn zunächst nicht NEO anlasten. Allerdings entdecke ich mit QWERTZ kein Äquivalent für dieses Problem und meine eigenen Bemühungen, die Ursache zu finden, waren bisher nicht von Erfolg gekrönt und daher erstelle ich jetzt dieses Ticket in der Hoffnung auf Unterstützung bei der Problemlösung. Möglicherweise haben ja andere bereits dieses Problem gefunden. Keine Ahnung, ob das mit Bug #178 oder einem anderen verwandt ist, ich verstehe von den Zusammenhängen leider zu wenig, um es beurteilen zu können. Viele Grüße, Patrick -- Ticket URL: http://wiki.neo-layout.org/ticket/255 Neo-Layout http://neo-layout.org/ Das Neo-Tastaturlayout ist ein freies und ergonomisch optimiertes Tastaturlayout für die deutsche Sprache, das auch sehr viele Sonderzeichen direkt verfügbar macht.
[Neo] Wikipedia-Korpus selbstgemacht
Hallo, die Wikipedia Seiten und Artikel vom 01.02.2011 liegen mir als xml-Datei (gut 8GB) vor und ich ein Skript geschrieben, dass mir die Relevanten Text-Knoten extrahiert. Vorerst erstelle ich für jeden Artikel einen eigene Datei. Der Text liegt dann im Wikisyntax vor. Weiß jemand ob es schon Tools gibt um aus dem Wikitext normalen Text zu erzeugen? Gruß Florian
Re: [Neo] Wikipedia-Korpus selbstgemacht
Florian Janßen writes: die Wikipedia Seiten und Artikel vom 01.02.2011 liegen mir als xml-Datei (gut 8GB) vor und ich ein Skript geschrieben, dass mir die Relevanten Text-Knoten extrahiert. Vorerst erstelle ich für jeden Artikel einen eigene Datei. Puh, das wird viel Arbeit! Werden so viele einzelne Dateien noch sinnvoll handhabbar sein - und zudem wesentlich mehr als 8 GB erfordern? Der Text liegt dann im Wikisyntax vor. Weiß jemand ob es schon Tools gibt um aus dem Wikitext normalen Text zu erzeugen? Vor einem halben Jahr versuchte ich erfolglos ein Programm zum Strippen von Wiki-Markup zu finden. Was mir jetzt in den Sinn kommt: Es müsste genug Parser geben, die Wiki-Markup in HTML umsetzen, wobei wir einen benötigten, der alle Bilder entfernt. Vielleicht lassen sich für das Strippen von HTML einfacher Programme finden. Mit netten Grüßen Karl
Re: [Neo] Wikipedia-Korpus selbstgemacht
Karl schrieb am 24.03.2011 um 14:56 Uhr: Florian Janßen writes: die Wikipedia Seiten und Artikel vom 01.02.2011 liegen mir als xml-Datei (gut 8GB) vor und ich ein Skript geschrieben, dass mir die Relevanten Text-Knoten extrahiert. Vorerst erstelle ich für jeden Artikel einen eigene Datei. Puh, das wird viel Arbeit! Werden so viele einzelne Dateien noch sinnvoll handhabbar sein - und zudem wesentlich mehr als 8 GB erfordern? Es ist wesentlich besser als mit einer 8GB-Datei zu hantieren. Und soviel mehr Platz nehmen sie nicht weg. Vielleicht bündel ich die später zu 1000er-Packs oder so. Der Text liegt dann im Wikisyntax vor. Weiß jemand ob es schon Tools gibt um aus dem Wikitext normalen Text zu erzeugen? Vor einem halben Jahr versuchte ich erfolglos ein Programm zum Strippen von Wiki-Markup zu finden. Was mir jetzt in den Sinn kommt: Es müsste genug Parser geben, die Wiki-Markup in HTML umsetzen, wobei wir einen benötigten, der alle Bilder entfernt. Das hatte ich auch überlegt, habe mich dann aber für ein paar Zeilen in der Powershell entschieden. Die paar als Stichproben gelesenen Artikel gelesenen Artikel waren damit vom Wikisyntax befreit. Ich werde langsam zum Shell-Junkie :) Jetzt muss ich nur noch die paar Meta-Seiten raushauen und dann müsste der Grundkorpus fertig sein. signature.asc Description: OpenPGP digital signature
[Neo] Fotos und ein Video vom Belasern
Hallo! Hier jetzt noch ein paar Bilder und ein Video vom Belasern: http://hydra.erlangen.ccc.de/~schubi/neo2/ http://www.youtube.com/watch?v=VNwLor3zKTs
Re: [Neo] Wikipedia-Korpus selbstgemacht
Hallo, Wikipedia-Korpus ist fertig (knapp 9GB in 190 ~50MB Text-Dateien). Die N-Gramme sind auch fast fertig berechnet. Ich bin mal gespannt, wie groß die Unterschiede zum Leipziger Korpus sind und wie sehr die sich in der Bewertung mit Arnes Optimierer auswirken. Gruß Florian