Florian Thaler <[email protected]> writes: > Hi Arne, > > >> Das hier zeigt nur die relative Belastung der Finger. Im Vergleich > zu QWERTZ ist die Gesamtbelastung niedriger, weil die Finger sich > viel weniger verrenken müssen — sie bleiben mehr auf der Grundlinie > und es gibt weniger Handspreizungen u.ä. > > Das stimmt natürlich. Ich bin trotzdem irgendwie am Hoffen, dass sich > irgendwann eine Belegung mit den 1-1.6-2-2-2 Kriterien entsprechenden > Belastungen findet. :)
Schau dir mal die Daten auf der (neuen) Seite zum Optimierer an. Mine ist näher dran als irgendeina andere Belegung: https://www.draketo.de/software/keyboard-layout-evolution >> Fix sind , und . > > Interessant. Wieso denn? Weil sie einen mentalen Stop im Textfluss bedeuten. Das lässt sich nicht über n-gramme einfangen, deswegen würde ein Optimierer sie falsch positionieren. >> Würde ich Berechnungen über trigramme aufgeben, … > > Trigramme hören sich aber WIRKLICH wichtig an, also würde ich das in > keinem Fall machen. Ich auch nicht :-) >> Wenn du mit den bestehenden Kriterien ein neues Programm schreiben > willst, das viel schneller ist, bringt das für weitere Experimente > wahrscheinlich viel. Das Problem dabei ist allerdings, dass du keine > der Kriterien weglassen kannst — die sind nicht zufällig > dazugekommen, sondern sind alle das Ergebnis von Tipptests. > > Das hört sich in der Tat verlockend an. Davor muss ich aber noch zwei > andere Programmier-Projekte fertigstellen (und nebenbei das Studium > überleben), also braucht das wenn dann noch einige Zeit. Kein Problem :-) > Frage: > > Woher kommt eigentlich dein Wortkorpus? In deinem Verzeichnis habe ich > zwar ein paar Files gefunden, die nicht ordentlich angezeigt werden > konnten, aber keine wirkliche Beschreibung. (Es kann aber natürlich > sein, dass ich die Beschreibung einfach übersehen habe. Ich komme > irgendwie nicht ganz so gut mit der Website zurecht.) Der Korpus baut auf einem Zeitungskorpus der Uni-Leipzig, Quellcode, Texten aus dem Projekt Gutenberg, und ein paar mehr auf. → https://hg.sr.ht/~arnebab/evolve-keyboard-layout/browse/ngrams.config?rev=tip > Ich stelle diese Frage weil mir klar wurde, dass unsere Ergebnisse > natürlich nur so gut getestet werden können, wie es der Korpus > zulässt. Jupp: Abgesehen von den Parametern selbst ist der Corpus die größte Quelle für Unsicherheiten. Wir hatten ein paar Versuche, ihn deutlich zu verbessern, die sind aber alle irgendwo hängengeblieben. Selbst ein händisches Aufräumen der berechneten n-gram Dateien könnte eine deutliche Verbesserung bringen — z.B. um Unterschiede zu beseitigen, die eigentlich nur Rauschen sind, den Optimierer aber fehlleiten. https://hg.sr.ht/~arnebab/evolve-keyboard-layout/browse/1-gramme.arne.txt?rev=tip https://hg.sr.ht/~arnebab/evolve-keyboard-layout/browse/2-gramme.arne.txt?rev=tip https://hg.sr.ht/~arnebab/evolve-keyboard-layout/raw/3-gramme.arne.txt?rev=tip (das letzte al raw, weil der Parser der Seite bei den vieltausend Zeilen streikt) Bei den Trigrammen zu beachten: Sie sind bereits Präprozessiert; das ist (U: (⇧u (⇗u Liebe Grüße, Arne -- Unpolitisch sein heißt politisch sein ohne es zu merken
signature.asc
Description: PGP signature
_______________________________________________ Diskussion mailing list -- [email protected] To unsubscribe send an email to [email protected]
