Florian Thaler <[email protected]> writes:

> Hi Arne,
>
>
>> Das hier zeigt nur die relative Belastung der Finger. Im Vergleich
>   zu QWERTZ ist die Gesamtbelastung niedriger, weil die Finger sich
>   viel weniger verrenken müssen — sie bleiben mehr auf der Grundlinie
>   und es gibt weniger Handspreizungen u.ä.
>
> Das stimmt natürlich. Ich bin trotzdem irgendwie am Hoffen, dass sich
> irgendwann eine Belegung mit den 1-1.6-2-2-2 Kriterien entsprechenden
> Belastungen findet.  :)

Schau dir mal die Daten auf der (neuen) Seite zum Optimierer an. Mine
ist näher dran als irgendeina andere Belegung:
https://www.draketo.de/software/keyboard-layout-evolution

>> Fix sind , und .
>
> Interessant. Wieso denn?

Weil sie einen mentalen Stop im Textfluss bedeuten. Das lässt sich nicht
über n-gramme einfangen, deswegen würde ein Optimierer sie falsch
positionieren.

>> Würde ich Berechnungen über trigramme aufgeben, …
>
> Trigramme hören sich aber WIRKLICH wichtig an, also würde ich das in
> keinem Fall machen.

Ich auch nicht :-)

>> Wenn du mit den bestehenden Kriterien ein neues Programm schreiben
>   willst, das viel schneller ist, bringt das für weitere Experimente
>   wahrscheinlich viel. Das Problem dabei ist allerdings, dass du keine
>   der Kriterien weglassen kannst — die sind nicht zufällig
>   dazugekommen, sondern sind alle das Ergebnis von Tipptests.
>
> Das hört sich in der Tat verlockend an. Davor muss ich aber noch zwei
> andere Programmier-Projekte fertigstellen (und nebenbei das Studium
> überleben), also braucht das wenn dann noch einige Zeit.

Kein Problem :-)

>    Frage:
>
> Woher kommt eigentlich dein Wortkorpus? In deinem Verzeichnis habe ich
> zwar ein paar Files gefunden, die nicht ordentlich angezeigt werden
> konnten, aber keine wirkliche Beschreibung. (Es kann aber natürlich
> sein, dass ich die Beschreibung einfach übersehen habe. Ich komme
> irgendwie nicht ganz so gut mit der Website zurecht.)

Der Korpus baut auf einem Zeitungskorpus der Uni-Leipzig, Quellcode,
Texten aus dem Projekt Gutenberg, und ein paar mehr auf.
→ https://hg.sr.ht/~arnebab/evolve-keyboard-layout/browse/ngrams.config?rev=tip

> Ich stelle diese Frage weil mir klar wurde, dass unsere Ergebnisse
> natürlich nur so gut getestet werden können, wie es der Korpus
> zulässt.

Jupp: Abgesehen von den Parametern selbst ist der Corpus die größte
      Quelle für Unsicherheiten.

Wir hatten ein paar Versuche, ihn deutlich zu verbessern, die sind aber
alle irgendwo hängengeblieben.

Selbst ein händisches Aufräumen der berechneten n-gram Dateien könnte
eine deutliche Verbesserung bringen — z.B. um Unterschiede zu
beseitigen, die eigentlich nur Rauschen sind, den Optimierer aber
fehlleiten.

https://hg.sr.ht/~arnebab/evolve-keyboard-layout/browse/1-gramme.arne.txt?rev=tip
https://hg.sr.ht/~arnebab/evolve-keyboard-layout/browse/2-gramme.arne.txt?rev=tip
https://hg.sr.ht/~arnebab/evolve-keyboard-layout/raw/3-gramme.arne.txt?rev=tip

(das letzte al raw, weil der Parser der Seite bei den vieltausend Zeilen
streikt)

Bei den Trigrammen zu beachten: Sie sind bereits Präprozessiert; das ist (U: 
(⇧u (⇗u

Liebe Grüße,
Arne
-- 
Unpolitisch sein
heißt politisch sein
ohne es zu merken

Attachment: signature.asc
Description: PGP signature

_______________________________________________
Diskussion mailing list -- [email protected]
To unsubscribe send an email to [email protected]

Antwort per Email an