> Ich würde persönlich erstmal Shift ignorieren (ist das der Bug?)

Klar, nur etwa 5% der Zeichen sind Großbuchstaben, und ihre Häufigkeit
ist durch den Text, nicht durch die Belegung vorgegeben.  Das spricht
dafür, sie zu ignorieren.  Andererseits, falls man sich wegen einem
Prozent mehr oder weniger Fingerkollisionen Gedanken macht kommt man um
die Berücksichtigung von Shift kaum herum.  Zum Beispiel:

  Eidur          251.831 Gesamtaufwand 190.763 Lageaufwand       links rechts
  ------------     0.808 Kollisionen    18.900 Shift-Kollisionen ob  9.8 13.0
  äuocj khlmvx    70.849 Handwechsel    21.786 Shift-Handwechsel mi 36.6 31.2
  aietp gdnsrß    14.092 Einwärts       56.533 Shift-Einwärts    un  7.5  8.6
  .,üöq zbwfy     11.976 Auswärts        2.781 Shift-Auswärts   sum 53.9 52.7
             Finger 11.9 12.3 19.2 10.5 | 16.5 14.8 10.5 10.9 Shift  4.5  2.1

Hier verdoppelt sich die Anzahl Kollisionen, sobald man die Kollisionen
mitzählt, bei denen der gleiche kleine Finger erst Shift drückt und
direkt danach eine andere Taste anschlagen muss oder umgekehrt (oben
Shift-Kollision genannt, die Zahl ist auf die Zahl der Bigramme mit
Großbuchstaben bezogen).

> Die Lagepunkte sind nach meiner Meinung in erster Linie ein Werkzeug um
> das Programm in bestimmte Bahnen zu zwingen und können so auch nicht
> Gegenstand einer demokratischen Umfrage werden (!).

Ich sehe das technokratischer.  Wenn die Lagepunkte nicht interessieren
lässt man sie weg; wenn sie interessieren sollten sie vernünftig sein
und angemessen gewichtet werden, sonst vermasseln sie nur die
automatische Optimierung.


> > 10             238.143 Gesamtaufwand 189.086 Lageaufwand       links rechts
> > ------------     0.797 Kollisionen     6.650 Shift-Kollisionen ob  8.1 13.3
> > cüo., bgmlfß    70.905 Handwechsel    23.395 Shift-Handwechsel mi 39.2 32.2
> > teaiu hdnrsx    14.225 Einwärts       66.138 Shift-Einwärts    un  6.0  7.8
> > jqäöy kpwvz     11.798 Auswärts        3.817 Shift-Auswärts   sum 53.3 53.3
> >            Finger 14.0 16.6  9.0 13.7 | 16.3 13.8 12.1 11.2 Shift  4.8  1.8
> 
> So eine Ähnliche habe ich mehrmals gehabt. Ich bekomme aber:
> ===========
> cüo., bgmlfß
> teaiu hdnrsx
> jqäöy kpwvz
> Lagepunkte........    145
> Fingerwiederholung  0.770 %
> Handwechsel....... 74.543 %
> Einwärtsbewegung.. 14.958 %
> Auswärtsbewegung..  9.730 %
> Fingerverteilung:
> 9.17 16.55  9.01 13.74 | 16.35 13.76 12.06  9.36
> 
> Deine Prozente Wiederholung, Wechsel, Einwärts, Auswärts summieren sich
> nicht zu 100%. Das stört irgendwie.

Bei Kollisionen zähle ich Mehrfachanschläge (also zum Beispiel «ll»)
nicht mit.  Ich gebe sie auch nicht mit der Tastatur, sondern mit der
Korpusstatistik aus, denn sie sind eine Eigenschaft des Korpus, nicht
der Belegung.

Die Unterschiede kommen vermutlich von den Bigrammhäufigkeiten.
bigramme-de.txt von deiner Homepage sieht deutlich anders aus als Karls
2gramme.txt.  Du verwendest die 1M Datei, Karl die 3M Datei.  Mit
sentences.txt aus der 100k-Datei bekomme ich eine ähnliche Verteilung
wie Karl.

> Wenn man eine Eigenschaft optimiert, leidet vielleicht eine andere.

Wenn es anders wäre würde ich dem Optimierer nicht trauen.

Andreas

Antwort per Email an