> Verstehe ich das mit den Strafpunkten richtig: Handwechselstrafpunkte
> minimal bei allen anderen Kriterien maximale Strafpunkte veranlasst
> den Optimierer, die Zeichen so auszugeben, dass für den
> zugrundegelegten Textkörper die Handwechsel maximal werden.

Umkehrt: Viele Strafpunkte für Handwechsel, wenige für andere Kriterien
(der Optimierer versucht die Strafpunkte zu minimieren).

> Wie umfangreich war der zugrunde gelegte Textkörper?

11 MB, der kleinste der Leipziger Textkörper.  Übrigens, vielen Dank für
die fertigen Tabellen für den vollen Textkörper; ich werde einstweilen
deine 1- und 2-Gramme verwenden.

> Bei meinem Ergebnis bin ich mir nicht sicher, weshalb die Untersuchung später 
> genauer wiederholt werden soll.

Deine Untersuchung braucht nicht wiederholt werden:

Wenn wir die Gesamthäufgkeit eines Zeichen n nennen, und die Summen der
Häufigkeiten mit der es in der ersten bzw. zweiten Position eines
Bigramms auftaucht n₁ und n₂, dann ist, von der Skalierung abgesehen,
die Größe in deiner Klassifikation n₂-n₁ = (n-n₁)-(n-n₂).

Nun sind n-n₁ und n-n₂ offenbar die Häufigkeiten des Zeichens am
Wortende und Wortanfang, das heisst, deine Klassfikation geht danach, ob
ein Zeichen eher am Anfang oder am Ende von Wörtern steht.  Ein gutes
Kriterium für Sprachen deren Wörter typischeweise zwei Buchstaben haben,
ein schlechtes für Sprachen deren Wörter typischeweise drei Buchstaben
haben, ein irrelevantes für Deutsch.

> Kann mit dem Optimierer überprüft werden, wie hoch Handwechsel zu einem 
> bestimmten Korpus sind, wenn vorher feststeht, welche Zeichen mit welcher 
> Hand (egal auf welcher Taste) bedient werden sollen?

Klar, aber ein Auswerteprogramm tut es auch.

Andreas

Antwort per Email an