> Verstehe ich das mit den Strafpunkten richtig: Handwechselstrafpunkte > minimal bei allen anderen Kriterien maximale Strafpunkte veranlasst > den Optimierer, die Zeichen so auszugeben, dass für den > zugrundegelegten Textkörper die Handwechsel maximal werden.
Umkehrt: Viele Strafpunkte für Handwechsel, wenige für andere Kriterien (der Optimierer versucht die Strafpunkte zu minimieren). > Wie umfangreich war der zugrunde gelegte Textkörper? 11 MB, der kleinste der Leipziger Textkörper. Übrigens, vielen Dank für die fertigen Tabellen für den vollen Textkörper; ich werde einstweilen deine 1- und 2-Gramme verwenden. > Bei meinem Ergebnis bin ich mir nicht sicher, weshalb die Untersuchung später > genauer wiederholt werden soll. Deine Untersuchung braucht nicht wiederholt werden: Wenn wir die Gesamthäufgkeit eines Zeichen n nennen, und die Summen der Häufigkeiten mit der es in der ersten bzw. zweiten Position eines Bigramms auftaucht n₁ und n₂, dann ist, von der Skalierung abgesehen, die Größe in deiner Klassifikation n₂-n₁ = (n-n₁)-(n-n₂). Nun sind n-n₁ und n-n₂ offenbar die Häufigkeiten des Zeichens am Wortende und Wortanfang, das heisst, deine Klassfikation geht danach, ob ein Zeichen eher am Anfang oder am Ende von Wörtern steht. Ein gutes Kriterium für Sprachen deren Wörter typischeweise zwei Buchstaben haben, ein schlechtes für Sprachen deren Wörter typischeweise drei Buchstaben haben, ein irrelevantes für Deutsch. > Kann mit dem Optimierer überprüft werden, wie hoch Handwechsel zu einem > bestimmten Korpus sind, wenn vorher feststeht, welche Zeichen mit welcher > Hand (egal auf welcher Taste) bedient werden sollen? Klar, aber ein Auswerteprogramm tut es auch. Andreas
