wettstein...@solnet.ch wrote: >> Ich überlege gerade, ob es sinnvoll wäre, noch die Streuung der Werte >> miteinzubeziehen, so dass es möglichst wenige worst case Worte gibt >> (sowas wie „Völkerball“ in Neo). > > Meinst du, dass man sich um einzelne Worte scheren soll? Klar, wenn ein > wüstes Wort in einem Text dauernd vorkommt ist das vielleicht lästig, > aber da kann man sich mit einem guten Editor weiterhelfen. > > Auf der Ebene ganzer Texte vermute ich, dass schon die Minimierung des > Aufwands die Steuung klein macht:
Das bezweifle ich. Ich kann mir viele Minima vorstellen, in denen 99% der Bigramme sehr gut tippbar sind, 1% aber richtig schlecht. Und das würde direkt den Textfluss brechen. Deswegen könnten wir die Abweichung der Bigramme (besser noch Trigramme – möglichst große Einheiten) noch quadratisch eingehen lassen (trotzdem gewichtet nach ihrer Häufigkeit). Ein Ausreißer hat dann eine viel negativere Wertung als aktuell, so dass Tastaturbelegungen mit einem gleichmäßigen Textfluss gefördert werden. Summe über { (Häufigkeit des Trigramms) * * (Kosten des Trigramms - Durchschnittskosten pro Trigramm)² / / ((Anzahl Bigramme)*(Anzahl -1)) } (gewichtete Varianz; die Wurzel wäre die Standardabweichung, welche sinnvoller ist, kann die Praxis zeigen) Liebe Grüße, Arne