Karl Köckemann wrote: > liege ich richtig mit der Vermutung, dass die Daten auf den modifizierten > Leipziger Korpus basieren?
Jupp (wenn keine Bugs drin sind :) ). Das sind die Daten, die ich auch für die Optimierung nutze (einfach aus der 1gramme.txt ausgelesen, dann Groß- und Kleinschreibung zusammengeführt). Der Hauptzweck der Rechnung ist, herauszufinden, wieviel Unbequemlichkeit wir durch unsere Sprache beim Tippen auf der Grundebene mindestens haben. Liebe Grüße, Arne
