Am Freitag, 13. Januar 2012, 10:31:49 schrieb Karl Köckemann: > Da die n-Gramme aus einem Textkorpus erzeugt werden können und ein > Textkorpus für die Überprüfung einer Tastenbelegung praktischer erscheint, > sind Textkorpusse für Neo viel interessanter als fertige n-Gramme aus nicht > reproduzierbarem Ursprung.
Ganz wertlos sind die n-Gramme natürlich nicht - man kann ja auch aus Wörtern (und Worthäufigkeiten) Buchstaben-n-Gramme (mit entspr. Häufigkeiten) erstellen. Mit Googles Daten sogar in Abhängigkeit von Jahreszahlen, wenn ich das richtig sehe (Erscheinungsdaten der Bücher nehme ich an). Ist sicherlich kein Ersatz für einen bekannten, spezialisierten Korpus (auch weil Zeichen fehlen, denke ich), aber trotzdem statistisch gesehen wertvoll, alleine wegen des Umfangs. Ciao, Hans