Am Mittwoch, 16. Dezember 2009 00:12:28 schrieb Karl Köckemann: > Dort gibt es zwar eine umfangreiche Liste mit den häufigsten Wörtern, > aber leider nicht mit absoluten oder relativen Häufigkeitswerten, > sondern nur mit Angaben zu Häufigkeitsklassen.
Das ist bei der Leipziger Wortliste ebenso. Ich habe für meine Statistik damals die relative Häufigkeit nach dem Zipfschen Gesetz versucht zu rekonstruieren, wobei das insbesondere für die häufigsten Buchstaben nur eingeschränkt funktioniert. Dennoch sind die Ergebnisse nicht abwegig. Heißt: vielleicht könnte man ähnliches mit dieser Quelle versuchen, auch wenn klar ist, dass eine direkte Angabe der relativen Häufigkeit sinnvoller, besser und einfacher ist. Gruß, Pascal
signature.asc
Description: This is a digitally signed message part.
