Am Mittwoch, 16. Dezember 2009 00:12:28 schrieb Karl Köckemann:
> Dort gibt es zwar eine umfangreiche Liste mit den häufigsten Wörtern,
> aber leider nicht mit absoluten oder relativen Häufigkeitswerten,
> sondern nur mit Angaben zu Häufigkeitsklassen.

Das ist bei der Leipziger Wortliste ebenso. Ich habe für meine Statistik 
damals die relative Häufigkeit nach dem Zipfschen Gesetz versucht zu 
rekonstruieren, wobei das insbesondere für die häufigsten Buchstaben nur 
eingeschränkt funktioniert. Dennoch sind die Ergebnisse nicht abwegig.

Heißt: vielleicht könnte man ähnliches mit dieser Quelle versuchen, auch wenn 
klar ist, dass eine direkte Angabe der relativen Häufigkeit sinnvoller, besser 
und einfacher ist.


Gruß,
Pascal

Attachment: signature.asc
Description: This is a digitally signed message part.

Antwort per Email an