Re: [Neo] Textcorpora der Uni Leipzig - Buchstabenhä ufigkeit

2009-12-03 Diskussionsfäden Ulf Bro
> Am Donnerstag, 3. Dezember 2009 08:48:33 schrieb Ulf Bro: > > tr '[:upper:]' '[:lower:]' > > Ich hatte bereits in einer anderen Mail begründet, dass die Berücksichtigung > der Groß-/Kleinschreibung absolut relevant ist, um ein optimale Belegung zu > erzeugen. Es ist möglich, dass du Recht has

Re: [Neo] Textcorpora der Uni Leipzig - Buchstabenhä ufigkeit

2009-12-03 Diskussionsfäden Pascal Hauck
Am Donnerstag, 3. Dezember 2009 14:03:49 schrieb Karl Köckemann: > 46 a l 1.520.152 > 0,00456573380 15.035.255 97 9.872.084 108 > 47 n t 1.483.143 > 0,00445457831 27.012.723 110 16.948.435 116 > 48 SP S

Re: [Neo] Textcorpora der Uni Leipzig - Buchstabenhä ufigkeit

2009-12-03 Diskussionsfäden Karl Köckemann
Am Thu, 3 Dec 2009 08:48:33 +0100 schrieb Ulf Bro : > Am Donnerstag, 3. Dezember 2009 08:39 schrieb Gemeinschaftspraxis: > tr '[:upper:]' '[:lower:]' dingsbums.txt | grep -o > '[abcdefghijklmnopqrstuvwxyzäöüß]\{2\}' | sort | uniq -c | sort -nr > > bigramme.txt Diesesmal ging es um andere Detail

Re: [Neo] Textcorpora der Uni Leipzig - Buchstabenhä ufigkeit

2009-12-02 Diskussionsfäden Karl Köckemann
Buchstabenhäufigkeiten der Datei sentences.txt des Leipziger Textkorus: http://corpora.informatik.uni-leipzig.de/resources/flatfiles/de05_3M.zip Die in der Datei sentences.txt enthaltenen Zeilennummern sowie das darauf folgende Tabulatorzeichen wurden nicht mitgezählt. Diesesmal konnte die gesamt