Am Samstag, 7. Januar 2012, 19:50:13 schrieb Matija Šuklje:
> Hey,
>
> Ich weiß nicht ob ihr's wüstet, aber Google Books macht — und
> veröffentlicht! — auch n-grame für die Bücher die ihr gescant haben:
>
> http://books.google.com/ngrams/datasets

Jupp, die sind sehr cool.

Allerdings sind es Wort-NGramme, nicht Buchstaben-NGramme, das heißt, wir
müssten die ~30GiB an Daten noch parsen und hätten dadurch nur den
Literaturteil, aber nicht den Teil zu normalen Texten.

Es wäre aber auf jeden Fall eine klasse Ergänzung.

Liebe Grüße,
Arne

--
1w6 sie zu achten,
sie alle zu finden,
in Spiele zu leiten
und sacht zu verbinden.
→ http://1w6.org

Attachment: signature.asc
Description: This is a digitally signed message part.

Antwort per Email an