Am Samstag, 7. Januar 2012, 19:50:13 schrieb Matija Šuklje: > Hey, > > Ich weiß nicht ob ihr's wüstet, aber Google Books macht — und > veröffentlicht! — auch n-grame für die Bücher die ihr gescant haben: > > http://books.google.com/ngrams/datasets
Jupp, die sind sehr cool. Allerdings sind es Wort-NGramme, nicht Buchstaben-NGramme, das heißt, wir müssten die ~30GiB an Daten noch parsen und hätten dadurch nur den Literaturteil, aber nicht den Teil zu normalen Texten. Es wäre aber auf jeden Fall eine klasse Ergänzung. Liebe Grüße, Arne -- 1w6 sie zu achten, sie alle zu finden, in Spiele zu leiten und sacht zu verbinden. → http://1w6.org
signature.asc
Description: This is a digitally signed message part.
