Am 24.06.2011 21:38, schrieb Arne Babenhauserheide:
Wie sieht es mit den Wikipedia N-Grammen aus?
Warum eigentlich nur Wikipedia n-Gramme? Wir haben doch noch eine offene
Diskussion betreffend 22.05.2011 21:59 "Wir brauchen den echten Korpus".
Wollten wir nicht erstmal den zu verwendenen Korpus bestimmen, bevor wir
die Evolution starten?
Wenn die Zusammensetzung der Sprachen für den Korpus feststeht muss man
Texte sammeln. Laut Diskussion braucht man verschiedene Textgattungen,
da Wikipedia laut Diskussion nicht als vollständig angesehen wird
(obwohl auf Wikipedia viel auf Diskussionsseiten diskutiert wird, was
exakt das wiederspiegelt, was Leute schreiben!)