Am 24.06.2011 21:38, schrieb Arne Babenhauserheide:
Wie sieht es mit den Wikipedia N-Grammen aus?
Warum eigentlich nur Wikipedia n-Gramme? Wir haben doch noch eine offene Diskussion betreffend 22.05.2011 21:59 "Wir brauchen den echten Korpus". Wollten wir nicht erstmal den zu verwendenen Korpus bestimmen, bevor wir die Evolution starten? Wenn die Zusammensetzung der Sprachen für den Korpus feststeht muss man Texte sammeln. Laut Diskussion braucht man verschiedene Textgattungen, da Wikipedia laut Diskussion nicht als vollständig angesehen wird (obwohl auf Wikipedia viel auf Diskussionsseiten diskutiert wird, was exakt das wiederspiegelt, was Leute schreiben!)

Antwort per Email an