Re: [Neo] Wie groß muss ein Korpus sein?

Dennis Heidsiek Wed, 30 Dec 2009 04:48:00 -0800

Hallo allerseits,


Andreas ſchrieb am 28.12.2009 20:26 Uhr:

Um den Vorfaktor zu bekommen habe ich zwei Tastaturen […] mit verschiedenen 
Korpora bewertet und aus den Einzelergebnissen den relativen Fehler […] 
bestimmt.  Die Korpora habe ich aus dem Leipziger 1M-Korpus gewonnen,

Wenn die verglichenen Stichproben aus dem gleichen Korpus stammen, istdoch auch zu erwarten, dass sie sich nicht so sehr voneinanderunterscheiden … interessanter fände ich es etwa, den 1M-Leipzig-Korpusmit einem 1M-Wikipedia-Korpus zu vergleichen.

Ansonsten dürfte unbestritten sein, dass bei selteneren Zeichen wie »αℤein größerer Testkorpus genauer bzw. aufschlussreicher wäre … da isteher die Frage, ob dies für die automatische Optimierung überhauptrelevant ist oder vernachlässigt werden könnte. Aber wie soll man sonstüberhaupt entscheiden, wie gut (oder schlecht?) etwa die Ellipse …angeordnet werden sollte? Von daher plädiere ich grundsätzlich eher füreine breitere Datenbasis des Neo-3-Korpuses. Und die Häufigkeitenseltenerer Zeichen mögen zwar für die Optimierung der ersten Ebeneirrelevant sein, könnten aber in Hinsicht auf die Belegung der höherenEbenen durchaus lesenswert sein.



Viele Grüße,
Dennis-ſ

PS: Und wer die Korpusfrage für vollkommen irrelevant hält, dem ſchlageich auch weiterhin Goethes Fauſt (beide Theile) in gebrochenerOriginalſchreibweiſe vor ☺.

Re: [Neo] Wie groß muss ein Korpus sein?

Antwort per Email an