Re: [Neo] Wie groß muss ein Korpus sein?

2010-01-06 Diskussionsfäden Dennis Heidsiek
Hallo allerseits, Karl Köckemann ſchrieb am 31.12.2009 11:24 Uhr: Arbeitet jemand an der Erschließung eines anderen Textkörpers wie z. B. Wikipedia? Meines Wissens derzeitig nicht. Ich selbst hatte mal damit angefangen und ein naives kleines Java-Programm geschrieben, dass einen gegebenen

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-31 Diskussionsfäden Karl Köckemann
Am Wed, 30 Dec 2009 17:12:55 schrieb wettstein...@solnet.ch: > Zum Beispiel gibt es im Leipziger Korpus recht viele geraden > Anführungszeichen ("), die anstelle typographisch korrekter > Anführungszeichen benutzt werden. Für den Leipziger Korpus wurde aus den Quellen jeweils ein Satz heraus gepi

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-30 Diskussionsfäden wettstein509
> interessanter fände ich es etwa, den 1M-Leipzig-Korpus mit einem > 1M-Wikipedia-Korpus zu vergleichen. Dann bekommt man allenfalls eine Aussage über den systematischen Fehler und erfährt nichts über den statistischen Fehler. Der systematische Fehler hat nichts mit der Korpusgröße zu tun, sonder

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-30 Diskussionsfäden Dennis Heidsiek
Hallo allerseits, Andreas ſchrieb am 28.12.2009 20:26 Uhr: Um den Vorfaktor zu bekommen habe ich zwei Tastaturen […] mit verschiedenen Korpora bewertet und aus den Einzelergebnissen den relativen Fehler […] bestimmt. Die Korpora habe ich aus dem Leipziger 1M-Korpus gewonnen, Wenn die vergl

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-29 Diskussionsfäden wettstein509
> Je nachdem, welche Informationen aus dem Textkörper geholt werden > sollen, kann ein größerer Textkörper erforderlich sein. Das ist richtig. Für ein Gesamturteil reicht ein recht kleiner Korpus, weil es sich aus vielen Einzelhäufigkeiten zusammensetzt, oder anders ausgedrückt, einen Großteil de

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-29 Diskussionsfäden Matthias Wächter
Am 29.12.2009 08:44, schrieb Gemeinschaftspraxis: >> Einmal hattest Du Linux-Befehle beschrieben, mit denen sich eine >> Bigrammliste erstellen läßt (vielen Dank, sie waren mir hilfreich). >> Danach entstanden aus dem Wort "Beispieltext" die Bigramme: >> Be is pi el te xt >> >> Bei der von mir verw

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-29 Diskussionsfäden wettstein509
> Ich meine ja hier, wenn ich links Shift drücke, und rechts das „n“ (um > ein großes N zu schreiben), und danach den linken Kleinfinger sofort > wieder betätige, dann ist das nicht ganz so schlimm als wenn ich den > linken kleinen Finger mitten drin in einem Wort zweimal hinter > einander benutzen

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-29 Diskussionsfäden Ulf Bro
> Einmal hattest Du Linux-Befehle beschrieben, mit denen sich eine > Bigrammliste erstellen läßt (vielen Dank, sie waren mir hilfreich). > Danach entstanden aus dem Wort "Beispieltext" die Bigramme: > Be is pi el te xt > > Bei der von mir verwendeten Variante entstehen aus dem Wort > "Beispieltext"

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-28 Diskussionsfäden Gemeinschaftspraxis
> Einmal hattest Du Linux-Befehle beschrieben, mit denen sich eine > Bigrammliste erstellen läßt (vielen Dank, sie waren mir hilfreich). > Danach entstanden aus dem Wort "Beispieltext" die Bigramme: > Be is pi el te xt > > Bei der von mir verwendeten Variante entstehen aus dem Wort > "Beispieltext"

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-28 Diskussionsfäden Karl Köckemann
Am Mon, 28 Dec 2009 20:26:06 +0100 schrieb wettstein...@solnet.ch: > Damit die Beurteilung einer Tastatur nicht zu sehr durch zufällige > Variation der Zeichen- und Bigrammhäufigkeiten beeinflusst wird, muss > der Korpus groß genug sein. Die Frage ist, wie groß. Je nachdem, welche Informationen

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-28 Diskussionsfäden Karl Köckemann
Hallo Ulf, am Mon, 28 Dec 2009 22:24:38 schrieb Ulf: > Irgendwie kann es ja nicht sein, dass wir aus einem identischen > Textkorpus unterschiedliche Bigramme ziehen. (Ich habe allerdings > alle Bigramme in Kleinbuchstaben gezogen, und Komma und Punkt als > Buchstaben behandelt, Karl hatte das etw

Re: [Neo] Wie groß muss ein Korpus sein?

2009-12-28 Diskussionsfäden Ulf Bro
> Mittel rel. Fehler Files Zeilen Tastatur > > 236.353 0.00140541 1001 optimiert > 236.357 0.00394096 10001000 optimiert > > 984.445 0.000574423 1001 pessimiert > 984.446 0.0018825 10001000 pessimiert > > So ein 1

[Neo] Wie groß muss ein Korpus sein?

2009-12-28 Diskussionsfäden wettstein509
Damit die Beurteilung einer Tastatur nicht zu sehr durch zufällige Variation der Zeichen- und Bigrammhäufigkeiten beeinflusst wird, muss der Korpus groß genug sein. Die Frage ist, wie groß. Die Beurteilung einer Tastatur wird durch eine Zahl ausgedrückt. Man kann sich überlegen, dass für einen s