Hallo allerseits,
Karl Köckemann ſchrieb am 31.12.2009 11:24 Uhr:
Arbeitet jemand an der Erschließung eines anderen Textkörpers wie z. B.
Wikipedia?
Meines Wissens derzeitig nicht. Ich selbst hatte mal damit angefangen
und ein naives kleines Java-Programm geschrieben, dass einen gegebenen
Am Wed, 30 Dec 2009 17:12:55 schrieb wettstein...@solnet.ch:
> Zum Beispiel gibt es im Leipziger Korpus recht viele geraden
> Anführungszeichen ("), die anstelle typographisch korrekter
> Anführungszeichen benutzt werden.
Für den Leipziger Korpus wurde aus den Quellen jeweils ein Satz heraus
gepi
> interessanter fände ich es etwa, den 1M-Leipzig-Korpus mit einem
> 1M-Wikipedia-Korpus zu vergleichen.
Dann bekommt man allenfalls eine Aussage über den systematischen Fehler
und erfährt nichts über den statistischen Fehler. Der systematische
Fehler hat nichts mit der Korpusgröße zu tun, sonder
Hallo allerseits,
Andreas ſchrieb am 28.12.2009 20:26 Uhr:
Um den Vorfaktor zu bekommen habe ich zwei Tastaturen […] mit verschiedenen
Korpora bewertet und aus den Einzelergebnissen den relativen Fehler […]
bestimmt. Die Korpora habe ich aus dem Leipziger 1M-Korpus gewonnen,
Wenn die vergl
> Je nachdem, welche Informationen aus dem Textkörper geholt werden
> sollen, kann ein größerer Textkörper erforderlich sein.
Das ist richtig. Für ein Gesamturteil reicht ein recht kleiner Korpus,
weil es sich aus vielen Einzelhäufigkeiten zusammensetzt, oder anders
ausgedrückt, einen Großteil de
Am 29.12.2009 08:44, schrieb Gemeinschaftspraxis:
>> Einmal hattest Du Linux-Befehle beschrieben, mit denen sich eine
>> Bigrammliste erstellen läßt (vielen Dank, sie waren mir hilfreich).
>> Danach entstanden aus dem Wort "Beispieltext" die Bigramme:
>> Be is pi el te xt
>>
>> Bei der von mir verw
> Ich meine ja hier, wenn ich links Shift drücke, und rechts das „n“ (um
> ein großes N zu schreiben), und danach den linken Kleinfinger sofort
> wieder betätige, dann ist das nicht ganz so schlimm als wenn ich den
> linken kleinen Finger mitten drin in einem Wort zweimal hinter
> einander benutzen
> Einmal hattest Du Linux-Befehle beschrieben, mit denen sich eine
> Bigrammliste erstellen läßt (vielen Dank, sie waren mir hilfreich).
> Danach entstanden aus dem Wort "Beispieltext" die Bigramme:
> Be is pi el te xt
>
> Bei der von mir verwendeten Variante entstehen aus dem Wort
> "Beispieltext"
> Einmal hattest Du Linux-Befehle beschrieben, mit denen sich eine
> Bigrammliste erstellen läßt (vielen Dank, sie waren mir hilfreich).
> Danach entstanden aus dem Wort "Beispieltext" die Bigramme:
> Be is pi el te xt
>
> Bei der von mir verwendeten Variante entstehen aus dem Wort
> "Beispieltext"
Am Mon, 28 Dec 2009 20:26:06 +0100
schrieb wettstein...@solnet.ch:
> Damit die Beurteilung einer Tastatur nicht zu sehr durch zufällige
> Variation der Zeichen- und Bigrammhäufigkeiten beeinflusst wird, muss
> der Korpus groß genug sein. Die Frage ist, wie groß.
Je nachdem, welche Informationen
Hallo Ulf,
am Mon, 28 Dec 2009 22:24:38 schrieb Ulf:
> Irgendwie kann es ja nicht sein, dass wir aus einem identischen
> Textkorpus unterschiedliche Bigramme ziehen. (Ich habe allerdings
> alle Bigramme in Kleinbuchstaben gezogen, und Komma und Punkt als
> Buchstaben behandelt, Karl hatte das etw
> Mittel rel. Fehler Files Zeilen Tastatur
>
> 236.353 0.00140541 1001 optimiert
> 236.357 0.00394096 10001000 optimiert
>
> 984.445 0.000574423 1001 pessimiert
> 984.446 0.0018825 10001000 pessimiert
>
> So ein 1
Damit die Beurteilung einer Tastatur nicht zu sehr durch zufällige
Variation der Zeichen- und Bigrammhäufigkeiten beeinflusst wird, muss
der Korpus groß genug sein. Die Frage ist, wie groß.
Die Beurteilung einer Tastatur wird durch eine Zahl ausgedrückt. Man
kann sich überlegen, dass für einen s
13 matches
Mail list logo