Am Sonntag, 13. Dezember 2009 23:12:26 schrieb Karl Köckemann:
> Wie das in dem Korpus umfassend behoben
> werden kann, ist mir noch nicht klar.

Am besten mit einem Skript. Hier eine Möglichkeit:
http://lists.opensuse.org/opensuse-de/2007-02/msg01398.html

> Der Leipziger Textkorpus enthält übermäßig viele Personen- und
> Ortsnamen

Seltene Namen werden auch in diesem Corpus nicht häufig auftauchen, so dass die 
letztlich keinen wirklich störenden Einfluss haben. Betrachtet man insbesondere 
nur Bigramme, ist der entstehende Fehler noch geringer.


Gruß,
Pascal

Attachment: signature.asc
Description: This is a digitally signed message part.

Antwort per Email an