Am Sonntag, 13. Dezember 2009 23:12:26 schrieb Karl Köckemann: > Wie das in dem Korpus umfassend behoben > werden kann, ist mir noch nicht klar.
Am besten mit einem Skript. Hier eine Möglichkeit: http://lists.opensuse.org/opensuse-de/2007-02/msg01398.html > Der Leipziger Textkorpus enthält übermäßig viele Personen- und > Ortsnamen Seltene Namen werden auch in diesem Corpus nicht häufig auftauchen, so dass die letztlich keinen wirklich störenden Einfluss haben. Betrachtet man insbesondere nur Bigramme, ist der entstehende Fehler noch geringer. Gruß, Pascal
signature.asc
Description: This is a digitally signed message part.
