Marco Antoni writes: > Zum Thema, wo man einen Korpus herbekommt: > http://www.gutenberg.org/wiki/Gutenberg:No_Cost_or_Freedom%3F und > http://www.gutenberg.org/wiki/German_Language_Books_(Bookshelf) > Lange Wikipediaartikel dürften z.B. auch geeignet sein.
Ohne jetzt erneut einen genaueren Blick auf die Gutenberg-Projekt-Seiten geworfen zu haben, gehe ich davon aus, dass deren Dateien sich nicht verändert haben. Sie erfordern leider sehr hohen Arbeitsaufwand, bis sie für die Aufnahme in einen für uns geeigneten Korpus hergerichtet sind. Einerseits ist der Sprachstil hoffnungslos veraltet; eine Umstellung auf Neue Rechtschreibung muss vollzogen werden; das Strippen von sich wiederholenden Gutenberg-Projekt-spezifischen ist unumgänglich. Wikipedia wäre eine feine Grundlage, die leider noch (viel) mehr Aufwand beim Strippen der Quelltexte erfordert. Wenn es nicht anders geht, dann werden die beiden Möglichkeiten angegangen werden müssen. Mit netten Grüßen Karl