Marco Antoni writes:

> Zum Thema, wo man einen Korpus herbekommt:  
> http://www.gutenberg.org/wiki/Gutenberg:No_Cost_or_Freedom%3F und  
> http://www.gutenberg.org/wiki/German_Language_Books_(Bookshelf)
> Lange Wikipediaartikel dürften z.B. auch geeignet sein.

Ohne jetzt erneut einen genaueren Blick auf die Gutenberg-Projekt-Seiten
geworfen zu haben, gehe ich davon aus, dass deren Dateien sich nicht verändert
haben. Sie erfordern leider sehr hohen Arbeitsaufwand, bis sie für die Aufnahme
in einen für uns geeigneten Korpus hergerichtet sind. Einerseits ist der
Sprachstil hoffnungslos veraltet; eine Umstellung auf Neue Rechtschreibung muss
vollzogen werden; das Strippen von sich wiederholenden
Gutenberg-Projekt-spezifischen ist unumgänglich.

Wikipedia wäre eine feine Grundlage, die leider noch (viel) mehr Aufwand beim
Strippen der Quelltexte erfordert.

Wenn es nicht anders geht, dann werden die beiden Möglichkeiten angegangen
werden müssen.

Mit netten Grüßen
Karl


Antwort per Email an