Re: [Neo] Wikipedia-Korpus selbstgemacht

2011-04-22 Diskussionsfäden Karl
Florian Janßen writes: Karl schrieb am 25.03.2011 um 11:07 Uhr: Was (vermutlich nicht nur) mich interessiert: Kann eine Anleitung erstellt werden, nach der die einzelnen Schritte so umsetzen kann, dass aus auf Wikimedia-Software basierende freie Wikis jeder selber den Textkorpus

[Neo] python-Skript gefunden (was: Wikipedia-Korpus selbstgemacht)

2011-04-22 Diskussionsfäden Karl Köckemann
Soeben verlief die Suche nach einem Konverter von MediaWiki-Markup zu Text erfolgreich. Mit dem unter GNU-Lizenz stehenden Programm läßt sich aus dem Wikipedia-XML-Dump ein Korups erstellen: http://medialab.di.unipi.it/wiki/Wikipedia_Extractor Selbst mit meinen geringen Kenntnissen gelang es

Re: [Neo] python-Skript gefunden

2011-04-22 Diskussionsfäden Michael Gattinger
könntest du mir bitte mal so 10 MB Ergebnis per E-Mail zukommen lassen? Am 22.04.2011 13:12, schrieb Karl Köckemann: Soeben verlief die Suche nach einem Konverter von MediaWiki-Markup zu Text erfolgreich. Mit dem unter GNU-Lizenz stehenden Programm läßt sich aus dem Wikipedia-XML-Dump ein

Re: [Neo] python-Skript gefunden

2011-04-22 Diskussionsfäden Karl Köckemann
Michael Gattinger writes: Am 22.04.2011 13:12, schrieb Karl Köckemann: Soeben verlief die Suche nach einem Konverter von MediaWiki-Markup zu Text erfolgreich. Mit dem unter GNU-Lizenz stehenden Programm läßt sich aus dem Wikipedia-XML-Dump ein Korups erstellen:

Re: [Neo] Alternative Layout-Berechnung

2011-04-22 Diskussionsfäden Marco Antoni
Hallo Liste und Joke, Am 18.04.2011, 10:11 Uhr, schrieb Joke de Buhr j...@seiken.de: natürlich nicht auf anhieb verstanden. Hoffe, nach mehrmaligem Durchlesen war es dann doch verständlich. Aber mal anders gefragt: Du meintest du hättest da schon ein ähnliches Programm vorliegen. a)