Re: [Neo] Wiki-Korpus-Teststückchen (was: Re: Wikipedia-Korpus selbstgemacht)

2011-03-28 Diskussionsfäden Florian Janßen
Hallo Karl, diese Antwort geht auch an die Liste. neo-nntp schrieb am 27.03.2011 um 16:01 Uhr: == wurde nach dem Putzen zu (es sollte werden), Dann hätten sie auch gleich nur »==« schreiben können (was sie zum Teil auch tun). Aber ist notiert und wird beim nächsten Durchlauf umgesetzt.

Re: [Neo] Wiki-Korpus-Teststückchen

2011-03-28 Diskussionsfäden Florian Janßen
Martin Roppelt schrieb am 28.03.2011 um 18:32 Uhr: Internetadressen würde ich komplett wegputzen, Weil sie in der Wikipedia recht häufig vorkommen, oder generell? Weblinks sind imho wieder ein Fall für Worst-Case-Prüfen, d.h. sie brauchen beim generellen Optimieren nicht berücksichtigt

Re: [Neo] Wiki-Korpus-Teststückchen

2011-03-28 Diskussionsfäden Martin Roppelt
Florian Janßen schrieb: Martin Roppelt schrieb am 28.03.2011 um 18:32 Uhr: alles was zwischen [[Kategorie: und dem nächsten ]] steht (gefolgt von Zeilenumbruch), sollte weg. Ist notiert. Jepp. Und Interwiki-Links auch. Was ist das? Sowas wie #REDIRECT? Links in der Form