* Kai F. Lahmann wrote: >Die Frage wäre, wie viele der 20% gingen in welche Richtung daneben?
Um das zu beantworten bräuchte ich eine geeignete Datenbasis. Die Lösch- begründungen der Administratoren sind ja nicht sehr hilfreich, da wird gerne mal "Unsinn" mit WP:VAND-Link benutzt statt einem eher zutreffen- dem "Artikel okay, aber eher unterhalb der Relevanzschwelle" (und wenn man den Administrator freundlich bittet in Zukunft mehr auf korrekte Be- gründungen zu achten, revertiert er die Kritik in Sekundenschnelle von seiner Seite). >Normalerweise tendieren Spamfilter ja dazu, eher was liegen zu lassen >als was gutes zu löschen. Ich hab in meiner quick'n'dirty Auswertung auch nicht auf die Prozente geachtet, wenn der Filter sagt 51% "-", 49% "+" zähle ich das als "-". Mir ging es eigentlich nur darum mal in zwei, drei Stunden zu sehen, warum da Leute ihre Zeit drauf verwenden manuell Tastaturtests rauszu- löschen. An sich war CRM114 auch nicht gut genug dokumentiert für meine Zwecke, aber ein Bekannter aus dem Usenet hat auf seiner Webseite darauf hinge- wiesen, dass ausgerechnet Felix von Leitner zumindest vor Jahren den Klassifizierer für gut befand, da gefiel mir die Ironie gut genug das fertig zu machen. Ich hab für Perl im CPAN das Modul AI::CRM114 eingestellt, damit kann man ein entsprechendes Script in ein paar Minuten zusammenwürfeln. Wenn jemand mal ne Woche lang die Neueinstellungen sammlen und die Verschiebe- und Löschaktionen mitschneiden möchte, um dann händisch in "völlig unbrauchbar" und "ernsthafter Ansatz" zu teilen, damit man sich mal ein Bild machen kann, dann stell ich gerne ein entsprechen- des Script bereit. Mir fehlt im Moment der Server und die Lust zum händischen nachsortieren um das selbst zu machen. (Aber auch ohne kann man bei 80% unter diesen Umständen davon ausge- hen, dass bei guter und umfangreicherer Datenbasis die Quote weit in die 90er hineinreichen wird, völlig unverständlich warum man da nicht längst mal nen Google Summer of Code Projekt "löt mal spamfilter und Recent Changes zusammen und guck was rauskommt" gemacht hat.) -- Björn Höhrmann · mailto:[email protected] · http://bjoern.hoehrmann.de Am Badedeich 7 · Telefon: +49(0)160/4415681 · http://www.bjoernsworld.de 25899 Dagebüll · PGP Pub. KeyID: 0xA4357E78 · http://www.websitedev.de/ _______________________________________________ WikiDE-l mailing list [email protected] https://lists.wikimedia.org/mailman/listinfo/wikide-l
