On Thu, Aug 03, 2006 at 05:53:04PM +0200, Christian Frommeyer wrote: > Am Donnerstag 03 August 2006 17:48 schrieb Peter Wiersig: > > Du weisst das man Bayes-Filter nicht mit alten Daten fuettern > > soll? > > Echt nicht? Dann liegen die 60.000 Spam-Mails hier ja völlig > umsonst rum...
http://spamassassin.apache.org/full/3.0.x/dist/doc/sa-learn.html#effective_training Zum einen wandelt sich auch Spam relativ haeufig, zum anderen werden die Jahreszahlen dann zu hoch bewertet. Ich trainiere meine Filter lieber nur mit aktuellen Daten. Am effektivsten lernt z.B. POPFile nur wenn dieser Fehler macht. In den Filter von SA habe ich noch nicht allzutief hineingeschaut, wuerde aber auf Grund meines Kenntnisstands von Bayes-Filtern die auto-learn Funktion nicht aktivieren. Der Grossteil meines Spams wird an anderen Merkmalen als dem Body klassifiziert und ich erlebe in den letzten Wochen einem Zug der Spammer die versuchen speziell Bayes Filter zu umgehen. Schon aufgefallen, das viele Worte in Betreffzeilen einen Linux/OSS-Software Bezug erhalten? Peter -- Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/ Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED] mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)

