Am Mo, den 31.05.2004 schrieb Jakob Lell um 21:33:
> On Mon, May 31, 2004 at 07:45:18PM +0200, Thomas Letzner wrote:
> > Hi 
> > 
> > Hab mal ne triviale Frage und zwar soll mein Spamassassin mit SA-Learn seine
> > Trefferquote zu erh�hen. Dazu habe ich ein wenig gegoogelt und bin dabei auf
> > www.spamarchive.org gesto�en, nun habe ich dort heute Nachmittag diverse
> > *.gz Archive gesaugt (insgesamt ~950 MB) 
> 
> Hallo,
> 950 Mb komprimierte Mails sind entpackt einige Gigabyte. Das ist f�r
> diesen Zweck viel zu viel. Es w�rde vermutlich Tage dauern, sie alle
> mit sa-learn einzulesen. F�r diesen Zweck reichen einige tausend Mails
> v�llig aus.

IMHO ist auch das f�r den Bayes-Filter unn�tiger Overkill, wenn
zus�tzlich Bogofilter l�uft. Razor, Pyzor und DCC helfen, altbekannten
Spam auszusortieren. Werden dann noch passende Config-Variablen f�r SA
und Bogofilter zum Selbstlernen gesetzt, funktioniert das nach meiner
Erfahrung hervorragend.

>  Ich bekomme mit ca. 600 Mails in meinem Spamordner recht gute
> Ergebnisse. Zus�tzlich zu den Spam-Mails braucht man jedoch auch
> normale Mails, damit Spamassassin sie von Spam unterscheiden kann.

ACK. Der Bayes-Filter von SA f�ngt ja sowieso erst bei 200 angelernten
Ham- und der gleiche Menge Spam-Mails an zu arbeiten.

> > Das zweite w�re die Frage wie ich die gleichen Mails durch Bogofilter laufen
> > lassen kann?

Auf http://www.newbie-net.de/anleitung_imap.html#bogofilter gibt es ein
kleines Skript, das vielleicht eine Anregung ist. �hnlich k�nnte man
auch die von Bogofilter aussortierten Mails mit sa-learn an SA
�bergeben.

> Wieso willst du 2 Spamfilter verwenden? IMHO ist spamassassin mit
> Bayes alleine ausreichend.

Bogofilter vor SA hat bei mir zu einer deutlichen Verbesserung des
Ergebnisses beigetragen.

MfG Daniel

Attachment: signature.asc
Description: Dies ist ein digital signierter Nachrichtenteil

Antwort per Email an