Am 2004-09-12 07:26:52, schrieb S. Kremer: > Hi > Ich habe nun versucht mit > > sa-learn --spam --mbox /var/mail/<mailbox> und > sa-learn --ham --mbox /var/mail/<mailbox> > > die DB zu f�ttern, aber scheinbar reichen meine Mails noch nicht aus. > Ausserdem habe ich gemerkt, dass sa-learn wieder alle EMails > durchforstet, obwohl im Mailverzeichnis keine neuen Mails hinzugekommen
Er durchforstet immer alle Messages, danach steht aber:
Learned from 37 message(s) (1209 message(s) read)
(Das habe ich diesen Monat bekommen)
> Ich habe im Zuge meiner Suche auf einer Seite gelesen, dass f�r das
> Training der Bayes-DB zwei Ornder angelegt wurden, einmal f�r HAM und
> einmal f�r SPAM, per Skript wurden die beiden Ordner dann einmal t�glich
> durchforstet und damit die DB gef�ttert.
N���, wenn Du mel ne Debian-mailbox mauell bereinigt und die SPAM's
in einen seperaten Folder verschoben hast, setze sa-learn auf die
Debian-Mailbox mit "--ham" an Ich habe das mit allen manuell
ges�uberten Mailfoldern gemacht und SA mit 30.000 Messages --ham und
rund 10.000 Messages --spam gef�ttert.
> Welche M�glichkeit habe ich denn, die Bayes DB rel. schnell mit HAM und
> SPAM Eintr�gen zu f�llen, damit die auto_learn Option aktiviert wird?
> Gibt es da einen besonderen Trick oder ein paar gute Tipps?
s.o.
Bei den lezten rund 700.000 SPAMS habe ich kein einziges FP...
Habe die mails in meine postgresql importiert und analysiert,
von wo die alle herkommen und �ber welche Mailingliste ich sie
bekommen habe...
Somit kann ich in procmail meine "whitelist" f�r exim.org,
mutt.org, postgresql.org und php.net sowie isc.org verwenden
und spare mir das filtern mit SA.
> Gruss
> Stefan
Greetings
Michelle
--
Linux-User #280138 with the Linux Counter, http://counter.li.org/
Michelle Konzack Apt. 917 ICQ #328449886
50, rue de Soultz MSM LinuxMichi
0033/3/88452356 67100 Strasbourg/France IRC #Debian (irc.icq.com)
signature.pgp
Description: Digital signature

