Am 2004-09-12 07:26:52, schrieb S. Kremer:
> Hi

> Ich habe nun versucht mit
> 
> sa-learn --spam --mbox /var/mail/<mailbox> und
> sa-learn --ham --mbox /var/mail/<mailbox>
> 
> die DB zu f�ttern, aber scheinbar reichen meine Mails noch nicht aus.
> Ausserdem habe ich gemerkt, dass sa-learn wieder alle EMails
> durchforstet, obwohl im Mailverzeichnis keine neuen Mails hinzugekommen

Er durchforstet immer alle Messages, danach steht aber:

    Learned from 37 message(s) (1209 message(s) read)

(Das habe ich diesen Monat bekommen)

> Ich habe im Zuge meiner Suche auf einer Seite gelesen, dass f�r das
> Training der Bayes-DB zwei Ornder angelegt wurden, einmal f�r HAM und
> einmal f�r SPAM, per Skript wurden die beiden Ordner dann einmal t�glich
> durchforstet und damit die DB gef�ttert.

N���, wenn Du mel ne Debian-mailbox mauell bereinigt und die SPAM's 
in einen seperaten Folder verschoben hast, setze sa-learn auf die 
Debian-Mailbox mit "--ham" an Ich habe das mit allen manuell 
ges�uberten Mailfoldern gemacht und SA mit 30.000 Messages --ham und 
rund 10.000 Messages --spam gef�ttert.

> Welche M�glichkeit habe ich denn, die Bayes DB rel. schnell mit HAM und
> SPAM Eintr�gen zu f�llen, damit die auto_learn Option aktiviert wird?
> Gibt es da einen besonderen Trick oder ein paar gute Tipps?

s.o.

Bei den lezten rund 700.000 SPAMS habe ich kein einziges FP...
Habe die mails in meine postgresql importiert und analysiert, 
von wo die alle herkommen und �ber welche Mailingliste ich sie 
bekommen habe...

Somit kann ich in procmail meine "whitelist" f�r exim.org, 
mutt.org, postgresql.org und php.net sowie isc.org verwenden 
und spare mir das filtern mit SA.

> Gruss
> Stefan

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917                  ICQ #328449886
                   50, rue de Soultz         MSM LinuxMichi
0033/3/88452356    67100 Strasbourg/France   IRC #Debian (irc.icq.com)

Attachment: signature.pgp
Description: Digital signature

Antwort per Email an