Am 2004-06-01 02:19:04, schrieb Daniel Leidert:
>Am Di, den 01.06.2004 schrieb Michelle Konzack um 1:23:
>> Am 2004-05-31 23:05:39, schrieb Daniel Leidert:
>> 
>> >ACK. Der Bayes-Filter von SA f�ngt ja sowieso erst bei 200 angelernten
>> >Ham- und der gleiche Menge Spam-Mails an zu arbeiten.
>> 
>> Interessant, den ich habe spamassassin 2.63 erst lezten Monat 
>> installiert, sprich ich verwende ihn seit 3 Wochen und er hat 
>> mehr als 3000 SPAM gefiltert. Davon sind 7 kein Spam gewesen 
>> die ich mit 'sa-learn --ham' verf�ttert habe.
>
>Dann arbeitet der Bayes-Filter noch nicht. Ein
># spamassassin --lint -D

  ____ (stdin) _________________________________________________________
 /
|  debug: Score set 0 chosen.
|  debug: running in taint mode? yes
|  debug: Running in taint mode, removing unsafe env vars, and resetting PATH
|  debug: PATH included '/home/michelle/bin', keeping.
|  debug: PATH included '/bin', keeping.
|  debug: PATH included '/sbin', keeping.
|  debug: PATH included '/usr/bin', keeping.
|  debug: PATH included '/usr/sbin', keeping.
|  debug: PATH included '/usr/X11R6/bin', keeping.
|  debug: Final PATH set to: 
/home/michelle/bin:/bin:/sbin:/usr/bin:/usr/sbin:/usr/X11R6/bin
|  debug: ignore: using a test message to lint rules
|  debug: using "/usr/share/spamassassin" for default rules dir
|  debug: using "/etc/spamassassin" for site rules dir
|  debug: using "/home/michelle/.spamassassin" for user state dir
|  debug: using "/home/michelle/.spamassassin/user_prefs" for user prefs file
|  debug: using "/home/michelle/.spamassassin" for user state dir
|  debug: bayes: 21493 tie-ing to DB file R/O /home/michelle/.spamassassin/bayes_toks
|  debug: bayes: 21493 tie-ing to DB file R/O /home/michelle/.spamassassin/bayes_seen
|  debug: bayes: found bayes db version 2
|  debug: Score set 3 chosen.
|  debug: Initialising learner
|  debug: is Net::DNS::Resolver available? no
|  debug: is DNS available? 0
|  debug: running header regexp tests; score so far=0
|  debug: running body-text per-line regexp tests; score so far=2.077
|  debug: bayes corpus size: nspam = 4755, nham = 20034
|  debug: uri tests: Done uriRE
|  debug: tokenize: header tokens for *F = "U*ignore 
D*compiling.spamassassin.taint.org D*spamassassin.taint.org D*taint.org D*org"
|  debug: tokenize: header tokens for *m = " 1086083565 lint_rules "
|  debug: bayes token 'somewhat' => 0.000356055592322965
|  debug: bayes token 'H*F:D*org' => 0.0960428947134029
|  debug: bayes: score = 0.00259285488725947
|  debug: using "/home/michelle/.spamassassin" for user state dir
|  debug: bayes: 28493 untie-ing
|  debug: bayes: 28493 untie-ing db_toks
|  debug: bayes: 28493 untie-ing db_seen
|  debug: Razor2 is not available
|  debug: running raw-body-text per-line regexp tests; score so far=2.077
|  debug: running uri tests; score so far=2.077
|  debug: uri tests: Done uriRE
|  debug: running full-text regexp tests; score so far=2.077
|  debug: Razor2 is not available
|  debug: DCCifd is not available: no r/w dccifd socket found.
|  debug: Current PATH is: 
/home/michelle/bin:/bin:/sbin:/usr/bin:/usr/sbin:/usr/X11R6/bin
|  debug: DCC is not available: no executable dccproc found.
|  debug: Pyzor is not available: pyzor not found
|  debug: all '*From' addrs: [EMAIL PROTECTED]
|  debug: all '*To' addrs: 
|  debug: running meta tests; score so far=2.077
|  debug: is spam? score=-2.823 required=4 tests=BAYES_00,DATE_MISSING,NO_REAL_NAME
 \____________________________________________

>sollte Klarheit schaffen. Wenn in der Spam- oder Ham-Datenbank weniger
>als 200 Eintr�ge sind, gibt er eine entsprechende Meldung aus, dass der
>Bayes-Filter nicht genutzt wird.

Ach ja ?

>> Seit einer Woche habe ich keinen FP gehabt...
>
>Nur interessahlber. Wof�r steht FP?

False-Positives

>> Allerdings sind noch rund 70 SPAMS durchgerutscht die ich sofort 
>> an 'sa-learn --spam' verf�tterte...
>
>Hatte ich auch eine Weile probiert. Das Problem war, dass die Trennung
>zwischen Ham und Spam nicht sehr deutlich war. Am Ende habe ich bei 3.5
>Spam-Punkten gefiltert. Bei Bogofilter ist die Trennung bei mir deutlich
>besser. SA dient nur dazu, dahinter alles abzur�umen.

Ich habe SA auf 4.0 gesetzt

>> Also der SPAM hat sich innerhalb von drei ochen drastisch reduziert...
>
>M�glicherweise arbeiten die Datenbanken f�r Spam und Ham unabh�ngig
>voneinander. Aber mein Wissensstand ist: SA ben�tigt f�r beides 200

In der man/docu stehen 2000

>Mails, dann beginnt der Bayes-Filter zu arbeiten. Das merkt man dann
>auch, wenn man sich etwas mehr Header-Output geben l�sst.
>
>> >Bogofilter vor SA hat bei mir zu einer deutlichen Verbesserung des
>> >Ergebnisses beigetragen.
>> 
>> ???  Durchgerutschte Mails kannste direkt an 'sa-learn --spam' 
>> verf�ttern. Das recht vollst�ndig aus.
>
>Ich wei�. F�r mich funktioniert aber die andere L�sung besser. Und wie
>schon angemerkt wurde, ist Bogofilter deutlich angenehmer f�r die
>Systemresourcen.

Da ich adsl 512 zu hause habe, checke ich die 176 Mailaccounte 
alle 10 Minuten... Da brauche ich mich um System�berlastung nicht 
beklagen. Vor allem mu�te ich vor zwei Wochen wegen meiner Samsung 
Festplatten eine neues MB+CPU+RAM kaufen. Duron 1600 mit 128 MB.
Der langweilt sich bei den 3800 Mails pro Tag (ist nur ein FileServer)

Ich kompiliere sogar �ber Netzwerk...

>MfG Daniel

Greetings
Michelle

-- 
Linux-User #280138 with the Linux Counter, http://counter.li.org/ 
Michelle Konzack   Apt. 917                  ICQ #328449886
                   50, rue de Soultz         MSM LinuxMichi
0033/3/88452356    67100 Strasbourg/France   IRC #Debian (irc.icq.com)

Attachment: signature.pgp
Description: Digital signature

Antwort per Email an