Moin, moin! Sieht so aus als wird mein Vortrag beim Listentreffen einigermassen relevant sein :-)
> > hat jemand eine idee, wie man einen spam-filter realisiert? > > ich rufe mittels jmail emails ab und speichere sie in einer > > datenbank ... > > will alle verd�chtigen spams in einen extra ordner ablegen ... > > Kommt darauf an was f�r dich "verd�chtig" ist ... > Die grossen Hersteller r�cken halt meistens ihre Algorithmen nicht > raus... Du solltest auf jeden fall vorsehen bestimmte absender- oder > domainen-listen als spam anzusehen... Du k�nntest auch die > �ffentlichen listen von spammern nutzen, aber da wird wohl einem > VBS-Skript ziemlich schnell die puste ausgehen.. Einige spam-mails > haben auch viele leerzeichen im subject und dann hinten noch ne nummer > oder ein code o.�. Oder du benutzt worte und/oder phrasen, die spam > auszeichnen, z.B. "MAKE MONEY FAST" o.�. Manchmal hilft auch der > header... Schau dir mal ein paar spam-mails an... > > Du kannst auch versuchen die methode intelligent zu machen und nur bei > zusammentreffen von mehreren merkmalen die mail endg�ltig als spam zu > qualifizieren.. > > Es hilft sicher wenn man dazu ein paar tausend mail - spam und > nicht-spam - zu haben und damit die routinen zu testen... Man will ja > m�glichst auch keine falschen raussortieren.. Die reinen Stichwortfilter sind zu aufwendig und liefern relativ viele Fehlalarme. Headeranalyse ist eine gute Idee, kann aber auch schief gehen, bzw. ist zu aufwendig (DNS-lookups etc.) Statistische Ans�tze sind wesentlich besser geeignet. Blacklists alleine sind zu brutal, da sie meist unschuldige User im selben IP-block mit killen, also eher mit Whitelists arbeiten. Am besten ist eine Kombination aus verschiedenen Ans�tzen, so wie sie SpamAssassin praktiziert. Kann man wenigstens von klauen weil Open Source :-) Findet sich hier: http://www.spamassassin.org Geht sowohl serverseitig als auch clientseitig einzusetzen. Eine andere Implementation als clientseitiger pop3-proxy ist SAProxy, hier zu finden: http://saproxy.bloomba.com/ Wird von Chris, Herbert und mir erfolgreich verwendet. Gibt auch noch Spambayes als neuesten: http://saproxy.bloomba.com/ Theorie zum Thema Spamfiltern findet sich hier: http://www.paulgraham.com/spam.html http://www.paulgraham.com/better.html http://radio.weblogs.com/0101454/stories/2002/09/16/spamDetection .html http://spambayes.sourceforge.net/background.html So, das sollte mal vorl�ufig gen�gen.. Ciao, Bernd Kent Beck is a wimp. *Real* Extreme Programming is when you write Perl code on a toxic waste dump. ~~~~~~~~~~~~~~~~~~~~~~~~~~~sponsored by United Planet~~~~~~~~~~~~~~~~~ Kaffeepause im United Planet Communityserver ... http://www.intrexx.com/communityserver _______________________________________________ Coffeehouse mailing list [EMAIL PROTECTED] http://www.glengamoi.com/mailman/listinfo/coffeehouse
