-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Michelle Konzack wrote:

| Aber wieviele SPAMer verwenden weniger als 7 Zeichen mit M�ll ?
| Habe keine einzige gefunden. die waren alle l�nger.

Sind doch bei mir einige, 3-5 Zeichen wild gew�rfelt und gemixt.

| Jetzt m��te ich nur noch eine vern�nftige W�rter- und Namensliste
|  herbekommen. Am besten auf deutsch, englisch und franz�sisch,
| was warscheinlich 99% der Tri-Gramme abdecken sollte

Das Problem hier wird sein, dass sobald man anf�ngt danach zu
filtern auch die Spammer anfangen werden, ihre Mailadressen aus
g�ltigen Trigrammen zusammenzusetzen. Das sollte f�r die weniger
Arbeit werden als es f�r uns sein wird danach zu analysieren.

| Ja ich... kann keine Schlange progrmmieren... ...nur C, ASM und
| PHP + ein bischen Tcl/Tk.

Naja, auch in C sollte das ja kein Problem darstellen.

Mein (bisheriges) kleines QAD-Skript macht folgendes: Mit einem
Programm werden kann man komplette mbox-Dateien lesen und alle From:
Adressen in eine Blacklist oder eine Whitelist eintragen, die in
einer PostgreSQL Datenbank zu Hause sind. Dabei werden die
Realname-Eintr�ge beibehalten, jedoch caseinsensitive.

bwlist white /foo/bar/mbox

Mit zwei weiteren Tools k�nnen die dann abgefragt werden, ob die
Mail in der entsprechenden Liste steht (exitcode 1) oder nicht
(exitcode 0).

./wlist.py "Jan Kesten <[EMAIL PROTECTED]>"

Habe mal ein paar Timings laufen lassen und mich doch gegen einen
Deamon entschieden: ein Deamon-F�tterer (ebenfalls in Python)
braucht laut time zum starten 80ms. Die beiden Tools wlist/blist
brauchen insgesammt 120ms (auf einem K7-500) um die Datenbankmodule
zu Laden, den Query abzusetzen und dann sich zu beenden. Damit kann
ich leben.

Denkbar w�re noch, dass man z.B. den Test auf den Realname wegnimmt
und nur auf die reine Mailadresse schaut.

Cheers,
Jan

- --
GPG-KeyID: 82201FC4
Available at my public keyserver www.gpg-keyserver.de
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.4 (MingW32)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iD8DBQFBRYMzvvmCkIIgH8QRAjoMAJ48LN/hZKF+47a640C5rNUJ9nmh6wCcD3ce
fQ5gH1QuXvm5nhVOsf0u0ys=
=uN5Z
-----END PGP SIGNATURE-----


--
Haeufig gestellte Fragen und Antworten (FAQ): http://www.de.debian.org/debian-user-german-FAQ/


Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject "unsubscribe". Probleme? Mail an [EMAIL PROTECTED] (engl)



Antwort per Email an