Am 2005-05-10 16:20:24, schrieb Jan Kesten:
Hallo,
auch wenn ich gleich wieder was an den Kopf geworfen bekomme: Python!
Nur habe ich keine Zeit jetzt auch noch Python oder gar Perl zu lernen.
Na dann woll'n wir mal ;-)
Ich hab kurz was zusammengebastelt, das folgendes generiert:
% python ~/tmp/mboxhttp.py 2005-04.mbs | head http://www.debian.org/devel/wnpp/ http://www.daimlerchrysler.com/ir/smart_g http://www.xmr3.com/rm/268038-23765141-2-4415-DE1-6D25/[EMAIL PROTECTED]/HCSA7E9click http://people.debian.org/~joey/3.0r5/ http://www.debian.org/releases/woody/releasenotes http://www.debian.org/intro/organization http://marc.theaimsgroup.com/ http://lists.debian.org/debian-legal/2003/debian-legal-200310/msg00136.html http://lists.debian.org/debian-legal/2003/debian-legal-200310/msg00136.html http://people.debian.org/~joey/3.0r5/
Ich hab das mal mit
% find -name "*.mbs" -exec python ~/tmp/mboxhttp.py {} \;
über meine ca. 10000 Mails laufen lassen. Da tut's, was nicht heißt, das es da keine Fehler mehr gäbe. (Die Tücke sind kaputte (multipart-) Mails etc.).
% head -5 ~/tmp/mboxhttp.py
# MBox (oder Maildir, auskommentiert) reinsaugen und enthaltene http-urls ausspucken.
# - behandelt multipart-Message (ueberspringt kaputte Teile)
# - dekodiert quoted-printable/base64
# - behandelt (rudimentaer) als text/plain deklarierte
# Dummbatz-M$-HTML-Mails
Programm ist angehängt, hoffe es hilft, Fragen gerne.
Viele Grüße,
Tilo
mboxhttp.py
Description: Binary data