[lmn] [OT] Belwue maillisten

T. Küchel Fri, 15 Aug 2014 05:49:48 -0700

Hallo Liste,

ab und an hab ich was neues, diesmal wie man mit XPATH ein HTML Dokumentausliest. Dazu nehme man eine Bibliothek (ich bevorzuge Python) die fürsWebcrawlen gedacht ist schüttle kräftig.


Fertig ist mein Mailinglisten-Extrator:
http://www.linuxmuster.net/wiki/anwenderwiki:mail:mailinglisten.extrahieren
inklusive upload-skript auf unser Schulwiki.

Hier ist es, wenn es jemand anderes braucht.
Und man lernt was dabei, wenn man es selbst macht.

Wer will, kann einen spider und eine pipeline schreiben, so dass z.B.alle aktuellen Mailadressen ausgelesen werden - dafür braucht man nichtmal die Rekursion (parse_job heißt sie bei mir).



Grüße, Tobias

_______________________________________________
linuxmuster-user mailing list
[email protected]
https://mail.lehrerpost.de/mailman/listinfo/linuxmuster-user

[lmn] [OT] Belwue maillisten

Antwort per Email an