Hallo Liste,

ab und an hab ich was neues, diesmal wie man mit XPATH ein HTML Dokument ausliest. Dazu nehme man eine Bibliothek (ich bevorzuge Python) die fürs Webcrawlen gedacht ist schüttle kräftig.

Fertig ist mein Mailinglisten-Extrator:
http://www.linuxmuster.net/wiki/anwenderwiki:mail:mailinglisten.extrahieren
inklusive upload-skript auf unser Schulwiki.

Hier ist es, wenn es jemand anderes braucht.
Und man lernt was dabei, wenn man es selbst macht.

Wer will, kann einen spider und eine pipeline schreiben, so dass z.B. alle aktuellen Mailadressen ausgelesen werden - dafür braucht man nicht mal die Rekursion (parse_job heißt sie bei mir).


Grüße, Tobias

_______________________________________________
linuxmuster-user mailing list
[email protected]
https://mail.lehrerpost.de/mailman/listinfo/linuxmuster-user

Antwort per Email an