Hallo Liste,
ab und an hab ich was neues, diesmal wie man mit XPATH ein HTML Dokument
ausliest. Dazu nehme man eine Bibliothek (ich bevorzuge Python) die fürs
Webcrawlen gedacht ist schüttle kräftig.
Fertig ist mein Mailinglisten-Extrator:
http://www.linuxmuster.net/wiki/anwenderwiki:mail:mailinglisten.extrahieren
inklusive upload-skript auf unser Schulwiki.
Hier ist es, wenn es jemand anderes braucht.
Und man lernt was dabei, wenn man es selbst macht.
Wer will, kann einen spider und eine pipeline schreiben, so dass z.B.
alle aktuellen Mailadressen ausgelesen werden - dafür braucht man nicht
mal die Rekursion (parse_job heißt sie bei mir).
Grüße, Tobias
_______________________________________________
linuxmuster-user mailing list
[email protected]
https://mail.lehrerpost.de/mailman/listinfo/linuxmuster-user