mit wget html inhalte in csv

2006-05-08 Diskussionsfäden niels jende
Hallo @ All!

Kann ich mit *wget* ein HTML file direkt ins csv Format wandeln, quasi
beim abholen?

Ich wurde aus der manpage leider diesbezueglich nicht viel schlauer!

Danke für Eure Tips schon im voraus

Gruß
Niels


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Matthias Haegele

niels jende schrieb:

Hallo @ All!

Kann ich mit *wget* ein HTML file direkt ins csv Format wandeln, quasi
beim abholen?


Bin grad nicht an einer Linuxbox, afaik geht das aber nicht ...
Getreu dem Motto one-job-one-tool, wget ist ja auch eher zum abholen 
gedacht ...


Also vielleicht nach einem Tool suchen das das konvertieren kann ...

Gruß
Niels

hth
MH


--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/


Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Christian Frommeyer
Am Montag 08 Mai 2006 11:58 schrieb niels jende:
 Kann ich mit *wget* ein HTML file direkt ins csv Format wandeln,
 quasi beim abholen?

Wie soll denn das funktionieren? Das sind doch fundamental 
unterschiedliche Datenstrukturen.

Gruß Chris

-- 
A: because it distrupts the normal process of thought
Q: why is top posting frowned upon



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden niels jende
Hallo Christian,

Christian Frommeyer schrieb:
 Wie soll denn das funktionieren? Das sind doch fundamental 
 unterschiedliche Datenstrukturen.
   

Das das zwei *völlig unterschiedliche* Datenstrukturen sind, weiß ich
ja. Ich suche nur nache einem Weg, das möglichst easy zu machen. Aber es
scheint keinen wirklich zu geben *grmpf*, oder hättest Du eine Idee?
 Gruß Chris
   
Gruß
Niels


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Frank Küster
niels jende [EMAIL PROTECTED] wrote:

 Hallo Christian,

 Christian Frommeyer schrieb:
 Wie soll denn das funktionieren? Das sind doch fundamental 
 unterschiedliche Datenstrukturen.
   

 Das das zwei *völlig unterschiedliche* Datenstrukturen sind, weiß ich
 ja. Ich suche nur nache einem Weg, das möglichst easy zu machen. 

Also brauchen wir einen Converter.  Gibt es denn einen, wenn die Datei
bereits geholt wurde?

 Aber es
 scheint keinen wirklich zu geben *grmpf*, oder hättest Du eine Idee?

Das Problem ist nicht die Kombination mit wget.  Aber solange niemand
weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
mit wget zu verheiraten.

Gruß, Frank
-- 
Frank Küster
Single Molecule Spectroscopy, Protein Folding @ Inst. f. Biochemie, Univ. Zürich
Debian Developer (teTeX)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Andreas Kretschmer
am  08.05.2006, um 13:56:29 +0200 mailte niels jende folgendes:
 Hallo Christian,
 
 Christian Frommeyer schrieb:
  Wie soll denn das funktionieren? Das sind doch fundamental 
  unterschiedliche Datenstrukturen.

 
 Das das zwei *völlig unterschiedliche* Datenstrukturen sind, weiß ich
 ja. Ich suche nur nache einem Weg, das möglichst easy zu machen. Aber es

Zieh Dir doch einfach mal eine X-beliebige Website (Debian, BLÖD, Porno)
und versuch mal in Worten eine Anweisung zu definieren, wie das nach CSV
gehen soll...


Mit freundlichen Grüßen, A. Kretschmer 
-- 
Andreas Kretschmer(Kontakt: siehe Header)
Heynitz:  035242/47215,  D1: 0160/7141639
GnuPG-ID 0x3FFF606C http://wwwkeys.de.pgp.net
 ===Schollglas Unternehmensgruppe=== 


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden niels jende
Hallo Frank,

Frank Küster schrieb:


 Also brauchen wir einen Converter.  Gibt es denn einen, wenn die Datei
 bereits geholt wurde?
   
   

Ja, es scheint als ob es einen gibt, ich habe nur das Script gefunden. 
Ich will es damit mal nachher probieren; hier mla der Link

http://sebsauvage.net/python/html2csv.py


 Das Problem ist nicht die Kombination mit wget.  Aber solange niemand
 weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
 mit wget zu verheiraten.

   

Das wird glaube ich ganz schön schwierig; wenn es nicht geht - geht's
halt nicht :-(

 Gruß, Frank
   
Gruß
Niels


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Matthias Haegele

Andreas Kretschmer schrieb:
[...]

Zieh Dir doch einfach mal eine X-beliebige Website (Debian, BLÖD, Porno)


scnr: Sieht das dann bei letzterem dann irgendwie so aus wenn die Bilder 
nach ascii konvertiert werden :-)?:


(.)  (.)

   v

Ja ist schlecht gemacht ich weiss ...


und versuch mal in Worten eine Anweisung zu definieren, wie das nach CSV
gehen soll...


Mit freundlichen Grüßen, A. Kretschmer 


MH


--
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/


Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Frank Küster
niels jende [EMAIL PROTECTED] wrote:

 Hallo Frank,

 Frank Küster schrieb:


 Also brauchen wir einen Converter.  Gibt es denn einen, wenn die Datei
 bereits geholt wurde?
   
   

 Ja, es scheint als ob es einen gibt, ich habe nur das Script gefunden. 
 Ich will es damit mal nachher probieren; hier mla der Link

 http://sebsauvage.net/python/html2csv.py

Aha, du willst also die Tabellen in der html-Datei konvertieren, ja? 

 Das Problem ist nicht die Kombination mit wget.  Aber solange niemand
 weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
 mit wget zu verheiraten.

   

 Das wird glaube ich ganz schön schwierig; wenn es nicht geht - geht's
 halt nicht :-(

Äh, das Kombinieren ist trivial, nur das Abschneiden von
protocol://servername/ ist etwas tricky:

#!/bin/sh

url=$1
filename=`basename ${url#*://*/}`

wget $url
html2csv $filename

Gruß, Frank
-- 
Frank Küster
Single Molecule Spectroscopy, Protein Folding @ Inst. f. Biochemie, Univ. Zürich
Debian Developer (teTeX)



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden Marcus Walther
Hallo Niels!

niels jende schrieb:
[...]
 Also brauchen wir einen Converter.  Gibt es denn einen, wenn die Datei
 bereits geholt wurde?
 Ja, es scheint als ob es einen gibt, ich habe nur das Script gefunden. 
 Ich will es damit mal nachher probieren; hier mla der Link
 
 http://sebsauvage.net/python/html2csv.py

Das Ding soll Daten in HTML-Tabellen im CSV-Format abspeichern. Ist es
das, was du willst?

 Das Problem ist nicht die Kombination mit wget.  Aber solange niemand
 weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
 mit wget zu verheiraten.
 Das wird glaube ich ganz schön schwierig; wenn es nicht geht - geht's
 halt nicht :-(

Hey, es handelt sich um Software, da ist prinzipiell alles machbar. ;-)

Gruß, Marcus



Re: mit wget html inhalte in csv

2006-05-08 Diskussionsfäden niels jende
Hallo Marcus,

Marcus Walther schrieb:
 Hallo Niels!

 niels jende schrieb:
 [...]
   
 Also brauchen wir einen Converter.  Gibt es denn einen, wenn die Datei
 bereits geholt wurde?
   
 Ja, es scheint als ob es einen gibt, ich habe nur das Script gefunden. 
 Ich will es damit mal nachher probieren; hier mla der Link

 http://sebsauvage.net/python/html2csv.py
 

 Das Ding soll Daten in HTML-Tabellen im CSV-Format abspeichern. Ist es
 das, was du willst?

   

Genau das ist es - ich hole mir eine HTML Tabelle, die ich dann im csv
Format brauche, das ganze muss ich halt dann auch noch ähnlich einem
Live-Update automatiseren. Wennd er Grundstein, also das holen un
convertieren gelegt ist, sollte der Rest nicht mehr ganz so schwer sein.
Hoffe ich zumindest.

 Das Problem ist nicht die Kombination mit wget.  Aber solange niemand
 weiß, wie man es überhaupt machen soll, ist es schwer, dieses Unbekannte
 mit wget zu verheiraten.
   
 Das wird glaube ich ganz schön schwierig; wenn es nicht geht - geht's
 halt nicht :-(
 

 Hey, es handelt sich um Software, da ist prinzipiell alles machbar. ;-)

 Gruß, Marcus

   

Gruß
Niels

   


-- 
Haeufig gestellte Fragen und Antworten (FAQ): 
http://www.de.debian.org/debian-user-german-FAQ/

Zum AUSTRAGEN schicken Sie eine Mail an [EMAIL PROTECTED]
mit dem Subject unsubscribe. Probleme? Mail an [EMAIL PROTECTED] (engl)