> > Hallo Leute, > > ein bissel off topic, aber vielleicht > hat jemand eine Idee dazu: Ich m�chte diesmal > die Daten r�ckgewinnen und nicht ausgeben: > > Ich suche ein Tool, mit dem ich eine HTML-Datei > einlesen kann und dieses automatisch die > widerkehrenden Felder erkennt und in eine DB > schreibt. > > Einfaches Beispiel: Eine H�ndlerseite im > Internet und ich m�chte alle Adressen auf > einmal strukturiert raussaugen. Das Tool > mu� nat�rlich so intelligent sein, dass es > merkt, wenn bei einer Adresse die Faxnummer > fehlt oder die Email-Adresse. > > Jemand einen Tipp ?? >
Ein Tool das all das macht was Du m�chtest gibt es vermutlich nicht. HTML ist dazu in der Regel zu unstrukturiert und auch syntaktisch nicht streng genug. Zudem fehlen Metainformationen aus denen auf die Bedeutung des Inhalts von HTML-Elementen geschlossen werden k�nnte. Selbst in einem semantischen Web mit XHTML d�rfte das Problem schwierig sein. Also hilft wahrscheinlich nur, die jeweiligen F�lle selbst zu programmieren, z.B. IE-DOM durchkaspern oder mal mit ADO versuchen, Daten aus der Seite zu extrahieren. Gru�, Alex | [aspdecoffeehouse] als [email protected] subscribed | http://www.aspgerman.com/archiv/aspdecoffeehouse/ = Listenarchiv | Sie k�nnen sich unter folgender URL an- und abmelden: | http://www.aspgerman.com/aspgerman/listen/anmelden/aspdecoffeehouse.asp
