Hi,
ich versuche Webseiten f�r das parsen von Informationen herunterzuladen. Den
Inhalt der Seiten erhalte ich auch. Nur sind im Ergebnis alle Zeichen wie
Tabs etc. maskiert. Zus�tzlich werden anscheinend wahllos Zeilenumbr�che
hinzugef�gt. Weiss jemand wie man das abstellen kann, oder ob das �berhaupt
m�glich ist.
Ich habe es sowohl mit dem Webclient als auch webResp.GetResponseStream
versucht:
Variante 1
byte[] data = webClient.DownloadData(Url);
string content = new UTF8Encoding().GetString(data) ;
Variante 2
StreamReader strm = new StreamReader(webResp.GetResponseStream(),
Encoding.Default);
string sLine;
do
{
sLine = strm.ReadLine();
strBuildContent.Append(sLine); //StringBuilder
}
while (sLine != null);
strm.Close();
Hier ein Auszug aus dem Ergebnis:
<script type=\"text/javascript\"
language=\"JavaScript1.1\">\r\n\r\n\t\t\tebay.oDocument._getControl(\"header
Common\")._exec(\"writeStyleSheet\");\r\n\r\n\t\t</script><script
type=\"text/javascript\"
language=\"JavaScript1.1\">\r\n\r\n\t\t\tebay.oDocument._getControlEx(\"cobr
andCollection\")._exec(\"writeHeader\");\r\n\r\n\t\t</script>
Gru�
Ren�
_______________________________________________
Framework.net Mailingliste, Postings senden an:
[email protected]
An-/Abmeldung und Suchfunktion unter:
http://www.glengamoi.com/mailman/listinfo/framework.net