At 14:20 10/11/2000, you wrote:
>Sebenarnya prinsip kerja extracting dan parsing itu untuk apa yah? masih
>belum ngerti nih ...
>terus kalau design dari www.kompas.com dan www.detik.com berubah katakanlah,
>maka extract dan parse kita ngga bekerja dong? CMIIW
>
>/mw
IMO, saya tidak mengkategorikan apa yang dilakukan oleh script VB
buatan Mas Andi Zain itu sebagai parsing, melainkan hanya extracting.
biasanya cara seperti ini disebut "HTML scraping" -- "mengais-ngais"
data yang ada di antara gulungan mie HTML, yang terdiri dari campuran
elemen presentasi, content, dan scripting. sederhananya, data yang
ada di halaman HTML itu tidak terstruktur, dan terkait dengan disain
halamannya sendiri. ubah saja satu karakter ("<a href=URL target=FOO>"
menjadi "<a target=FOO href=URL>") maka script harus diubah.
membuat web content terstruktur, dan mempermudah pertukaran data
antarwebsite, itulah janji XML. sesuatu yang mungkin belum (dan tak
akan pernah) tercipta sesuai mimpi idealnya...
--
sh
>>>>> 2.5 Mbps InternetShop >> InternetZone << Margonda Raya 340 <<<<<
Berhenti langganan kirim email ke [EMAIL PROTECTED]
Arsip di http://www.mail-archive.com/[email protected]/