coba hpricot mas Andriy
http://github.com/whymirror/hpricot

atau nokogiri
http://wiki.github.com/tenderlove/nokogiri

Regards,
Gozali


On Nov 21, 2009, at 10:56 AM, Andriy Shevtiawan wrote:

>
> Dear rubyist/railers indonesia, saya punya permasalahan. Mohon  
> bantuannya ya.
>
> Saya sedang mengerjakan tugas akhir tentang ekstraksi struktur  
> halaman web (html document) dengan algoritma berdasarkan visual  
> cues. Secara garis besar, kira begini langkah2nya:
>
> 1. Mendapatkan satu halaman web yg akan diekstrak (misal, 
> "http://www.detik.com 
> ").
> 2. Ambil beberapa elemen dari satu halaman web tersebut berdasarkan  
> tanda2 visualnya.(Misal: ambil semua div yg backgroundnya biru)
> 3. Memproses hasil dari langkah no.2 dengan algoritma saya.
> 4. Simpan hasilnya di database.
>
> Nah, pertanyaan saya gimana mengimplementasikan langkah ke 1 dan ke  
> 2 dengan ruby (atau rails?) ya? Adakah library, plugin, helper, atau  
> apapun yg bisa digunakan untuk masalah ini?
>
> Saya sudah coba gugling, tp blum menemukan hasil yg diharapkan. Atau  
> keywordnya yg blum pas mungkin ya? :D
>
> terimakasih,
>
> -andrisetiawan-
>
> [Non-text portions of this message have been removed]
>
>
> 



[Non-text portions of this message have been removed]



------------------------------------

ID-Ruby
Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala varian 
Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat dengan Ruby 
(Ruby on Rails, JRuby on Rails, Merb)

<*> Follow Ruby Indonesia on Twitter
    http://twitter.com/rubyindonesia

<*> Kunjungi Situs Resmi Ruby Indonesia
    http://www.ruby-lang.org/id/

<*> Join Ruby Indonesia on Facebook
    http://rubyurl.com/QV48

<*> Join Ruby Indonesia on LinkedIn
    http://rubyurl.com/eh0i

<*> Kunjungi *arsip milis* id-ruby di
    http://groups.yahoo.com/group/id-ruby/messages
    http://www.mail-archive.com/[email protected]/
    http://rubyurl.com/Q8DD
    http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia

<*> Baca peraturan id-ruby sebelum posting
    http://rubyurl.com/gay1
Yahoo! Groups Links

<*> To visit your group on the web, go to:
    http://groups.yahoo.com/group/id-ruby/

<*> Your email settings:
    Individual Email | Traditional

<*> To change settings online go to:
    http://groups.yahoo.com/group/id-ruby/join
    (Yahoo! ID required)

<*> To change settings via email:
    [email protected] 
    [email protected]

<*> To unsubscribe from this group, send an email to:
    [email protected]

<*> Your use of Yahoo! Groups is subject to:
    http://docs.yahoo.com/info/terms/

Kirim email ke