coba hpricot mas Andriy http://github.com/whymirror/hpricot
atau nokogiri http://wiki.github.com/tenderlove/nokogiri Regards, Gozali On Nov 21, 2009, at 10:56 AM, Andriy Shevtiawan wrote: > > Dear rubyist/railers indonesia, saya punya permasalahan. Mohon > bantuannya ya. > > Saya sedang mengerjakan tugas akhir tentang ekstraksi struktur > halaman web (html document) dengan algoritma berdasarkan visual > cues. Secara garis besar, kira begini langkah2nya: > > 1. Mendapatkan satu halaman web yg akan diekstrak (misal, > "http://www.detik.com > "). > 2. Ambil beberapa elemen dari satu halaman web tersebut berdasarkan > tanda2 visualnya.(Misal: ambil semua div yg backgroundnya biru) > 3. Memproses hasil dari langkah no.2 dengan algoritma saya. > 4. Simpan hasilnya di database. > > Nah, pertanyaan saya gimana mengimplementasikan langkah ke 1 dan ke > 2 dengan ruby (atau rails?) ya? Adakah library, plugin, helper, atau > apapun yg bisa digunakan untuk masalah ini? > > Saya sudah coba gugling, tp blum menemukan hasil yg diharapkan. Atau > keywordnya yg blum pas mungkin ya? :D > > terimakasih, > > -andrisetiawan- > > [Non-text portions of this message have been removed] > > > [Non-text portions of this message have been removed] ------------------------------------ ID-Ruby Berdiskusi dan belajar bersama Bahasa Pemrograman Ruby, termasuk segala varian Ruby (JRuby, Rubinius, IronRuby, XRuby), dan program yang dibuat dengan Ruby (Ruby on Rails, JRuby on Rails, Merb) <*> Follow Ruby Indonesia on Twitter http://twitter.com/rubyindonesia <*> Kunjungi Situs Resmi Ruby Indonesia http://www.ruby-lang.org/id/ <*> Join Ruby Indonesia on Facebook http://rubyurl.com/QV48 <*> Join Ruby Indonesia on LinkedIn http://rubyurl.com/eh0i <*> Kunjungi *arsip milis* id-ruby di http://groups.yahoo.com/group/id-ruby/messages http://www.mail-archive.com/[email protected]/ http://rubyurl.com/Q8DD http://news.gmane.org/gmane.comp.lang.ruby.region.indonesia <*> Baca peraturan id-ruby sebelum posting http://rubyurl.com/gay1 Yahoo! Groups Links <*> To visit your group on the web, go to: http://groups.yahoo.com/group/id-ruby/ <*> Your email settings: Individual Email | Traditional <*> To change settings online go to: http://groups.yahoo.com/group/id-ruby/join (Yahoo! ID required) <*> To change settings via email: [email protected] [email protected] <*> To unsubscribe from this group, send an email to: [email protected] <*> Your use of Yahoo! Groups is subject to: http://docs.yahoo.com/info/terms/

