Dear rubyist/railers indonesia, saya punya permasalahan. Mohon bantuannya ya.

Saya sedang mengerjakan tugas akhir tentang ekstraksi struktur halaman web 
(html document) dengan algoritma berdasarkan visual cues. Secara garis besar, 
kira begini langkah2nya:

1. Mendapatkan satu halaman web yg akan diekstrak (misal, 
"http://www.detik.com";).
2. Ambil beberapa elemen dari satu halaman web tersebut berdasarkan tanda2 
visualnya.(Misal: ambil semua div yg backgroundnya biru)
3. Memproses hasil dari langkah no.2 dengan algoritma saya.
4. Simpan hasilnya di database.

Nah, pertanyaan saya gimana mengimplementasikan langkah ke 1 dan ke 2 dengan 
ruby (atau rails?) ya? Adakah library, plugin, helper, atau apapun yg bisa 
digunakan untuk masalah ini?

Saya sudah coba gugling, tp blum menemukan hasil yg diharapkan. Atau keywordnya 
yg blum pas mungkin ya? :D

terimakasih,

-andrisetiawan-


      

[Non-text portions of this message have been removed]

Kirim email ke