Ronny Haryanto wrote:
Ya itu juga bisa, tapi tidak akan seakurat kalo kita sendiri yg
melatih. SA sendiri, tanpa bayes learning, itu aja sering false
positives (at least buat saya). Jelek banget kalo false positive lalu
dijadikan bahan learning spam otomatis bayes, ngotor2in database yg
udah susah2 dilatih. Bisa diunlearn sih, tapi sama aja ngerepotin,
kita mesti cek sendiri satu2 mana yg false positive mana yg nggak,
sama aja boong, mending sekalian manual ngelatihnya.

Ronny

Yah banyak jalan menuju roma sih :). Saya sendiri sih lebih suka pakai mekanisme di atas plus adjustment scoring untuk beberapa rule yang buggy (berdasarkan google), atau berdasarkan log. So far sih false positives nggak ada. Kalau false negatives, iya untuk spam2 berbahasa Indonesia molos semua :(. Mungkin untuk yang ini musti train manual (baru kepikiran). Ntar tak cobain deh

--
- Cygnus -

Send instant messages to your online friends http://asia.messenger.yahoo.com
--
FAQ milis di http://wiki.linux.or.id/FAQ_milis_tanya-jawab
Unsubscribe: kirim email ke [EMAIL PROTECTED]
Arsip dan info milis selengkapnya di http://linux.or.id/milis

Kirim email ke