On Monday 21 February 2005 10:18, Pakcik wrote: > On Mon, 21 Feb 2005 09:58:36 +0700, risiyanto budi <[EMAIL PROTECTED]> wrote: > > nanya lagi, > > bagaimana untuk identifikasi itu blog atau bukan? > > saya melihat selintas ada wiki juga di list tersebut. > > 1. cari feednya. > 2. urlnya di blogspot, blogdrive. > 3. mengenali dari isi sitenya. ini yg gak bisa, butuh anak AI.
gimana kalau pakai pengenalan bayesian, dari sekian banyak blog diambil samplenya sekitar 1000 (?) yang isinya blog indonesia & blog luar. terus ditandai mana yang sudah masuk corpus. kalau ada kesalahan pengenalan, nanti diperbaiki secara manual.
