On Mon, 21 Feb 2005 02:49:38 +0100, boy avianto <[EMAIL PROTECTED]> wrote: > > On Mon, 21 Feb 2005 10:40:36 +0900, Pakcik <[EMAIL PROTECTED]> wrote: > > On Mon, 21 Feb 2005 08:34:48 +0700, N e o <[EMAIL PROTECTED]> wrote: > > > bagaimana cara membedakan blog-nya pakai bahasa indonesia atau tidak? > > > apakah otomatis atau manual? > > > > otomatis. parsing, cari kata2 yg biasanya cuman ada di bahasa > > indonesia, seperti kata "yang", "atau", "dan". trus kasih threshold. > > misalnya 10 kata itu ditemukan, jadi site bahasa indonesia. > > > > aku pake 10, dan kayaknya cukup menjamin site itu ada pake bahasa indonesia. > > Bagaimana dengan kemungkinan dia memparsing bahasa serumpun seperti Malaysia? > Atau ada kosakata Indonesia yang tidak ada di kosakata Malaysia? > > 10 kata itu apa saja ya kalau boleh tahu?
10 itu kayaknya threshold / batasan jumlah dari sebuah kata yang sama deh vi. -ivo
