On Mon, 21 Feb 2005 02:49:38 +0100, boy avianto <[EMAIL PROTECTED]> wrote:
> 
> On Mon, 21 Feb 2005 10:40:36 +0900, Pakcik <[EMAIL PROTECTED]> wrote:
> > On Mon, 21 Feb 2005 08:34:48 +0700, N e o <[EMAIL PROTECTED]> wrote:
> > > bagaimana cara membedakan blog-nya pakai bahasa indonesia atau tidak?
> > > apakah otomatis atau manual?
> >
> > otomatis. parsing, cari kata2 yg biasanya cuman ada di bahasa
> > indonesia, seperti kata "yang", "atau", "dan". trus kasih threshold.
> > misalnya 10 kata itu ditemukan, jadi site bahasa indonesia.
> >
> > aku pake 10, dan kayaknya cukup menjamin site itu ada pake bahasa indonesia.
> 
> Bagaimana dengan kemungkinan dia memparsing bahasa serumpun seperti Malaysia?
> Atau ada kosakata Indonesia yang tidak ada di kosakata Malaysia?
> 
> 10 kata itu apa saja ya kalau boleh tahu?


10 itu kayaknya threshold / batasan jumlah dari sebuah kata yang sama deh vi.

-ivo

Kirim email ke