On Mon, 21 Feb 2005 10:40:36 +0900, Pakcik <[EMAIL PROTECTED]> wrote:
> On Mon, 21 Feb 2005 08:34:48 +0700, N e o <[EMAIL PROTECTED]> wrote:
> > bagaimana cara membedakan blog-nya pakai bahasa indonesia atau tidak?
> > apakah otomatis atau manual?
> 
> otomatis. parsing, cari kata2 yg biasanya cuman ada di bahasa
> indonesia, seperti kata "yang", "atau", "dan". trus kasih threshold.
> misalnya 10 kata itu ditemukan, jadi site bahasa indonesia.
> 
> aku pake 10, dan kayaknya cukup menjamin site itu ada pake bahasa indonesia.

Bagaimana dengan kemungkinan dia memparsing bahasa serumpun seperti Malaysia?
Atau ada kosakata Indonesia yang tidak ada di kosakata Malaysia?

10 kata itu apa saja ya kalau boleh tahu?

-- 
<avianto /> - http://avianto.com/

Kirim email ke