(basis fakta, cabangnya Information Extraction) dari free
formed text. Tapi pake bahasa Indonesia. Basisnya Neural
network. Mungkin kalo ada yg pernah liat www.20q.net tahu.
Bukan hal yg baru, cuma bahasa Indonesianya aja yg baru.
Contohnya gini, ada sebuah agen (agent). Kalo agennya
diajarkan bahwa "Nurmahmudi Ismail adalah Ketua MPR"
kemudan ditanya "Siapakah ketua MPR?" atau yg lebih
sederhana, "Apakah Nurmahmudi Ismail ketua MPR?"
si agen bisa njawab. Tentu saja, pertanyaan, fakta dan
jawaban di kodifikasi dalam keadaan yg bisa dikomputasi.
Dan pasti dengan batasan-batasan yg masih sangat strict
Yah, problemnya mbikin fact buildernya itu, karena melibatkan
parser, dan parser perlu symbol tabel. Setelah tahu Aspell
ternyata punya dictionary bahasa Indonesia, masalah agak
sedikit terkuak. Masalah berikutnya, masalah sintaks.
Apakah dictionarynya Aspell ada informasi seperti itu?
contoh : Apel (noun), Tulis (Verb) -> Tulisan (noun).
Sepertinya ndak deh. <sigh> masih jauh perjalanan... -_-
Tapi terimakasih pa' Budi. Saya akan coba gali2
di project2 itu. Mudah2an pada OSS semua.
On 5/2/05, Budi Rahardjo <[EMAIL PROTECTED]> wrote:
Sudah ada beberapa inisiatif. Mungkin ini tidak terkait
langsung dengan pertanyaannya, tapi ada beberapa inisiatif
untuk membuat daftar istilah komputer dalam Bahasa Indonesia.
Ini yang saya tahu.
- 198? - saya buat daftar istilah komputer. Gone.
- (198?) - [Setahu saya Bambang Prastowo juga buat. Lupa.]
- 198? - saya ikutan PO. Gak maju2. Gak tahu sudah sampai mana.
- ???? - Terry Mart?, Babel Bahasa (Indonesia) untuk LaTeX
- ???? - Rahmat Samik Ibrahim (pernah lihat bbrp waktu lalu)
- ???? - Katanya spellcheck? atau thesaurus? MS Office dibuat
oleh Sigma Cipta Caraka? (ada yang tahu info ini?)
- 199?/200? - Trustix Merdeka
- 199? - SuSe (?)/Pandu.org? [I Made W mungkin punya info lebih]
- 200? - saya ikutan buat glossary untuk Microsoft, kemudian
hasilnya entah dibawa MS kemana (ke Pusat Bahasa?), tapi
keluarannya jadi aneh
- 200? - Onno W. Purbo buat juga (dengan Pusat Bahasa?)
- 200? - Saya ikut nerjemahin WinSCP. Kecapekan berhenti.
- 200? - BlankOn (siapa yang buat?)
- 200? - saya mau buat lagi ... he he he ...
Apa lagi ya?
-- budi
--
Barkah Yusuf Widodo
