中本さん、皆さん、初めまして。 三品と申します。
むかし自然言語処理を専門にしていたので、興味深く拝見しました。 おそらく通常の OOo は「辞書ベースの最長一致」といった賢い方法ではなくて、文字種分割を使ってるのではないかと思います。 (日本語は文字種分割でも意外に高い精度で形態素解析できるので) ソースは見ていないので確証はありませんが、今試してみたところでは、「文字種分割」(+わからなければ「周辺4バイトを選択」)という動作をしているようです。 私が以前「webブラウザ上で入力した文章を形態素解析して、前後の文脈からみて不適切な単語を指摘する日本語スペルチェッカ」を作ったときは、単純に CGI から外部コマンド呼び出しを使うことで対処しました。OOoから MeCab のインストールパスを設定できるようにしておいて、利用時は外部コマンド呼び出しする(呼んでみて存在しなければあきらめる)、ということで、コンパイルオプションの問題に対処できないでしょうか? --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]
