中本です。 OpenOffice.orgでは、様々なところで単語区切りを利用しています。 例えば、Writerで - 「Ctrl+→」とすると次の単語にカーソルが移る。 - ある部分を部分をダブルクリックするとその周辺の単語が選択状態になる。 - ある範囲を選択して [書式] - [ルビ] を選択すると、自動的に単語ごとに 区切ってふりがなが入力できるようになる。 といった機能を実現するのに、与えられた文章に対してそれを単語ごとに区切る という処理があります。英語ならばスペースごとに区切られているのでその処理 は大したものじゃないんですが、日本語に関しては今のところこの単語区切りを 辞書ベースの(たぶん)最長一致でやっているんだと思います。
これを形態素解析に基づいて行ったらどうだろうかと思って実装してみました。 興味のある人は、下の issue を参照してください。 http://www.openoffice.org/issues/show_bug.cgi?id=74034 本当は拡張機能として実装したかったのですが、OOoにある既存のコードを使う (既存のクラスを継承する)方がコード量が少なくてすむので、まずは今の形で実 装しました。まぁ、OOoに取り込まれればいいのですが、もしだめなら拡張機能 として再実装することにします。 それにしてもMeCabっていいっすねぇ。これ使えば Writer のルビもある程度自 動で入力できるようになるかも。 -- 中本 崇志 (Takashi Nakamoto) E-mail: [EMAIL PROTECTED] Homepage: http://bd.tank.jp/ Blog: http://bd.tank.jp/diary/ --------------------------------------------------------------------- To unsubscribe, e-mail: [EMAIL PROTECTED] For additional commands, e-mail: [EMAIL PROTECTED]