内海です。 SKK 辞書から名詞を抜き出して cannadic 形式に整形するツールを 書きました。 このページの http://www.geocities.jp/ep3797/anthy_dict_01.html このファイルです。 convert-skkdic-to-cannadic-0.0.0.tar.bz2
生成した SKK-JISYO.L.ctd を同梱しています。 SKK-JISYO.L.ctd を anthy-*/alt-cannadic にコピーして、 anthy-*/mkworddic/dict.args.in の read @top_srcdir@/alt-cannadic/g_fname.t の下に read @top_srcdir@/alt-cannadic/SKK-JISYO.L.ctd を足してビルド→インストールしてください。 (kconv で eucjp に変換すると文字化けしたので、 utf8 にしています) 工夫した点は SKK 辞書の候補順に沿って同音異義語に頻度差をつけたことと、 地名と思われる単語を削れるようにしたことです。 (マイナーな地名が第一候補になると快適性が下がるので) 読みの短い単語は誤変換の元になるので、 読み仮名が4文字以上の名詞だけを抜き出すようにしました。 SKK-JISYO.L.ctd には Anthy の標準辞書と重なる単語が多数ありますが、 重複単語は Anthy のビルド時に削除されるようなので、 そのまま使ってください。 (anthy-*/mkworddic/mkdic.c を参照) SKK-JISYO.L.ctd を追加しても、 必ずしも変換効率が上がるわけではありません。 例えば SKK-JISYO.L.ctd には > したてん #T35*10 . という見出しがあります。 これにより「注意した点」が「注意.」になってしまうことがあります。 -------------------------------------- New Design Yahoo! JAPAN 2008/01/01 http://pr.mail.yahoo.co.jp/newdesign/ _______________________________________________ Anthy-dev mailing list Anthy-dev@lists.sourceforge.jp http://lists.sourceforge.jp/mailman/listinfo/anthy-dev