内海です。

SKK 辞書から名詞を抜き出して cannadic 形式に整形するツールを
書きました。
このページの
http://www.geocities.jp/ep3797/anthy_dict_01.html
このファイルです。
convert-skkdic-to-cannadic-0.0.0.tar.bz2

生成した SKK-JISYO.L.ctd を同梱しています。
SKK-JISYO.L.ctd を
anthy-*/alt-cannadic にコピーして、
anthy-*/mkworddic/dict.args.in の
read @top_srcdir@/alt-cannadic/g_fname.t の下に
read @top_srcdir@/alt-cannadic/SKK-JISYO.L.ctd
を足してビルド→インストールしてください。
(kconv で eucjp に変換すると文字化けしたので、
utf8 にしています)

工夫した点は
SKK 辞書の候補順に沿って同音異義語に頻度差をつけたことと、
地名と思われる単語を削れるようにしたことです。
(マイナーな地名が第一候補になると快適性が下がるので)

読みの短い単語は誤変換の元になるので、
読み仮名が4文字以上の名詞だけを抜き出すようにしました。

SKK-JISYO.L.ctd には
Anthy の標準辞書と重なる単語が多数ありますが、
重複単語は Anthy のビルド時に削除されるようなので、
そのまま使ってください。
(anthy-*/mkworddic/mkdic.c を参照)

SKK-JISYO.L.ctd を追加しても、
必ずしも変換効率が上がるわけではありません。
例えば SKK-JISYO.L.ctd には
> したてん #T35*10 .
という見出しがあります。
これにより「注意した点」が「注意.」になってしまうことがあります。
--------------------------------------
New Design Yahoo! JAPAN  2008/01/01
http://pr.mail.yahoo.co.jp/newdesign/

_______________________________________________
Anthy-dev mailing list
Anthy-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev

メールによる返信