内海です。 cannadic の表記に yahoo のヒット数を自動的に付けるツールを 書きました。 このページの http://www.geocities.jp/ep3797/anthy_dict_01.html このファイルです。 get-yahooresults-0.0.0.tar.bz2
後処理をしやすいように、出力結果は cannadic 形式ではなく タブ区切りにしています。 yahoo での検索方式は完全一致にしています。 頻度調整の一助になるかもしれません。 ただしヒット数をそのまま使うだけでは 変換性能は向上しないと思います。 cannadic を分析してみると、1件もヒットしない単語が 含まれているようです。 > いきあわ #S5 0 いき合わ 別件になりますが、 SKK辞書の名詞をヒット数順に並べ替えると 使いやすくなるかもしれません。 例えば > へいちゅうものがたり /平仲物語/平中物語/ の場合、ヒット数順だと > へいちゅうものがたり /平中物語/平仲物語/ になります。 -------------------------------------- New Design Yahoo! JAPAN 2008/01/01 http://pr.mail.yahoo.co.jp/newdesign/ _______________________________________________ Anthy-dev mailing list Anthy-dev@lists.sourceforge.jp http://lists.sourceforge.jp/mailman/listinfo/anthy-dev