大泉です。

白井秀行さんは書きました:
> Solaris も cygwin も Zaurus もみんな
> 動いているので大丈夫でしょう。

そうですか。わざわざご確認いただき、ありがとうございます。

> とりあえず、ぼくがソートしたものをおいておきますので比べてみてく
> ださい。また、確認していなかったのですが、anthy は 9100 でよいの
> ですよね。
> http://www.meadowy.org/~shirai/tmp/gt34-tankanji-hikanji-sort.t.gz

こちらもありがとうございます(anthy は 9100 です)。
diff 取ってみましたが、ほとんど別物ですね、これは…。
私の方はこんな感じ↓になってしまいます。
http://vagus.up.seesaa.net/data/gt34-tankanji-hikanji-suse.t.gz
openSUSE 10.2 ja_JP.UTF-8 で
$ sort gt34-tankanji-hikanji.t > gt34-tankanji-hikanji-suse.t
したものです。

suse の coreutils の src.rpm 取ってきて覗いてみたところ、
i18n 関係の結構でかいパッチが当ってるようなので、それの
影響なのかな…。
コード読めないのでさっぱり分かりませんが (^^;
http://ftp.riken.jp/Linux/opensuse/distribution/10.2/repo/src-oss/suse/src/coreutils-6.4-10.src.rpm
ついでに Fedora7 の coreutils のソースも覗いてみましたが、
こちらはこちらでまた独自のパッチを当ててるようで、
http://ftp.riken.jp/Linux/fedora/releases/7/Fedora/source/SRPMS/coreutils-6.9-2.fc7.src.rpm
何か、「こりゃもしかして linux は全滅なんじゃないのか?」という気が
してきました…。

# あとで Fedora 入れて確認してみよう…
# そうだ、内海さん、Mandriva ではどうでしょうか?

> 手元では 't' を除いた読みを打った後 C-t で出るようにしてみました。
> ある意味便利かもです。(けーけーt とかも出るけどそれはご愛嬌)

それはどういう風に登録しておくんでしょうか?
Emacs だからできる技でしょうか?

> # gtankan.ctd から単漢字を抜き出して、よみの後に全部 't' つけた
> # 個人辞書を作りたくなってきました :-)

んっと、「単漢字の漢字部分のみ」ということでしょうか?(記号も含めて
「単漢字」と呼んでいるので紛らわしいですね)。
こちら↓に単漢字のみですが、元の辞書ファイルを置いておきますので、
よろしければお使いください。
http://vagus.up.seesaa.net/data/tankanji.zip

# そのうち辞書のソースも全部公開するつもりです

> しかし、jisx0213 によく読み仮名をつけましたね。素晴らしいです。

いえ、漢字部分は JISX0213 InfoCenter
http://www.jca.apc.org/~earthian/aozora/0213.html
の「漢字音訓索引(onkun0213.txt [2000-09-11])」を使わせて頂き
ましたので、実は私は大したことはしてなかったり… (^^;
私がやったのは、バラして canna辞書のフォーマットに作り変えて、
欠けてる文字を補ったくらいです。
非漢字部分の方はベースにできるものがなかったので、泣く泣く
一から自前で作りましたが。

_______________________________________________
Anthy-dev mailing list
Anthy-dev@lists.sourceforge.jp
http://lists.sourceforge.jp/mailman/listinfo/anthy-dev

メールによる返信