寺西です。

NOKUBI Takatsugu wrote:
> 
> At Mon, 17 Apr 2006 17:23:51 +0900,
> Tadamasa Teranishi wrote:
> > よみとして適当ではないので、「ヵ」「ヶ」に関しては登録しなくて良いと
> > 思います。
> 
>   パッチを書いてみました。問題なさそうならコミットします。

問題ないと思います。

>   ただ、JIS X 0213:2004をみると、どうやらこれらの文字のひらがな版が新
> 規に追加されているようです。
...
>   他にも「かきくけこ」の半濁点つきなんかが追加されています。実際のとこ
> ろ使えるシステムは限られていると思うので、とりあえずは考えないでおきま
> す...

kakasi はプログラムの内部では
JIS78 (旧JIS)
JIS83 (新JIS)
という区別になっていますが、kakasidict に「凜」「熙」が含まれること
から新JISは 1990/1997 の拡張を含んだものまで扱うという仕様と思われ
ます。
# この2文字をメールに書いて大丈夫か!?

しかし、EUC-JP の 3バイト文字(JISX0212)についても、現状一切考慮されて
いませんので、JIS X 0213 への対応は容易ではないでしょう。

内部処理を UTF-8 化する(ことがあれば)際に考えれば良いのではないか
と思います。
-- 
=====================================================================
寺西 忠勝(TADAMASA TERANISHI)  [EMAIL PROTECTED]
http://www.asahi-net.or.jp/~yw3t-trns/index.htm
Key fingerprint =  474E 4D93 8E97 11F6 662D  8A42 17F5 52F4 10E7 D14E

_______________________________________________
Kakasi-dev mailing list
[email protected]
http://www.namazu.org/cgi-bin/mailman/listinfo/kakasi-dev

メールによる返信