At Wed, 12 Sep 2007 11:52:30 +0900,
Tadamasa Teranishi wrote:
> 区点コードと言うと、補助漢字や JIS X 0213 の第2面とかの話を出さない
> といけなくなるので、複雑になるでエンコードで EUC-JP として話を省こう
> としたのですが、正しくはないですね。
EUC-JPというと3バイト以上でエンコードされた文字列の話が含まれてしま
うと思ったので、それはそれでよくない表現かな、と思いました。どちらにし
ろ、きちんと説明するのは難しいですね。
> つまり
> > これを問題とするのは、用途に依存した話です。
> なわけです。
>
> > そして、その用途に kakasi は向かないのでしょう。
この点については同意します。寺西さんが御指摘された点意外もいろいろと
不都合(基本的に一定の形式のローマ字符号化?とでもいうべきルールに依存し
ている等)がありますから。
--
野首 貴嗣
E-mail:
[メールアドレス保護]
[メールアドレス保護] /
[メールアドレス保護]
_______________________________________________
Kakasi-dev mailing list
[email protected]
http://www.namazu.org/cgi-bin/mailman/listinfo/kakasi-dev