At Thu, 04 May 2006 12:37:18 +0900,
Tadamasa Teranishi wrote:
> kakasi の -HK オプションはひらがなをカタカナに、-KH オプションは
> カタカナをひらがなに変換するオプションですが、踊り字の一の字点
> (ゝゞヽヾ)の変換処理が不十分なようです。
調べてみました。まず、kakasi.cの以下の箇所が問題でした。
687: #ifdef WAKATIGAKI
688: } else if ((c[0].c1 == 0xa1) && /* charcter
code(\241\263),charcter code(\241\264),charcter code(\241\265),charcter
code(\241\266) */
689: (c[0].c2 >= 0xb3 && c[0].c2 <= 0xb6)) {
690: ptype = 6;
691: #endif /* WAKATIGAKI */
4文字種全てをひらがな扱いにしていました。それもなぜかわかち書きが有
効なときだけです...
それはともかく、これをそれぞれ適切な文字種に変更し、H2K, K2Hに変換処
理を追加することでこの問題を修正しました。
$ ~/local/kakasi/bin/kakasi -KH < foo
つヽじ,さヾえ,さヽやか,たヾし
$ ~/local/kakasi/bin/kakasi -HK < foo
ツゝジ,サゞエ,サゝヤカ,タゞシ
既にCVS HEADにコミットしてあります。
--
野首 貴嗣
E-mail: [EMAIL PROTECTED]
[EMAIL PROTECTED] / [EMAIL PROTECTED]
_______________________________________________
Kakasi-dev mailing list
[email protected]
http://www.namazu.org/cgi-bin/mailman/listinfo/kakasi-dev