At Thu, 04 May 2006 12:37:18 +0900,
Tadamasa Teranishi wrote:
> kakasi の -HK オプションはひらがなをカタカナに、-KH オプションは
> カタカナをひらがなに変換するオプションですが、踊り字の一の字点
> (ゝゞヽヾ)の変換処理が不十分なようです。 

  調べてみました。まず、kakasi.cの以下の箇所が問題でした。

  687: #ifdef WAKATIGAKI
  688:                 } else if ((c[0].c1 == 0xa1) && /* charcter 
code(\241\263),charcter code(\241\264),charcter code(\241\265),charcter 
code(\241\266) */
  689:                            (c[0].c2 >= 0xb3 && c[0].c2 <= 0xb6)) {
  690:                     ptype = 6;
  691: #endif /* WAKATIGAKI */

  4文字種全てをひらがな扱いにしていました。それもなぜかわかち書きが有
効なときだけです...

  それはともかく、これをそれぞれ適切な文字種に変更し、H2K, K2Hに変換処
理を追加することでこの問題を修正しました。

$ ~/local/kakasi/bin/kakasi -KH < foo
つヽじ,さヾえ,さヽやか,たヾし
$ ~/local/kakasi/bin/kakasi -HK < foo
ツゝジ,サゞエ,サゝヤカ,タゞシ

  既にCVS HEADにコミットしてあります。
-- 
野首 貴嗣
E-mail: [EMAIL PROTECTED]
        [EMAIL PROTECTED] / [EMAIL PROTECTED]
_______________________________________________
Kakasi-dev mailing list
[email protected]
http://www.namazu.org/cgi-bin/mailman/listinfo/kakasi-dev

メールによる返信