渡辺一寛です。 At Tue, 7 May 2013 00:30:09 -0400, Yoshihiro Ota wrote: > "gawk 4 support natively multibyte" - UTF8 なのか、 > その他なのかは調べていませんが - gawk 4 でサポートされている様のなので、 > すでに古くなった gawk 3 が元になっている japanese/gawk は必要なのか > と質問されました。 > > 最新の gawk の日本語のサポートや、japanese/gawk をお使いの方で、 > 何か知っている方は教えて下さい。 > > awk は頻繁に使うので、一時期担当のいない awk 関連を割り当てて > 貰ったのですが、japanese 版は自身では使わないので、 > 存続する価値があるのか、決めあぐねています。
japanese/gawk も UTF-8 に対応してますが、それに加えて、例えば一部の 関数が 文字単位/文字数でカウントする jindex()/jlength()/jsubstr() バイト単位/バイト数でカウントする index()/length()/substr() に分かれているので、より柔軟な記述が可能だと思ってます。またこうなって いるのを前提に書かれたスクリプトも結構あるんじゃないですかね。 gawk4 (lang/gawk) も試した限りでは EUC/SJIS/UTF-8 に対応するようですが、 当然(?) jほにゃらら といった関数はありませんし、また locale の設定によ る文字単位/文字数でのカウントに固定されてしまうようです (違ってたらご めんなさい)。 それに gawk4 はリリースされてまだ日が浅い (2年経ってないような) ので、 日本語対応の枯れ具合からいったらまだ ja-gawk に分があると思います。 --- WATANABE Kazuhiro (cqg00...@nifty.ne.jp)