汗,对的。 其实我想应该是这样的。 当perl读入文件后,无论对方是什么编码,自动转化为perl的内码。 就是那种有utf8_flag on的。 然后当再次输出的时候,是需要encode一下的。
我再看了一遍Encode模块的文档。 2009/9/17 cnhack TNT <[email protected]> > 我知道什么问题了,你得这样用 > ----- > use Encode; > use WWW::Mechanize; > > $a = new WWW::Mechanize; > $a->get("http://bendi.koubei.com/shanghai/searchstore--category-4"); > print encode("gbk",$a->content); > > > > > 2009/9/17 cnhack TNT <[email protected]> > > 1. 搞清楚抓来的数据是什么编码, 假设编码为 XX >> 2. $data_encoded = encode("gbk", decode("XX", $data) ); >> >> 应该是没有问题的 >> >> 2009/9/17 Mike.G <[email protected]> >> >> Hi, 各位有哪些朋友在cygwin环境下使用Perl呢? >>> 有么有碰到乱码的问题? >>> >>> 我今天在cygwin下使用perl抓取数据,非常郁闷的是,无论如何也解决不了乱码的问题。 >>> use Encode后无论怎么编码解码都不能解决乱码。 >>> xp的code page本身都是gb2312的。 >>> >>> 请指教。 >>> >>> 谢谢。 >>> >>> Mike.G >>> >>> >>> >> > > > > --~--~---------~--~----~------------~-------~--~----~ 您收到此信息是由于您订阅了 Google 论坛“PerlChina Mongers 讨论组”论坛。 要在此论坛发帖,请发电子邮件到 [email protected] 要退订此论坛,请发邮件至 [email protected] 更多选项,请通过 http://groups.google.com/group/perlchina?hl=zh-CN 访问该论坛 -~----------~----~----~----~------~----~------~--~---
