2012/4/13 Kang-Hao (Kenny) Lu <[email protected]>

> > 如果就初始问题来说,当标为<meta
> >
> charset="big5">的网页究竟应该使用何种编码,则我觉得可以结合该网页的lang属性来判断。如果lang=zh-HK则使用big5-hkscs,而如果lang=zh-TW则使用big5-uao。
>
> 你�@��想法似乎刻意省略了�]有 @lang 的���r,��[1] big5 �W��抽了一些�砜矗�
> 十���e面有加 @lang 的只有一����。
>
> 另外,靠 @lang �Q定���a肯定不是一���g�[器�_�l者很喜�g的�x�瘛�
>
>
并非刻意忽略,只是假如有lang属性(或者类似的http
content-language头),可以帮助判断。在没有lang的情况,也可以检查用户在浏览器所设置的prefer
lang。当然这个隐含前提是服务器有更大几率返回prefer lang的文件,或用户更大几率是在阅读和prefer
lang一致的网页。而对于一个香港人阅读台湾网页或台湾人阅读香港网页就没什么帮助。(或者有反作用?)


> 其实浏览器软件自己当然是可以优化的,比如如果发现windows用户安装过hkscs
> > package,则将charset=big5视作big5-hkscs。
>
> 嗯,�@倒也是一��可以做的事。
>
> > 只是标准该如何制定呢?我感觉或许就是在标准里写明可能存在的冲突,要求浏览器必须提供额外的智能判断,
>
> 怎�N�拥闹悄芘��嗄兀�
>

其实就是像前面提到的,根据lang属性、content-language头、prefer
language设置等,再有就是编码嗅探,根据解码异常或者字频统计来改变编码(估计已经超出了当前在parse阶段编码嗅探算法的要求)。


>
> > 并且提供额外的设置编码手段给用户(比如在网页顶部显示几种big5
> > variants的选择按钮)。
>
> 你是�f「���a嗅探演算法」[2]第一步?
>

其实这里我指的并非是在parse阶段或页面解码之前,而是指当页面以某种编码显示之后,假如浏览器发现也可能是另外一种编码,则给用户修改的可能。


>
>
> �@�e的�_是�]有一����似「使用者代理必��提供使用者覆�w文件字符���a的方法」
> 之��的����符合�⑹觥D阌信d趣提�@��意���幔浚ㄎ业故怯悬c好奇�@������符合��
> 述的可行性,特�e是在行�友b置上的���r。)
>
>
不一定是“必须提供(MUST/SHOULD)”,我觉得讲“可以(MAY)提供”应该就成了。其实即使在mobile设备上也是可以的,因为不过就是显示两个额外的按钮就可以了(类似记住密码之类的)。

回复