Firefox 的作法是讓 u2b 和 b2u 兩個表不相等:unicode to big5 用最保守的 CP950,big5 to unicode 則用最大的 set big5-uao。
我想講的跟前面 Yuao 說的一樣,主要的問題是目前通用的 big5 都不是互相的 subset,所以要 unify 不是可行的事情。big5-uao 作為 Telnet BBS 的外字集,也是跟 Big5-HKSCS 重疊但不相容的。 關於 Mozilla 針對 Big5 處理的經驗,有前人寫的 http://moztw.org/docs/big5/ 可供參考。 Tim 2012/4/10 Yuan Chao <[email protected]>: > 2012/4/9 Philip Jägenstedt <[email protected]>: > > Hi Philip, > >> IE瀏覽器一直只支持一種Big5編碼而其它瀏覽器支持兩種:Big5和Big5-HKSCS。問題是好多設定<meta >> charset="big5">的網頁仍然使用屬於Big5-HKSCS的字符,而在IE會顯示正常。因此,我們在WHATWG正在研究怎麼定義一個統一Big5和Big5-HKSCS的編碼: > > 老實說,要直接把Big5-HKSCS直接併入Big5應該是會有問題的。在台灣普遍有個 > de facto的外字庫:中國海字集,確定有一部份是跟Big5-HKSCS重疊但不相容的。 > > 稍微google了一下舊資料,多年來在firefox已經有patch讓private area有了對應: > https://bugzilla.mozilla.org/show_bug.cgi?id=310299 > 也許WHATWG可以有類似的作法? > > > -- > Best regards, > Yuan Chao
