On Wed, 18 Apr 2012 08:35:39 +0200, Yuan Chao <[email protected]> wrote:
2012/4/17 Kang-Hao (Kenny) Lu <[email protected]>:
或許開個 Google spreadsheet 大家上去幫忙人肉比對一下?
歡迎抽空幫忙,目前就是[1]和[2]而已。不過我在想辦法造出新的(含有日文的)。
呵呵,我很好奇是因為樣本數差異的關係(google: 約有 797,000,000 項結果),
還是bing的「取向」離你(Kenny)我有距離,畢竟我沒在用bing的... :D
hkscs跟uao都有收big5倚天碼的部份,所以假名都不是問題,問題在日文漢字部份。
另外,從上次阿菲的survey看起來,中國海字集中收錄的編號⒈ ⒉ ⒊跟圖案♥,
到現在還有不少在用。這個部份也就只有uao能對了。
剛剛阿菲跟我講它這部份其實都做得差不多了,不過 .hk 裡面有七個他分不出來
的就請大家幫忙一下好了。可能需要人肉搜尋、推理:
1.
http://www.cepa.com.hk/office/officeAdminFurnitureFactory.asp
hkscs: 超<U+6822 栢>(香港)有限公司
uao: 超<U+8063 聣>(香港)有限公司
Link to Superb (HK) Limited <http://www.superbhk.com/>, which is dead.
用發音猜hkscs吧?
2.
http://www.budaedu.org.hk/budaedu/qm-04.html
hkscs: ,不許改革。彼預與其族叔祖楚�<U+48F3 䣳>翩A議其辦法。�<U+48F3 䣳>
翩A乃明理通人,極為贊成。遂於
uao: ,不許改革。彼預與其族叔祖楚�<U+92F6 鋶>翩A議其辦法。�<U+92F6 鋶>
翩A乃明理通人,極為贊成。遂於
標點衝碼?都錯?
http://www.minlun.org.tw/haihui/data/56/index.asp?t1=0&t2=6&t3=65
彼預與其族叔祖楚常公.議其辦法。常公.乃明理通人.極為贊成。
3.
http://www.ychlccsc.edu.hk/info07.html
hkscs: ng>內設可供燒製大型壁畫的陶<U+7AB0
窰>電動拉坯機、坭板機、真空混坭機
uao: ng>內設可供燒製大型壁畫的陶<U+8BD6
诖>電動拉坯機、坭板機、真空混坭機
Typo of 密?
應該是窯的別字?(倉頡輸入?手寫輸入?)
4.
http://www.budaedu.org.hk/budaedu/shwd-02.html
hkscs: 《補史記‧三皇本紀》說:『太�<U+4C3B
䰻>]犧氏,風姓,代燧人氏繼天而王
uao: 《補史記‧三皇本紀》說:『太�<U+7F37
缷>]犧氏,風姓,代燧人氏繼天而王
http://zh.wikisource.org/zh-hant/%E4%B8%89%E7%9A%87%E6%9C%AC%E7%B4%80
太皞,庖犧氏,風姓,代燧人氏繼天而王。
(這裡「王」作動詞) 這份來自維基文庫的似乎是從簡體轉來的,雖是utf8編碼,
跟其他google到的比起來似有錯漏。
http://continuation.prhs.ptc.edu.tw/tanjan/masters.htm
太昊庖犧氏,風姓。代燧人氏繼天而王。
http://www.tawa.tw/DiscriminationAndCalculusm_2.htm
太昊庖犧氏風姓代燧人氏繼天而王
http://data.book.hexun.com.tw/chapter-3665-2-3.shtml
太嗥庖犧氏風姓,代燧人氏繼天而王。
http://tongzi.blog.hexun.com.tw/40974323_d.html
太皞庖犧氏,風姓,代燧人氏繼天而王。
http://xn--fhqx4yz1dd20a.tw/html/92/555.html
太皋包犧氏,風姓,代燧人氏繼天而王。
「鍵盤考古學」還是有極限的... XD
5.
http://www.htsps.edu.hk/Web/03_TeachLearn/chi.htm
這沒辦法...
6.
http://www.mihk.hk/forum/thread-962765-1-1.html
hkscs: t> 下1湯匙油燒熱鍋,爆香乾<U+27A53
𧩓>片,下芋頭略煮片刻,灒酒略拌勻
uao: t> 下1湯匙油燒熱鍋,爆香乾<U+E16A
>片,下芋頭略煮片刻,灒酒略拌勻
Same character in some fonts, but UAO uses PUA mapping. Possible typo.
Linux下看到相同字符,但來自不同的字型。
7.
http://www.htsps.edu.hk/Web/03_TeachLearn/eng.htm
還是沒辦法...
hkscs: t-family:標楷體'>趙<U+6667 晧>峻</span></p>
uao: t-family:標楷體'>趙<U+7BCF 篏>峻</span></p>
Given name Chiu Ho Tsun: 趙晧峻 or 趙篏峻?
明顯看來,在.hk用hkscs沒有太大的爭議。
非常謝謝!
我已經更新了HK樣本的分類:
https://gitorious.org/whatwg/big5/commit/16bd9738500608569bef908c57e04522a31ed332
--
Philip Jägenstedt
Core Developer
Opera Software