Hi hashao, nice to talk you again.
On Wed, Sep 13, 2000 at 06:45:00AM +0800, hashao wrote:
> 
> [EMAIL PROTECTED]
> [EMAIL PROTECTED]
> 
> 我以為中文 collate 實際上是與中文程序無關的,它並不是給中文程序員來
> 用的,它是給不懂中文的程序員,或者說不懂外文的程序員用來寫國際化
> [EMAIL PROTECTED]
> 表來做直接排序,根本不用 collation ,那麼我們豈不是根本不需要在 locale
> [EMAIL PROTECTED] locale 中其他部分也並不
> 需要, CTYPE, MESSAGE 等等都可以直接嵌入程序而不依靠任何 locale or
> XLOCALE [EMAIL PROTECTED]
> 

locale的各個catogery被認為是反映文化習慣的基本方面. 但具體到各語言每個
catogery的重要性不盡相同. Collation 是 alphabetical語言特有的東西, 在那
些語言裡不遵尋某種特定的規則, 就是錯. [EMAIL PROTECTED]
在的順序, 從這個意義上來講, collation對中文地確可有可無.

似乎您設想的情形是有程序簡單的用strcoll將漢字排序再輸出. 您認為以拼音為序
輸出才符合中文習慣. 未必吧. 我覺得在這種簡單的情況下怎麼排序都無所謂. 說
實話, 我在日常生活中見過以姓氏筆畫排序的, [EMAIL PROTECTED]

如果這就是您牆(damn it, chinpu3裡沒那個字!)調使用拼音排序的原因, 恕我不敢苟同.

當我請教大家拼音排序是否有助于中文程序, 我心中想的是使用與拼音有關的輸入法
的中文輸入程序, [EMAIL PROTECTED]

> 空口無憑,總是要個例子來說明拼音排序的問題。譬如我們使用的電郵
> 軟件,在目錄中的排序,如果以 subject 來進行,譬如在 mutt 下,
> 設定 LC_COLLATE = zh_CN.GB2312 ,如果使用部首筆畫排序,則需要
> 數筆畫,然後再從部首中判斷我們要找的條目。而程序不會告訴我們
> 目前所在位置的筆畫數是多少,比我們想要的數是多還是少,這裡,
> [EMAIL PROTECTED]
> 音代替了數筆畫,而拼音是快很多了。這是從用戶角度,而從程序員

為什麼會快呢? 在我看來: 如果你的程序不提供檢索功能, 憑眼睛看, 兩者
應該沒什麼區別吧. 如果程序提供檢索, 輸入要檢索的以後, 快慢要看檢索
程序怎麼寫得了.

> 魚與熊掌,如何兼得?正如 saka 前面說過,我們可以利用不同
> 的 collate 環境來解決,如可以在使用拼音排序時用
> LC_COLLATE = zh_CN.GB2312,在筆畫排序時用 LC_COLLATE = iso10651.GB2312
> 既然 unicode 中漢字本身是筆畫排序,直接就用也沒
> [EMAIL PROTECTED] locale ,他們可能不接受。

hashao兄在說笑吧?

> 
> 鑒于目前沒有完整的拼音對照表,目前只能使用筆畫排序,我只是
> 提議對日後使用拼音排序加以考慮。因為中文化依靠的是國際化,
> 僅僅是純中文程序是不夠的。

"日後......加以考慮"?! 情況恐怕只會越來越懷. 現在有7000字無拼音, 等
SuperCJK出來大概會有50,000字沒拼音了. 我懷疑有些字連專家都不知道怎麼
念.

Regards,
Rigel

_________________________________________________________
Do You Yahoo!?
Get your free @yahoo.com address at http://mail.yahoo.com

-- 
| This message was re-posted from [email protected]
| and converted from gb2312 to big5 by an automatic gateway.


回复