Re: =?BIG5?Q?=C3=F6=A4?=_=?BIG5?Q?=A4=A4=A4=E5locale=A4=A4=BA?=~=?BIG5?Q?=A6r=AA=BA=B1=C6=A7=C7?=

rigel Tue, 13 Feb 2001 03:58:20 -0600

Hi hashao, nice to talk you again.
On Wed, Sep 13, 2000 at 06:45:00AM +0800, hashao wrote:
> 
> [EMAIL PROTECTED]
> [EMAIL PROTECTED]
> 
> 我以為中文 collate 實際上是與中文程序無關的，它並不是給中文程序員來
> 用的，它是給不懂中文的程序員，或者說不懂外文的程序員用來寫國際化
> [EMAIL PROTECTED]
> 表來做直接排序，根本不用 collation ，那麼我們豈不是根本不需要在 locale
> [EMAIL PROTECTED] locale 中其他部分也並不
> 需要， CTYPE, MESSAGE 等等都可以直接嵌入程序而不依靠任何 locale or
> XLOCALE [EMAIL PROTECTED]
>


locale的各個catogery被認為是反映文化習慣的基本方面. 但具體到各語言每個
catogery的重要性不盡相同. Collation 是 alphabetical語言特有的東西, 在那
些語言裡不遵尋某種特定的規則, 就是錯. [EMAIL PROTECTED]
在的順序, 從這個意義上來講, collation對中文地確可有可無.

似乎您設想的情形是有程序簡單的用strcoll將漢字排序再輸出. 您認為以拼音為序
輸出才符合中文習慣. 未必吧. 我覺得在這種簡單的情況下怎麼排序都無所謂. 說
實話, 我在日常生活中見過以姓氏筆畫排序的, [EMAIL PROTECTED]

如果這就是您牆(damn it, chinpu3裡沒那個字!)調使用拼音排序的原因, 恕我不敢苟同.

當我請教大家拼音排序是否有助于中文程序, 我心中想的是使用與拼音有關的輸入法
的中文輸入程序, [EMAIL PROTECTED]

> 空口無憑，總是要個例子來說明拼音排序的問題。譬如我們使用的電郵
> 軟件，在目錄中的排序，如果以 subject 來進行，譬如在 mutt 下，
> 設定 LC_COLLATE = zh_CN.GB2312 ，如果使用部首筆畫排序，則需要
> 數筆畫，然後再從部首中判斷我們要找的條目。而程序不會告訴我們
> 目前所在位置的筆畫數是多少，比我們想要的數是多還是少，這裡，
> [EMAIL PROTECTED]
> 音代替了數筆畫，而拼音是快很多了。這是從用戶角度，而從程序員

為什麼會快呢? 在我看來: 如果你的程序不提供檢索功能, 憑眼睛看, 兩者
應該沒什麼區別吧. 如果程序提供檢索, 輸入要檢索的以後, 快慢要看檢索
程序怎麼寫得了.

> 魚與熊掌，如何兼得？正如 saka 前面說過，我們可以利用不同
> 的 collate 環境來解決，如可以在使用拼音排序時用
> LC_COLLATE = zh_CN.GB2312，在筆畫排序時用 LC_COLLATE = iso10651.GB2312
> 既然 unicode 中漢字本身是筆畫排序，直接就用也沒
> [EMAIL PROTECTED] locale ，他們可能不接受。

hashao兄在說笑吧?

> 
> 鑒于目前沒有完整的拼音對照表，目前只能使用筆畫排序，我只是
> 提議對日後使用拼音排序加以考慮。因為中文化依靠的是國際化，
> 僅僅是純中文程序是不夠的。

"日後......加以考慮"?! 情況恐怕只會越來越懷. 現在有7000字無拼音, 等
SuperCJK出來大概會有50,000字沒拼音了. 我懷疑有些字連專家都不知道怎麼
念.

Regards,
Rigel

_________________________________________________________
Do You Yahoo!?
Get your free @yahoo.com address at http://mail.yahoo.com

-- 
| This message was re-posted from [email protected]
| and converted from gb2312 to big5 by an automatic gateway.

Re: =?BIG5?Q?=C3=F6=A4?=_=?BIG5?Q?=A4=A4=A4=E5locale=A4=A4=BA?=~=?BIG5?Q?=A6r=AA=BA=B1=C6=A7=C7?=

回复