Anh Dũng et al, Em có trao đổi với Tiến sĩ Nguyễn Ái Việt, là kiến trúc sư trưởng phần mềm bocohan, bút đỏ,... tiếc ra không đi đến kết quả gì, forward lại để mọi người đọc giải khuây:
vuhung: Chào các anh chị, Việc bỏ dấu kiểu cũ hay mới không phải là vấn đề mới nhưng không hiểu sao vẫn chưa có quy định bằng văn bản quy chuẩn vấn đề này. Tham khảo: http://www.pcworld.com.vn/articles/tin-tuc/binh-luan/2011/01/1223210/phiem-dam-ve-oa-va-oa/ Tham khảo: http://www.chinhphu.vn/ Trang web này dùng lẫn lộn kiểu bỏ dấu mới và cũ Cách anh chị thử search "Khánh Hòa" và "Khánh Hoà" ở trang web này. Với người sử dụng, việc bỏ dấu theo kiểu cũ mới không ảnh hưởng nhiều vì ai cũng có thể hiểu được. Với các công cụ xử lý tiếng Việt trên máy tính sẽ có vấn đề nho nhỏ vì phải phân biệt òa và oà. Chúc các anh chị một năm mới an khang thịnh vượng. ------------------------------------------------------------------------------- naviet: Chào cả Hưng và các chị các anh, PHÀM LÀ việc đời (trong ICT và chính trị) cứ bắt đầu làm việc gì ắt chia làm 2 đảng phái: Thời bình minh nhân loại - Các phái "con gà" và "quả trứng" ai cũng cho biểu tượng của mình phải có trước. Không rõ có trước thì được cái gì. Guliver du ký: - Các phái "đầu trứng to" và "đầu trứng nhỏ" (khi húp trứng "à la coóc" mỗi phái chủ trương phải húp trứng ở một đầu). - Các phái "đầu giày trong" và "đầu giày ngoài" (Phái "đầu giày trong" chủ trương đỡ tốn thời gian quay đầu giày khi đi ngủ, phái "đầu giày ngoài" chủ trương tiết kiệm thời gian khi tỉnh giấc). Tiền chiến - Các phái "Nghệ thuật vị nghệ thuật" vs "nghệ thuật vị nhân sinh" (Tuy cãi nhau, nhưng 2 bên nhất quán được một tư tưởng "dứt khoát không vị được cả hai" mà không cần chứng minh hay bàn luận dù chỉ một câu). Ngày nay: - "Mã nguồn mở" vs "mã nguồn đóng" trong khi các hệ thống thông tin do cả hai phái đều có nhiều cái như ****. PHÀM LÀ có hai phái cãi nhau là không ai còn để ý đến mục tiêu phải đạt được, và cuối cùng chẳng bao giờ đi đến đâu. Nay vấn đề hài dấu cũng vậy, sở dĩ không có được cái quy định về hài dấu là vì có 2 phái một phái trọng thẩm mỹ và tính nhất quán, phái kia coi trọng luật đánh vần, dù cho đôi khi không thể theo luật này được (như trong "con gà maí"). Và thế là cãi nhau, mấy quan quản lý không dám nghe bên nào, cho đến ngày nay. Thế thì cũng không có gì đáng nói. Tuy nhiên, có lần tôi nói chuyện với một "thanh niên" rất nhiệt tình với chuyện này (và cũng là tín đồ của phái ký âm). "Thanh niên" này nói với tôi "Cần phải tổ chức một hội nghị để thống nhất việc này thì mới phát triển CNTT được anh ạ". Tôi hỏi "Nếu đa số hội nghị lại quyết định theo quy tắc thẩm mỹ thì chú tính sao". "Thanh niên" trả lời "Dù sao thì em vẫn theo phonetic". Thế là tôi hiểu là mình nên đi chỗ khác chơi, đỡ mất thì giờ, chỉ còn cách đợi lãnh đạo có tinh thần quả cảm mà quyết. Về xử lý thì không có vấn đề gì chỉ cần thêm chưa đến một câu lệnh. Tôi nhớ hình ảnh trước khi rời VN năm 1988 là cảnh ông hàng xóm ôm cái bơm xe cãi nhau với bà hàng xóm ôm mẹt thuốc lá. Đến năm 2003, về ghé qua chốn cũ thấy hai vị vẫn ôm bơm và mẹt thuốc cãi nhau. Thế nhưng, đến năm 2006, cả hai vị không còn ôm bơm ôm mẹt cãi nhau nữa. Vì thế anh em mình có làm gì thì làm, để các vị nhiều chữ cãi nhau cho ngã ngũ đi. Biết đâu có lãnh đạo có dũng khí ra đời quyết theo lối nào. Anh em mình thì thế nào mà chẳng được. ----------------------------------------------------------------------------------- vuhung: Chào chú Việt và các anh chị, Giá vàng 24k và 14k chênh nhau gần hai lần. Giá vàng ở Hà Trung và giá do nhà nước niêm yết cũng khác nhau đáng kể. Giá thử nhà nước thả nổi (open) thị trường (market) có lẽ lại hay. Có lẽ có một cái gì đó chung thì sẽ tốt hơn. Nhà nước (cơ quan chuẩn hóa )hay bản thân thị trường (cộng đồng) cần tạo ra chuẩn này? Nếu không được chuẩn hóa theo dạng top-down thì bản thân cộng đồng sẽ tự "hội tụ" tới một chuẩn nào đó (bởi một bàn tay vô hình nào đó). Nói vậy cháu sợ chức năng "chuẩn hóa" của một số cơ quan bị liệt mất. > Về xử lý thì không có vấn đề gì chỉ cần thêm chưa đến một > câu lệnh. Nếu có sự chuẩn hóa. select * from table where needed_data like '%khánh hòa' Nếu không có sự chuẩn hóa select * from table where needed_data like '%khánh hòa' select * from table where needed_data like '%khánh hoà' ->Thời gian xử lý tăng 200% (đợi thêm một chút cũng chả sao, lập trình viên và người dùng dễ tính và dễ thông cảm) Vấn đề là: Phải chỉnh ở mọi nơi, mọi chỗ (khá mất thời gian) Hoặc, chuẩn hóa dữ liệu đầu vào (cung khá mất thời gian) ----------------------------------------------------------------------------------- naviet: Chào Hưng và các chị các anh, > Nếu không được chuẩn hóa theo dạng top-down thì bản thân cộng đồng sẽ > tự "hội tụ" tới một chuẩn nào đó (bởi một bàn tay vô hình nào đó). > Nói vậy cháu sợ chức năng "chuẩn hóa" của một số cơ quan bị liệt mất. Chức năng gì có không dùng thì cũng sẽ liệt thôi :-)) > Nếu không có sự chuẩn hóa > select * from table where needed_data like '%khánh hòa' > select * from table where needed_data like '%khánh hoà' > ->Thời gian xử lý tăng 200% Có thể viết ngắn hơn và chạy nhanh hơn select * table where needed_data like '%khánh hòa' or '%khánh hoà' Một lệnh thế này chạy chắc mất khoảng chưa tới 1s Có lẽ đỡ tốn thời gian hơn ngồi họp bàn. Chưa kể hiệu ứng phụ (họp xong rồi về bị trầm cảm) :-)) Aiviet --------------------------------------------------------------------------------------- vuhung: >> Nếu không có sự chuẩn hóa >> select * from table where needed_data like '%khánh hòa%' >> select * from table where needed_data like '%khánh hoà%' >> ->Thời gian xử lý tăng 200% > > Có thể viết ngắn hơn và chạy nhanh hơn > select * table where needed_data like '%khánh hòa' or '%khánh hoà%' A = thời gian chạy select * from table where needed_data like '%khánh hòa%' B = thời gian chạy select * from table where needed_data like '%khánh hoà%' C = thời gian chạy select * table where needed_data like '%khánh hòa' or '%khánh hoà%' Nói chung A xấp xỉ B cộng C. Chú có thể thử với dữ liệu khá lớn. > Một lệnh thế này chạy chắc mất khoảng chưa tới 1s LIKE search khá tốn kém với những bảng khoảng vài triệu tới hàng trăm triệu records. Thời gian sẽ không phải là 1s nữa. Đây là việc của lập trình viên chứ không phải việc của người làm chuẩn chú ạ. -------------------------------------------------------------------------------------- naviet: Hưng à, > 2011/2/7 <[email protected]>: >>> Nếu không có sự chuẩn hóa >>> select * from table where needed_data like '%khánh hòa%' >>> select * from table where needed_data like '%khánh hoà%' >>> ->Thời gian xử lý tăng 200% >> >> Có thể viết ngắn hơn và chạy nhanh hơn >> select * table where needed_data like '%khánh hòa' or '%khánh hoà%' > > A = thời gian chạy select * from table where needed_data like '%khánh hòa%' > B = thời gian chạy select * from table where needed_data like '%khánh hoà%' > C = thời gian chạy select * table where needed_data like '%khánh hòa' > or '%khánh hoà%' > Nói chung A xấp xỉ B cộng C. Chú có thể thử với dữ liệu khá lớn. Theo kinh nghiệm và kiến thức lý thuyết của chú thì nếu CSDL lớn C << A+B. Lý do là thời gian tìm kiếm là phần lớn, sau đó đến thời gian truy cập vào bảng dữ liệu, số lần duyệt sẽ ít hơn nhiều, việc tìm kiếm một chuỗi phức hợp không hơn chuỗi giản đơn bao nhiêu. >> Một lệnh thế này chạy chắc mất khoảng chưa tới 1s > LIKE search khá tốn kém với những bảng khoảng vài triệu tới hàng trăm > triệu records. > Thời gian sẽ không phải là 1s nữa. Nếu có dự án thực tế và tiền đầu tư đủ, chú có thể làm cho thời gian vẫn chỉ ở mức 1s :-)) > Đây là việc của lập trình viên chứ không phải việc của người làm chuẩn chú ạ. Ý chú nói là chuẩn có ý nghĩa hơn nhiều so với việc làm công việc của lập trình viên nhẹ bớt. Nếu chỉ để nhẹ bớt, lập trình viên cũng có thể tự làm được, không cần đến chuẩn. Aiviet 2011/1/11 Phan Anh Dung <[email protected]> > > Chào các bác, nhất là các bác trong dự án [MOST] > > Tôi vừa đăng một bài lên PCWorld VN về chính tả hòa, hoà... > http://www.pcworld.com.vn/articles/tin-tuc/binh-luan/2011/01/1223210/phiem-dam-ve-oa-va-oa/ > > Vì có liên quan tới công việc của dự án [MOST] nên xin "spam" vấn đề lên đây > để các bác cùng thảo luận & góp ý: > > Thảo luận về chính tả hòa, hoà > > Người viết vừa “Google” vài từ để kiểm tra kết quả cuộc cải cách chữ viết nho > nhỏ, hình như do nhóm nào đó khởi xướng khoảng 20 năm trước, về dấu trên các > vần oa, oe, uy... > Và đây là kết quả: > > Khoảng 23.500.000 kết quả (0,22 giây) cho "hòa bình" > Khoảng 8.780.000 kết quả (0,27 giây) cho "hoà bình" > > Khoảng 6.970.000 kết quả (0,21 giây) cho "thỏa mãn" > Khoảng 2.860.000 kết quả (0,23 giây) cho "thoả mãn" > > Khoảng 1.400.000 kết quả (0,15 giây) cho "giải tỏa" > Khoảng 1.440.000 kết quả (0,22 giây) cho "giải toả" > > Khoảng 1.770.000 kết quả (0,27 giây) cho "khỏe mạnh" > Khoảng 1.990.000 kết quả (0,28 giây) cho "khoẻ mạnh" > > Khoảng 576.000 kết quả (0,33 giây) cho "tung tóe" > Khoảng 224.000 kết quả (0,36 giây) cho "tung toé" > > Khoảng 565.000 kết quả (0,34 giây) cho "mánh khóe" > Khoảng 135.000 kết quả (0,27 giây) cho "mánh khoé" > > Khoảng 1.890.000 kết quả (0,16 giây) cho "tùy ý" > Khoảng 452.000 kết quả (0,40 giây) cho "tuỳ ý" > > Khoảng 165.000 kết quả (0,27 giây) cho "thành lũy" > Khoảng 92.800 kết quả (0,34 giây) cho "thành luỹ" > > Khoảng 437.000 kết quả (0,32 giây) cho "tiều tụy" > Khoảng 94.800 kết quả (0,32 giây) cho "tiều tuỵ" > > Khoảng 80.700 kết quả (0,22 giây) cho "túy lúy" > Khoảng 26.000 kết quả (0,29 giây) cho "tuý luý" > > Khoảng 246.000 kết quả (0,22 giây) cho "lũy kế" > Khoảng 386.000 kết quả (0,36 giây) cho "luỹ kế" > > Chịu khó phân tích thấy cũng có nhiều thông tin từ các con số khô khan của > Google: > > 1. Các từ càng phổ thông, càng có xu hướng viết kiểu cũ như “hòa bình”, “thỏa > mãn”... Các từ ít phổ thông có lẽ khiến người viết phải cân nhắc lại chính tả > khi viết nên xu hướng viết kiểu mới lại thắng thế như “giải toả”... > > Tuy nhiên, cũng có người đưa ra ý kiến cho rằng “Không phải vậy, người ta > quen viết kiểu cũ, viết kiểu mới là vì từ thời máy tính được dùng phổ biến > thay máy chữ soạn thảo văn bản, thì các bộ gõ bị đặt mặc định kiểu gõ mới, > nên họ buộc phải theo thôi, quay lui sửa mệt chứ không phải thích kiểu bỏ dấu > mới! Chẳng hạn nếu không bật về kiểu gõ cũ thì khi muốn gõ “hòa” sẽ phải gõ > “hò a” có dấu cách ở giữa, rồi quay lui 1, xóa dấu cách, rồi lại tiến lên 1, > tính ra phải thêm đến 4 lần bấm phím” > > 2. Chịu khó xem viết trong văn bản nào, có thể thấy các tác phẩm văn học > thường in theo kiểu cũ > > 3. Các từ thuộc nhóm KHXH thiên về kiểu cũ (75% cho túy lúy) > > 4. Các từ nhóm KHKT lại nghiêng theo kiểu mới (61% cho luỹ kế) > > 5. Xu hướng viết cân đối mỹ thuật vẫn còn nhiều người ủng hộ: kết quả về tiều > tụy/tiều tuỵ ở trên cho thấy rõ là khi kiểu viết mới mất cân đối rõ rệt thì > tỷ lệ ủng hộ rất thấp (chỉ có 18% cho tiều tuỵ). Khi cắt khẩu hiệu, băng rôn > treo ngoài đường phố thì chữ rất to, vấn đề cân đối cũng thấy rõ nên xu hướng > chọn kiểu viết cũ cũng thắng thế, xem dạng font cỡ lớn ở dưới sẽ hiểu: > > HÒA , HOÀ > > Với tình hình khảo sát thống kê ở trên, người viết trộm nghĩ giá hồi xưa > người ta đừng đứng ra phát động cuộc cải cách về dấu trên các vần oa, oe, uy > thì biết đâu chính tả tiếng Việt bây giờ sẽ đỡ lộn xộn hơn? Người viết từng > có dịp trao đổi với cụ Nguyễn Tài Cẩn, GS đầu ngành ngôn ngữ học của Việt > Nam. Khi nhắc tới vấn đề này, thì thấy GS có vẻ không quan tâm và không bình > luận đúng sai gì cả. Cá nhân người viết cho rằng đặt dấu trên nguyên âm chính > có vẻ “khoa học” hơn, nhưng những người đặt dấu trên âm đệm -o-, -u- cũng có > cái lý của họ (mà không cần viện dẫn lý do “cân đối”, “mỹ thuật” đâu nhé). > > Vấn đề là, thanh điệu vốn là thuộc tính của cả từ chứ không phải là “độc > quyền” của nguyên âm chính. Do quán tính vật lý của bộ máy phát âm nên khó có > thể ngay lập tức thay đổi cao độ của từ chỉ trong khoảng thời gian ngắn của > âm chính, nên các âm đệm trước (-o-,-u-) và sau âm chính (như -i ở vần -ai, > -oi) ít nhiều cũng tham gia vào việc thể hiện thanh điệu. Ngay cả phát âm các > phụ âm cuối cũng có thể biến đổi ít nhiều phụ thuộc vào thanh điệu cả từ. > > Có lẽ những người phát minh dấu điện tín tiếng Việt (telex) cũng đã nắm khá > rõ vấn đề này nên quy tắc điện tín chuẩn thời xưa là bỏ dấu (f,j,r,s,x) ở > cuối từ, chứ không phải đính sau một nguyên âm nào cả. Người viết nhớ, khi > nhóm cải cách muốn “giác ngộ” quần chúng, họ đã yêu cầu thử đọc tách rời hò-a > và ho-à để xem cách nào sát âm “hòa” hơn... Quả thực ho-à sát hơn, nhưng cách > làm đó chưa công bằng, vì tách âm đúng hơn nữa phải là hò-à, dấu không thuộc > riêng một nguyên âm nào. > > Như vậy viết “hòa” theo kiểu cũ, cho dấu nằm ngay giữa từ, chính là để nhắc > người đọc rằng dấu thanh vốn thuộc về cả từ, cũng có logic lắm chứ? Nếu thực > sự cần phát động một cuộc “cách mạng chữ viết” thì còn rất nhiều cái đáng > phải sửa chữa hơn là quy tắc bỏ dấu trên 3 vần đó. Chẳng hạn: > > Trong các vần -ay, -au thì “a” là nguyên âm a ngắn, chính tả thông thường > viết là “ă”. Như vậy tau, say, mày, mau... phải viết tău, săy, mằy, mău... > Khi đọc thấy điều “nằy” trong cuốn giáo trình lịch sử ngữ âm tiếng Việt của > GS Cẩn, người viết rất bất ngờ, té ra lâu “năy” mình dốt. > Trong các vần -ay, -au khó nhận ra nguyên âm nào là âm chính, nhưng dựa vào > các ví dụ như ni = nay, thu = thâu thì lại có thể cho rằng âm chính là -y và > -u? Như vậy, nếu theo logic dấu phải đặt trên âm chính thì lại phải sửa thêm > rất nhiều trường hợp như mày => măỳ, máu => măú... > Tiếng Việt còn nhiều cặp nguyên âm kép khá cân bằng về độ dài và cường độ > tương đối, rất khó nhận ra âm nào là chính. Như vậy, nếu yêu cầu phải đặt dấu > trên âm chính thì sẽ rất khó cho người bình thường không có máy móc kỹ thuật > đo đạc chính xác trường độ, cường độ, tần số âm thanh...? > Phụ âm “Ph” có bật hơi thời Alexandre De Rhodes hầu như đã biến mất khỏi > tiếng Việt, chuyển thành “F”, nên chính tả hiện đại phải là “F”. > Âm đệm -o-, -u- thực chất chỉ là một, có thể viết là -w- . Nhưng trong một số > vần như -oi , -ui thì -o-, -u- lại là âm chính chứ không phải âm đệm, nên nếu > cải cách thì có lẽ vấn đề sẽ rất phức tạp, bởi tùy địa phương và thời đại mà > có thể nguyên âm thứ nhất mạnh hơn (là âm chính) hay suy giảm (trở thành âm > đệm). > “Q” nên viết là “K”? > “Gi” có thể viết là “j”, “d” là “z”, “đ” là “d” .v.v... > So với các vấn đề “nằy” thì chuyện “òa”, “oà” là chuyện nhỏ, nhưng nói ra > cũng dễ bị... "chọi đá". Đã làm cách mạng thì phải triệt để. Cuộc cải cách > nửa vời nói trên đã gây ra tình trạng hỗn loạn không đáng có cho chính tả > tiếng Việt thời @! > > Nhân tiện bàn thêm: Vấn đề truyền thống văn hóa cũng rất quan trọng. Chữ quốc > ngữ đã có lịch sử gần 500 năm, văn học viết bằng chữ quốc ngữ cũng đã có hơn > một thế kỷ, nếu vứt bỏ để theo hệ thống chính tả mới, các tiểu thuyết, thi ca > thời tiền chiến sẽ phải đem ra phiên dịch lại? Có lẽ lý do tương tự mới giải > thích được vì sao người Anh, Mỹ không cải tiến chính tả tiếng Anh dù chính tả > tiếng Anh đã nổi tiếng thế giới về lối viết một đằng, đọc một nẻo? > > Từ khóa: bỏ dấu tiếng Việt > -- > Phan Anh Dũng > R&D Department, Huesoft > (Trung tâm Công nghệ Thông tin Thừa Thiên Huế) > > _______________________________________________ > POST RULES : http://wiki.hanoilug.org/hanoilug:mailing_list_guidelines > _______________________________________________ > HanoiLUG mailing lists: http://lists.hanoilug.org/ > HanoiLUG wiki: http://wiki.hanoilug.org/ > HanoiLUG blog: http://blog.hanoilug.org/ -- Best Regards, Nguyen Hung Vu [aka: NVH] ( in Vietnamese: Nguyễn Vũ Hưng ) vuhung16plus{remove}@gmail.dot.com , YIM: vuhung16 , Skype: vuhung16plus _______________________________________________ POST RULES : http://wiki.hanoilug.org/hanoilug:mailing_list_guidelines _______________________________________________ HanoiLUG mailing lists: http://lists.hanoilug.org/ HanoiLUG wiki: http://wiki.hanoilug.org/ HanoiLUG blog: http://blog.hanoilug.org/
