Artem Chuprina wrote:
BD> Не utf-16 а ucs-2, имхо.
"Есть мнение", что хранить файлы в UCS-2 невозможно, ибо UCS*
представляют символы в качестве абстрактных чисел, а нам нужны
конкретные байты. А байты у винды расположены, если точно, то
соответственно UTF-16-le кодированию UCS-2.
Есть мнение что нифига :)
Также есть мнение что надо курить доки, например UTR #17 - Character
Encoding Model около раздела Character Encoding Form (CEF)
(http://www.unicode.org/reports/tr17/index.html#CharacterEncodingForm)
Для тех кому лень:
UCS2 - 2 байта на уникодовый символ
UTF16 - Переменная длинна, типа UTF8 только вместо байта - слово.
А "абстрактные числа" - это есть Unicode-4 и прочие версии стандарта.
Так вот у виндов ЕМНИП кодировка символов Unicode идет в UCS2 в
интеловской последовательности (младший-старший). Хотя может и не в
интеловской ... не помню ...