Re: Возможна ли поддержка тиклем юникода?

Serhiy Storchaka Mon, 19 Jan 2009 03:46:17 -0800

Alexey Pechnikov wrote:
> В libunicode-0.7v/include/unicode.h есть
> typedef u_int16_t Uchar;
> 
> Разве это не utf-16? Плюс предлагаются функции преобразования utf8 <->
> utf16. Про utf32 в коде не вижу даже упоминания.


Странно, в 0.4 использовались по крайней мере 32-битные символы для
внутреннего представления, да и код рассчитан на >16 бит. Мы точно об одной
и той же библиотеке говорим?

>> >> В этой библиотеке нет функции сравнения строк. Для правильного
>> >> сравнения похоже и нужны мегабайты libicu.
> Возможно, но использование libicu в 4 раза замедляет запросы, это просто
> немыслимо. Ну и  размер либы нереально большой.

Энтерпрайз. Ну вот такой он непростой, уникод.

> С iconv понятно, перекодировку внешних данных делаю именно через него, а
> храню все уже в utf8. А как правильно работать с utf8, чтобы избежать
> лишних перекодировок? Поскольку расширение нужно для embedded СУБД, вопрос
> производительности приоритетный. Есть строки в utf8, какие функции
> использовать для достижения максимальной производительности?

А какие функции нужны?

man -k multibyte wide-character 'wide character'

> wchar_t - это два байта, то есть UTF-16, откуда возьмется utf-32?

>> В линуксе, кстати, представление wchar_t будет 
>> совпадать с UTF-32.



-- 
To UNSUBSCRIBE, email to [email protected]
with a subject of "unsubscribe". Trouble? Contact [email protected]

Re: Возможна ли поддержка тиклем юникода?

Ответить