Alexey Pechnikov wrote: > В libunicode-0.7v/include/unicode.h есть > typedef u_int16_t Uchar; > > Разве это не utf-16? Плюс предлагаются функции преобразования utf8 <-> > utf16. Про utf32 в коде не вижу даже упоминания.
Странно, в 0.4 использовались по крайней мере 32-битные символы для внутреннего представления, да и код рассчитан на >16 бит. Мы точно об одной и той же библиотеке говорим? >> >> В этой библиотеке нет функции сравнения строк. Для правильного >> >> сравнения похоже и нужны мегабайты libicu. > Возможно, но использование libicu в 4 раза замедляет запросы, это просто > немыслимо. Ну и размер либы нереально большой. Энтерпрайз. Ну вот такой он непростой, уникод. > С iconv понятно, перекодировку внешних данных делаю именно через него, а > храню все уже в utf8. А как правильно работать с utf8, чтобы избежать > лишних перекодировок? Поскольку расширение нужно для embedded СУБД, вопрос > производительности приоритетный. Есть строки в utf8, какие функции > использовать для достижения максимальной производительности? А какие функции нужны? man -k multibyte wide-character 'wide character' > wchar_t - это два байта, то есть UTF-16, откуда возьмется utf-32? >> В линуксе, кстати, представление wchar_t будет >> совпадать с UTF-32. -- To UNSUBSCRIBE, email to [email protected] with a subject of "unsubscribe". Trouble? Contact [email protected]

