Здравейте,

При тестване как се сортира, като в речник, на български текст, открих 
някой проблеми.

Направих тест с използване на Си функцията strcoll и получавам грешен 
резултат за "и" с ударение.
x040D "И" голямо ударено
x045D "и" малко ударено

Предположих, че зависи от файла /usr/share/i18n/locales/bg_BG.
Разглеждах го и не установих, защо двете и-та са преди всички български 
букви, а също защо дава, че са равни. Не са описани, но ми е странен 
резултата.


Интересува ме, кой отговаря за подръжката на този файл ? Данните в него 
не ми изглеждат много актуални.


Направих и тест с PERL(кода следва):
==================
use locale;
print +(sort grep /\w/, map { chr } 0x400..0x45f), "\n";
==================
и при настойка LANG=bg_BG.UTF-8 се получава следното:
ЀЍѐѝаАбБвВгГѓЃдДђЂџЏѕЅеЕєЄёЁэЭжЖзЗиИІіїЇыЫйЙЈјкКќЌлЛљЉмМнНњЊоОпПрРсСтТуУўЎфФхХцЦчЧћЋшШщЩъЪьЬюЮяЯ

Виждат се и други неправилно подредени знаци.

Румен
_______________________________________________
Lug-bg mailing list
[email protected]
http://linux-bulgaria.org/mailman/listinfo/lug-bg

Reply via email to