Sergey Mereutsa wrote:

Не, я в курсе. Просто Дима (ДЕ) как-то говорил, что UNICODE_FSS
допускал невалидные последовательности символов - левак-с. Но де-факто
он квази-UTF8 - квази именно потому, что количество байт на символ
фиксированно (в чистом UTF-8 размер символов переменный и в теории
могут быть длиной до 6 байт). Но начиная с двойки (или полуторки)
левак в UNICODE_FSS запретили и де-факто они одинаковы.

Не совсем так. Кривые данные в UNICODE_FSS запретили лишь в 2.5, а в UTF8 - в 2.1. Еще они реализуют разные версии стандарта Unicode. Так, в UNICODE_FSS макс. допустимая длина символа 3 байта, а в UTF8 - 4 байта. Ну и поддержки коллейтов в UNICODE_FSS нет. Системные таблицы *пока что* остаются в UNICODE_FSS.


--
Дмитрий Еманов

Ответить