2.3. Символы для совместимости

Символы для совместимости (compatibility characters) были введены в Юникод только ради совместимости с другими стандартами. В большинстве случаев, это стандарты, которые предшествовали Юникоду.

Остальные же нормальные (non-compatibility) символы, введены в стандарт для представления различных письменностей и наборов символов. Они вводились вне зависимости от того, были ли они уже определены на тот момент в каком-то стандарте.

Например, модель арабского текста в Юникоде является логическим представлением текста, который использует базовые арабские буквы. Отображение конкретного написания арабского текста (например, курсивное) определяется в зависимости от контекста системой отрисовки. (См. раздел 9.2).

Однако, некоторые ранние кодировки арабского кодировали отдельными символами разные формы одних и тех же арабских букв. Начертание буквы в середине слова в арабском языке может отличаться от её же начертания в начале или конце слова. Для совместимости с этими кодировками, Стандарт Юникода включает в себя такие разделы, как Формы представления арабских букв.

Буквы этих разделов введены только для совместимости и упрощения взаимодействия между системами основанными на Юникоде и другими. Такие символы не должны использоваться для кодирования Юникод-текста.

Не требуется, чтобы конкретный символ из другой кодировки отображался в конкретный единственный символ Юникода. Если этот символ может быть представлен последовательностью из уже существующих символов Юникода, то введение символа совместимости не является обязательным. Например, буква «ainu» катаканы, представленная в кодировке Shift-JIS может быть представлена последовательностью <U+30C8, U+309A>. В том же случае, если для некоего символа не существует такой последовательности, для него должен быть явно введён символ совместимости.

Использование

По большому счёту, то, что некий символ является символом совместимости, не делает его запрещённым к использованию. В принципе, большинство таких символов могут спокойно использоваться в обычном тексте. Некоторые, впрочем, могут создавать проблемы при обмене данными, как, например, всё те же арабские позиционные формы. Используйте их с осторожностью. См. также UTR #20.

Распределение

Такие диапазоны символов, как Compatibility Area и Specials Area содержат большое количество символов совместимости. Однако, немало таких символов находится и в других частях кодового пространства. Например, , , ², и .

Нет отдельного полного списка символов совместимости. Не всегда можно сказать, что конкретный символ введён только для совместимости с каким-то стандартом.

Варианты совместимости

Варианты совместимости (compatibility variants), это подмножество символов совместимости, которые представляют собой варианты уже существующих простых символов.

Такие варианты могут представлять собой различные стилевые формы базовых символов. Например, надстрочные и подстрочные.

Далеко не всегда можно чётко констатировать, что данный символ является вариантом какого-то другого символа или нет.

Скопировано!