Предисловие
Эта статья является вольным пересказом раздела «Preface» Стандарта Юникода.
Стандарт Юникода 8.0 заменяет все предыдущие версии Стандарта.
Зачем нужен Юникод?
Стандарт Юникода и связанные с ним спецификации предоставляют программистам единую универсальную кодировку символов. А также подробное описание и большое количество данных, описывающих функции символов. Описывается, например:
- Как формировать слова из символов.
- Как переносить строки.
- Как сортировать тексты на различных языках.
- Как форматировать числа, даты, время и другие элементы, в зависимости от используемого языка.
- Как отображать письменность справа-налево (как в арабском или иврите).
- Как безопасно работать с «выглядящими одинаково» символами из различных алфавитов.
- И много всего такого.
Без описанных в Стандарте свойств и алгоритмов, различные приложения не могли бы достичь совместимости друг с другом. И всё богатство языков мира оказалось бы недоступных для современного программного обеспечения.
Чего нового
Смотрите здесь: http://www.unicode.org/versions/Unicode8.0.0/#Character_Additions.
Структура данного Стандарта
Стандарт состоит из следующих частей:
- Спецификация ядра (core specification) — этот документ.
- Приложения (Unicode Standard Annexes, UAX)
- База данных символов (Unicode Character Database, UCD)
- Списки символов
Приложения (UAX) распространяются в виде отдельных файлов и доступны на странице http://www.unicode.org/reports/index.html#annexes.
Кроме того на нашем сайте доступен их пересказ.
База данных (UCD) представляет собой набор текстовых файлов, описывающих символы, их названия и свойства.
Сама база доступна здесь: http://www.unicode.org/ucd/.
Её описание дано в UAX #44.
Списки символов (code charts) могут быть надены здесь: http://www.unicode.org/charts/PDF/Unicode-8.0/. Либо, для простого просмотра здесь: http://www.unicode.org/charts/.
Технические стандарты (UTS) и технические отчёты (UTR) не являются частью Стандарта. Их можно найти по адресу http://www.unicode.org/reports/ или у нас.
О найденных ошибках можно писать сюда: http://www.unicode.org/reporting.html.
Благодарности можно почитать здесь: http://www.unicode.org/acknowledgements/.