Предисловие

Эта статья является вольным пересказом раздела «Preface» Стандарта Юникода.

Стандарт Юникода 8.0 заменяет все предыдущие версии Стандарта.

Зачем нужен Юникод?

Стандарт Юникода и связанные с ним спецификации предоставляют программистам единую универсальную кодировку символов. А также подробное описание и большое количество данных, описывающих функции символов. Описывается, например:

  • Как формировать слова из символов.
  • Как переносить строки.
  • Как сортировать тексты на различных языках.
  • Как форматировать числа, даты, время и другие элементы, в зависимости от используемого языка.
  • Как отображать письменность справа-налево (как в арабском или иврите).
  • Как безопасно работать с «выглядящими одинаково» символами из различных алфавитов.
  • И много всего такого.

Без описанных в Стандарте свойств и алгоритмов, различные приложения не могли бы достичь совместимости друг с другом. И всё богатство языков мира оказалось бы недоступных для современного программного обеспечения.

Чего нового

Смотрите здесь: http://www.unicode.org/versions/Unicode8.0.0/#Character_Additions.

Структура данного Стандарта

Стандарт состоит из следующих частей:

  • Спецификация ядра (core specification) — этот документ.
  • Приложения (Unicode Standard Annexes, UAX)
  • База данных символов (Unicode Character Database, UCD)
  • Списки символов

Приложения (UAX) распространяются в виде отдельных файлов и доступны на странице http://www.unicode.org/reports/index.html#annexes.

Кроме того на нашем сайте доступен их пересказ.

База данных (UCD) представляет собой набор текстовых файлов, описывающих символы, их названия и свойства.

Сама база доступна здесь: http://www.unicode.org/ucd/.

Её описание дано в UAX #44.

Списки символов (code charts) могут быть надены здесь: http://www.unicode.org/charts/PDF/Unicode-8.0/. Либо, для простого просмотра здесь: http://www.unicode.org/charts/.

Технические стандарты (UTS) и технические отчёты (UTR) не являются частью Стандарта. Их можно найти по адресу http://www.unicode.org/reports/ или у нас.

О найденных ошибках можно писать сюда: http://www.unicode.org/reporting.html.
Благодарности можно почитать здесь: http://www.unicode.org/acknowledgements/.

Скопировано!