7.1. Латиница

Латинская письменность произошла от греческой. На сегодняшней день она используется во большом количестве языков по всему миру. В процессе адаптации к разным языкам были созданы многочисленные расширения исходной письменности. Добавлялись диакритические знаки, а также новые символы, диграфы, инверсивные и реверсивные формы.

Текст в латинской письменности записывается линейно слева направо. Для разделения слов используются пробелы. Переносы используются в случаях, когда строка разбивается по середине очередного слова (см. UAX #14, «Алгоритм разбиения строк»). Буквы имеют заглавные и строчные формы.

Языки

В списках символов, для конкретной буквы часто указывается в каких языках она используется.

Диакритические знаки

Добавление диакритических знаков к буквам может по различному трактоваться в разных языках. В одних комбинация базовой буквы и диакритического знака рассматривается, как самостоятельная буква алфавита. В других (как в английском), одни и те же слова могут писаться с диакритическими знаками, а могут без, что не влияет на их суть.

Большинство, основанных на латинице языков, рассматривают буквы с диакритикой, как варианты базовых символов. Они не рассматриваются, как независимые символы.

В целях совместимости с другими кодировками, в стандарт введены многие символы с диакритическими знаками. Хотя все они могут быть выражены комбинированными последовательностями.

В Стандарте Юникода, диакритические знаки всегда идут после базовых символов к которым применяются. См. разделы 7.9 (комбинированный знаки) и 2.11 (комбинированные символы).

Альтернативные глифы

У некоторых символов также есть альтернативное представление, хотя их семантика при этом не изменяется. В списках символов для таких символов используются наиболее предпочтительные глифы, хотя они могут и не подходить для всех возможных случаев.

Например, прописные буквы «a» и «g» в разных типографических вариантах могут иметь замкнутый или разомкнутый контур (см. рис. 7-1 в оригинальном стандарте). В обычном тексты, формы глифов не имеют никакого значения. Но некоторые системы фонетической транскрипции, такие как IPA, часто делают различия между такими формами.

Вариации диакритических знаков

Скопировано!