Представленные в Юникоде Символы

Представленные в Юникоде Символы

В Юникоде зарезервировано 1 114 112 (= 220 + 216) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859-1 («Латиница-1»).

Кодовое пространство разделено на 17 «плоскостей» по 65 536 (= 216) символов:

  • Плоскость 0 (0000—FFFF): Базовая многоязыковая плоскость (Basic Multilingual Plane, BMP)
  • Плоскость 1 (10000—1FFFF): Дополнительная многоязыковая плоскость (Supplementary Multilingual Plane, SMP)
  • Плоскость 2 (20000—2FFFF): Дополнительная иероглифическая плоскость (Supplementary Ideographic Plane, SIP)
  • Плоскость 3 (30000—3FFFF): Третичная иероглифическая плоскость (Tertiary Ideographic Plane, TIP)
  • Плоскости 4—13 (40000—DFFFF) не используются
  • Плоскость 14 (E0000—EFFFF): Дополнительная плоскость особого назначения (Supplementary Special-purpose Plane, SSP)
  • Плоскость 15 (F0000—FFFFF) используется как дополнительная область-A для частного использования (Supplementary Private Use Area-A, SPUA-A)
  • Плоскость 16 (100000—10FFFF) используется как дополнительная область-B для частного использования (Supplementary Private Use Area-B, SPUA-B)

Содержание

Базовая многоязыковая плоскость

Базовая плоскость UNICODE

Базовая плоскость UNICODE
Чёрный — расширенный латинский алфавит;
Голубой — лингвистические символы международного фонетического алфавита IPA;
Синий — другие европейские алфавиты;
Оранжевый — письменности Ближнего Востока;
Светло-оранжевый — письменности Африки;
Зелёный — письменности Южной Азии;
Фиолетовый — письменности Юго-восточной Азии;
Красный — письменности Восточной Азии;
Розовый — унифицированные китайско-японско-корейские символы;
Жёлтый — письменности аборигенов Северной Америки;
Пурпурный — символы;
Тёмно-серый — диакритики;
Светло-серый — суррогатные пары UTF-16 и области для частного использования;
Циан — другие знаки;
Белый — не используется.

Плоскость 0 (Основная многоязыковая плоскость, англ. Basic Multilingual Plane, BMP) содержит символы практически для всех современных письменностей и большое число специальных символов. Большая часть таблицы занята китайско-японско иероглифами и своеобразными корейскими буквами.

В Unicode 5.1 в этой плоскости представлены следующие наборы символов:


Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Дополнительная многоязыковая плоскость

Плоскость 1 (дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена, в первую очередь, для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы.


Дополнительная многоязыковая плоскость разделена на следующие поддиапазоны:

  • U+10000—U+100FF Линейное письмо Б
  • U+10100—U+1018F Древние системы счисления
  • U+10190—U+107FF Алфавиты, слоговые письменности и наборы символов с направлением письма слева направо
  • U+10800—U+10FFF Алфавиты и слоговые письменности с направлением письма справа налево
  • U+11000—U+11FFF Брахмические письменности
  • U+12000—U+12FFF Клинопись и другие древние письменности
  • U+13000—U+15BFF Иероглифы древних египтян и майя
  • U+15C00—U+15FFF Ацтекские пиктограммы
  • U+16000—U+167FF Вновь созданные письменности
  • U+16800—U+16FFF Африканские и другие письменности
  • U+17000—U+1B5FF Большие азиатские письменности и наборы символов
  • U+1B600—U+1BFFF Не используется
  • U+1C000—U+1CDFF Иероглифы микмак
  • U+1CE00—U+1CFFF Протоэламская письменность
  • U+1D000—U+1DFFF Системы условных обозначений
  • U+1E000—U+1EFFF Не используется
  • U+1F000—U+1F0FF Игровые символы
  • U+1F100—U+1F2FF Наборы буквенно-цифровых и иероглифических символов
  • U+1F300—U+1FFFF Не используется


В Unicode 5.1 в этой плоскости представлены следующие наборы символов:

  • Алфавиты и слоговые письменности с направлением письма справа налево:
  • Клинопись и другие древние письменности:
  • Системы условных обозначений:
    • Византийские музыкальные символы (1D000-1D0FF)
    • Музыкальные символы (1D100-1D1FF)
    • Древнегреческие музыкальные символы (1D200-1D24F)
    • Символы Тай Сюань Цзин (1D300-1D35F)
    • Восточноазиатские счётные палочки (1D360-1D37F)
    • Математические буквенно-цифровые символы (1D400-1D7FF)
  • Игровые символы:


Наборы символов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Дополнительная иероглифическая плоскость

Плоскость 2 (Дополнительная иероглифическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ.

В Unicode 5.1 в этой плоскости представлены следующие наборы иероглифов:


Наборы иероглифов, предложенные для кодирования и находящиеся на стадии рассмотрения:

Третичная иероглифическая плоскость

Плоскость 3 (Третичная иероглифическая плоскость, англ. Tertiary Ideographic Plane, TIP) зарезервирована для архаичных китайских иероглифов.

Третичная иероглифическая плоскость предварительно разделена на следующие поддиапазоны:


В вышеперечисленные диапазоны предполагается включить следующие наборы иероглифов:

  • в диапазон U+30000—U+317FF - древнейшие китайские иероглифы эпохи Шан (цзягувэнь, 甲骨文), встречающиеся в гадательных надписях на панцирях черепах и костях животных.
  • в диапазон U+32000—U+32FFF - иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах.
  • в диапазон U+34000—U+368FF - иероглифы в стиле «малая печать» (сяочжуань, 小篆).

В будущем также предполагается включить наборы иероглифов Периода Сражающихся царств.

Дополнительная плоскость особого назначения

Плоскость 14 (Дополнительная плоскость особого назначения, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению.

В Unicode 5.1 в этой плоскости представлены следующие наборы символов:

  • Символы тегов (E0000—E007F)
  • Дополнительные селекторы вариантов начертания (E0100—E01EF)

Области для частного использования

Некоторые диапазоны Юникода выделены для частного использования и экспериментов. Они включают:

  • Частную область в Базовой многоязыковой плоскости U+E000—U+F8FF
  • Дополнительные плоскости 15 (U+F0000—U+FFFFF) и 16 (U+100000—U+10FFFF)

Ссылки

Кодировки символов
Основы → алфавиттекстфайлданные ) • набор символовконверсия
Исторические кодировки → Докомп.: семафорная (Макарова)МорзеБодоМТК-2 Комп.: 6 битУПП • EBCDIC ( ДКОИ-8 ) • КОИ-7ISO 646
совре-
менное
8-битное
представ-
ление
символы управляющие • печатные ) не-ASCIIпсевдографика )
8бит. код.стр. Разные →   Кириллица: КОИ-8ГОСТ 19768-87 • ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
Windows → 1251(кир.) 1252 WGL4
IBM&DOS → 850 • 866 «альт.»МИК )
Много-
байтные
Традиционные → GB2312 ) • HTML
Unicode → UTF-8 • список символовкириллица )
Связанные
темы →
интерфейс пользователяраскладки клавиатурлокальперевод строкишрифткрокозябрытранслит Утилиты: recode

Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "Представленные в Юникоде Символы" в других словарях:

  • Символы, представленные в Юникоде — В Юникоде зарезервировано 1 112 064 (= 220 + 216 − 211) позиций символов, из которых сейчас используется свыше 100 000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859 1 («Латиница 1»). Кодовое… …   Википедия

  • Символы — (За гранью возможного) Символы, представленные в Юникоде Символы джокеры Все статьи, начинающиеся с Символы …   Википедия

  • Символы представленные в Юникоде — …   Википедия

  • Юникод — Юникод[1] или Уникод[2] (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков …   Википедия

  • UCS-4 — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UNICODE — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF-32LE — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF-32 Little Endian — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • UTF-7 — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»