Кодировка

Набор символов (англ. character set) — определённая таблица кодировки конечного множества знаков. Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько байтов.

Хотя термин «набор символов» (англ. character set, charset), узаконенный RFC 2278, сейчас является, пожалуй, наиболее авторитетным, предшествовавший ему термин «кодировка» (англ. encoding) по-прежнему используется в качестве синонима, в частности, в языках программирования [1], [2], [3] и [4].

Нередко также вместо термина «набор символов» неправильно употребляют термин «кодовая страница», означающий на самом деле частный случай набора символов с однобайтным кодированием.

В настоящее время в основном используются кодировки трёх типов: совместимые с EBCDIC и основанные на Юникоде 16-битные, с подавляющим преобладанием первых. Представление Юникода совместимо с ASCII. Кодировки на базе ДКОИ-8) используются только на некоторых мэйнфреймах. Первоначально в каждой операционной системе использовался один набор символов. Теперь используемые наборы символов [5], зависят от типа операционной системы лишь по традиции и устанавливаются согласно локали.

В Википедии и других проектах Фонда Викимедиа используется Юникод UTF-8.

Автоматическое распознавание кодировок

Использование множества кодировок в современном ПО создаёт много неудобств не только программистам, но и пользователям. Согласно одной точке зрения, справиться с крокозябрами можно, если программы будут автоматически распознавать кодировку входящего текста.

Для однобайтных кодировок можно учитывать тот факт, что частота использования разных букв сильно различается (например, в русском часто используется «о», но редко «ъ»). Поэтому, зная язык текста, можно легко выбрать кодировку, в которой частота байтов лучше соответствует частоте букв данного языка.

Альтернативная точка зрения считает подобные эвристические алгоритмы определения кодировки текста вредными, поскольку современные информационные технологии располагают средствами недвусмысленно сопоставить тексту положенную ему кодовую страницу (см., например, программ создания текстовых данных, нарушающих стандарты.

Распространенные кодировки

ISO 646

EBCDIC
ISO 8859:
- ISO 8859-1, ISO 8859-2, ISO 8859-3, ISO 8859-4, ISO 8859-5, ISO 8859-6, ISO 8859-7, ISO 8859-8, ISO 8859-9, ISO 8859-10, ISO 8859-11, ISO 8859-13, ISO 8859-14, ISO 8859-15
- CP850, CP852, CP866, CP869
Кодировки Microsoft Windows:

MacRoman, КОИ8 (KOI8-R, KOI8-U…), КОИ-7
Болгарская кодировка
ISCII
VISCII
Big5 (наиболее знаменитый вариант Microsoft CP950)
- GB2312
- GBK (Microsoft CP936)
- GB18030
Shift JIS для японского языка (Microsoft CP932)
EUC-KR для корейского языка (Microsoft CP949)
ISO-2022 и EUC для китайской письменности
Кодировки UTF-16 набора символов Юникод

Примечания

Кодировки символов
Основы →		алфавит • текст ( файл • данные ) • набор символов • конверсия
Исторические кодировки →		Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2	Комп.: 6 бит • УПП • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646
совре- менное 8-битное представ- ление	символы →	управляющие • печатные )	не-ASCII ( псевдографика )
	8бит. код.стр.	Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • ISO 8859 →		1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16
	Windows →	1251(кир.) 1252 WGL4
	IBM&DOS →	850 • 866 «альт.» ( МИК )
	Много- байтные	Традиционные →		GB2312 ) • HTML
Unicode →	Много- байтные	UTF-8 • список символов ( кириллица )
Связанные темы →	интерфейс пользователя • раскладки клавиатур • локаль • перевод строки • шрифт • крокозябры • транслит		Утилиты: recode

Wikimedia Foundation. 2010.

Игры ⚽ Поможем написать реферат

Синонимы:

зашифрование, зашифровка, зашифровывание, кодирование

Полезное

Смотреть что такое "Кодировка" в других словарях:

кодировка — и, ж. Действие по знач. гл. кодировать. Кодировка сведений для машинной обработки информации. МАС 2 … Исторический словарь галлицизмов русского языка
кодировка — КОДИРОВАТЬ, рую, руешь; анный; сов. и несов., что (спец.). Толковый словарь Ожегова. С.И. Ожегов, Н.Ю. Шведова. 1949 1992 … Толковый словарь Ожегова
кодировка — сущ., кол во синонимов: 4 • зашифрование (7) • зашифровка (8) • зашифровывание (7) … Словарь синонимов
кодировка шрифта — (Encoding) Упорядоченный комплект знаков шрифта [упорядоченное множество знаков определенной системы письма] (см. Кодовая страница). Кодировка зависит от операционной системы, для которой предназначен шрифт (MS Windows или Mac OS) и… … Шрифтовая терминология
кодировка кадра — Последовательность полей в CAN кадрах, например, для кадра данных: SOF, поле арбитража, контрольное поле, поле данных, поле CRC, поле подтверждения и EOF. Кодировка кадра также включает в себя бит стафинг. [http://can… … Справочник технического переводчика
Кодировка НИИ ЭВМ — «Кодировка НИИ ЭВМ» кодовая страница, основанная на CP437. Нижняя часть таблицы кодировки (латиница) полностью соответствует кодировке ASCII. В приведённой таблице числа под буквами обозначают шестнадцатеричный код буквы в Юникоде. .0 .1 .2 … Википедия
кодировка бит — В CAN биты кодируются без возврата к нулю (NRZ код). [http://can cia.com/fileadmin/cia/pdfs/CANdictionary v2 ru.pdf] Тематики сети вычислительные EN bit encoding … Справочник технического переводчика
Кодировка русского языка в компьютерных программах и в Интернете — – Все символы, которые могут отображаться на экране компьютера, описаны в таблице символов. В самой первой таблице символов не было русских букв. Для того работы с русскими буквами их надо было вписать в эту таблицу символов вместо ненужных… … Энциклопедический словарь СМИ
Кодировка символов — Набор символов (англ. character set) определённая таблица кодировки конечного множества знаков. Такая таблица сопоставляет каждому символу последовательность длиной в один или несколько байтов. Хотя термин «набор символов» (англ. character set,… … Википедия
Кодировка — ж. разг. 1. процесс действия по несов. гл. кодировать I, кодироваться I 2. Результат такого действия; кодирование I 2.. Толковый словарь Ефремовой. Т. Ф. Ефремова. 2000 … Современный толковый словарь русского языка Ефремовой

Словари и энциклопедии на Академике

Кодировка

Автоматическое распознавание кодировок

Распространенные кодировки

Примечания

Полезное

Смотреть что такое "Кодировка" в других словарях:

Поделиться ссылкой на выделенное

Словари и энциклопедии на Академике

Википедия

Кодировка

Автоматическое распознавание кодировок

Распространенные кодировки

Примечания

Полезное

Смотреть что такое "Кодировка" в других словарях:

Поделиться ссылкой на выделенное

Прямая ссылка: