- КОИ-8
-
КОИ-8 (код обмена информацией, 8 битов), KOI8 — восьмибитовая ASCII-совместимая кодовая страница, разработанная для кодирования букв кириллических алфавитов.
Существует также семибитовая версия кодировки, не полностью совместимая с ASCII — КОИ-7. КОИ-7 и КОИ-8 описаны в ныне не действующем ГОСТ 19768-74.
Разработчики КОИ-8 поместили символы русского алфавита в верхней части кодовой таблицы таким образом, что позиции кириллических символов соответствуют их фонетическим аналогам в английском алфавите в нижней части таблицы. Это означает, что если в тексте, написанном в КОИ-8, убирать восьмой бит каждого символа, то получается «читаемый» текст, подобный транслиту. Например, слова «Русский Текст» превратились бы в «rUSSKIJ tEKST». Как побочное следствие, символы кириллицы оказались расположены не в алфавитном порядке.
Существует несколько вариантов кодировки КОИ-8 для различных кириллических алфавитов, расширяющие определённые коды (общий диапазон 192—255 с 32 русскими буквами в двух регистрах остаётся неизменным во всех вариантах). Русский алфавит описывается в кодировке KOI8-R, украинский — в KOI8-U.
KOI8-R стал фактически стандартом для русской кириллицы в 1990-х годах в юникс-подобных операционных системах и электронной почте. Автор данной кодировки (RFC1489), которая стала первой русской стандартизированной кодировкой в интернете — Андрей Чернов, в начале 1990-х годов работал в компании Демос (сеть Релком) и непосредственно участвовал в запуске и наладке первого интернет-канала между Россией и западными странами.
IETF утвердил несколько RFC по вариантам кодировки KOI-8:
- RFC1489 — KOI8-R;
- RFC2319 — KOI8-U;
- RFC1345 — ISO-IR-111 (с ошибкой в определении основного диапазона).
IANA зарегистрировала их в своём списке.
Стандарт RFC 1489 предписывает наличие графических символов «рамок» (псевдографики), однако это требование выполняется довольно редко.
В Microsoft Windows KOI8-R присвоен код страницы 20866, KOI8-U — 21866.
Начало таблицы кодировки (латиница) полностью соответствует кодировке ASCII.
В приведённых таблицах числа под буквами обозначают шестнадцатеричный код буквы в Юникоде.
Содержание
Кодировка KOI8-R (русская)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
─
2500│
2502┌
250C┐
2510└
2514┘
2518├
251C┤
2524┬
252C┴
2534┼
253C▀
2580▄
2584█
2588▌
258C▐
2590
9.
░
2591▒
2592▓
2593⌠
2320■
25A0∙
2219√
221A≈
2248≤
2264≥
2265
A0⌡
2321°
B0²
B2·
B7÷
F7
A.
═
2550║
2551╒
2552ё
451╓
2553╔
2554╕
2555╖
2556╗
2557╘
2558╙
2559╚
255A╛
255B╜
255C╝
255D╞
255E
B.
╟
255F╠
2560╡
2561Ё
401╢
2562╣
2563╤
2564╥
2565╦
2566╧
2567╨
2568╩
2569╪
256A╫
256B╬
256C©
A9
C.
ю
44Eа
430б
431ц
446д
434е
435ф
444г
433х
445и
438й
439к
43Aл
43Bм
43Cн
43Dо
43E
D.
п
43Fя
44Fр
440с
441т
442у
443ж
436в
432ь
44Cы
44Bз
437ш
448э
44Dщ
449ч
447ъ
44A
E.
Ю
42EА
410Б
411Ц
426Д
414Е
415Ф
424Г
413Х
425И
418Й
419К
41AЛ
41BМ
41CН
41DО
41E
F.
П
41FЯ
42FР
420С
421Т
422У
423Ж
416В
412Ь
42CЫ
42BЗ
417Ш
428Э
42DЩ
429Ч
427Ъ
42AДругие варианты
Показаны только не совпадающие строки таблиц, поскольку всё остальное совпадает.
Кодировка KOI8-U (русско-украинская)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A.
═
2550║
2551╒
2552ё
451є
454╔
2554і
456ї
457╗
2557╘
2558╙
2559╚
255A╛
255Bґ
491╝
255D╞
255E
B.
╟
255F╠
2560╡
2561Ё
401Є
404╣
2563І
406Ї
407╦
2566╧
2567╨
2568╩
2569╪
256AҐ
490╬
256C©
A9Кодировка KOI8-RU (русско-белорусско-украинская)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A.
═
2550║
2551╒
2552ё
451є
454╔
2554і
456ї
457╗
2557╘
2558╙
2559╚
255A╛
255Bґ
491ў
45E╞
255E
B.
╟
255F╠
2560╡
2561Ё
401Є
404╣
2563І
406Ї
407╦
2566╧
2567╨
2568╩
2569╪
256AҐ
490Ў
40E©
A9Кодировка KOI8-C (кавказская)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F 8. ғ
493җ
497қ
49Bҝ
49Dң
4A3ү
4AFұ
4B1ҳ
4B3ҷ
4B7ҹ
4B9һ
4BB▀
2580ҝ
49Dӣ
4E3ө
4E9ӯ
4EF9. Ғ
492Җ
496Қ
49AҜ
49CҢ
4A2Ү
4AEҰ
4B0Ҳ
4B2Ҷ
4B6Ҹ
4B8Һ
4BA⌡
2321Ә
4D8Ӣ
4E2Ө
4E8Ӯ
4EEA.
A0ђ
452ѓ
453ё
451є
454ѕ
455і
456ї
457ј
458љ
459њ
45Aћ
45Bќ
45Cґ
491ў
45Eџ
45FB. №
2116Ђ
402Ѓ
403Ё
401Є
404Ѕ
405І
406Ї
407Ј
408Љ
409Њ
40AЋ
40BЌ
40CҐ
490Ў
40EЏ
40FКодировка KOI8-T (таджикская)
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F 8. қ
49Bғ
493‚
201AҒ
492„
201E…
2026†
2020‡
2021‰
2030ҳ
4B3‹
2039Ҳ
4B2ҷ
4B7Ҷ
4B69. Қ
49A‘
2018’
2019“
201C”
201D•
2022–
2013—
2014™
2122›
203AA. ӯ
4EFӮ
4EEё
451¤
A4ӣ
4E3¦
A6§
A7«
AB¬
AC
AD®
AEB. °
B0±
B1²
B2Ё
401Ӣ
4E2¶
B6·
B7№
2116»
BB©
A9Кодировка KOI8-O, KOI8-C (славянская, старая орфография)
0407
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
Ђ
0402Ѓ
0403¸
00B8ѓ
0453„
201E…
2026†
2020§
00A7€
20AC¨
00A8Љ
0409‹
2039Њ
040AЌ
040CЋ
040BЏ
040F
9.
ђ
0452‘
2018’
2019“
201C”
201D•
2022–
2013—
2014£
00A3·
00B7љ
0459›
203Aњ
045Aќ
045Cћ
045Bџ
045F
A.
00A0ѵ
0475ѣ
0463ё
0451є
0454ѕ
0455і
0456ї
0457ј
0458®
00AE™
2122«
00ABѳ
0473ґ
0491ў
045E´
00B4
B.
°
00B0Ѵ
0474Ѣ
0462Ё
0401Є
0404Ѕ
0405І
0406Ї
0407Ј
0408№
2116¢
00A2»
00BBѲ
0472Ґ
0490Ў
040E©
00A9Кодировка ISO-IR-111, KOI8-E
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
A.
00A0ђ
0452ѓ
0453ё
0451є
0454ѕ
0455і
0456ї
0457ј
0458љ
0459њ
045Aћ
045Bќ
045C
00ADў
045Eџ
045F
B.
№
2116Ђ
0402Ѓ
0403Ё
0401Є
0404Ѕ
0405І
0406Ї
0407Ј
0408Љ
0409Њ
040AЋ
040BЌ
040C¤
00A4Ў
040EЏ
040FКодировка KOI8-Unified, KOI8-F
Является предложением компании Fingertip Software[1]
.0 .1 .2 .3 .4 .5 .6 .7 .8 .9 .A .B .C .D .E .F
8.
─
2500│
2502┌
250C┐
2510└
2514┘
2518├
251C┤
2524┬
252C┴
2534┼
253C▀
2580▄
2584█
2588▌
258C▐
2590
9.
░
2591‘
2018’
2019“
201C”
201D•
2022–
2013—
2014©
00A9™
2122
00A0»
00BB®
00AE«
00AB·
00B7¤
00A4
A.
00A0ђ
0452ѓ
0453ё
0451є
0454ѕ
0455і
0456ї
0457ј
0458љ
0459њ
045Aћ
045Bќ
045Cґ
0491ў
045Eџ
045F
B.
№
2116Ђ
0402Ѓ
0403Ё
0401Є
0404Ѕ
0405І
0406Ї
0407Ј
0408Љ
0409Њ
040AЋ
040BЌ
040CҐ
0490Ў
040EЏ
040FНекириллические варианты КОИ-8
В некоторых странах СЭВ были созданы модификации КОИ-8 для национальных вариантов латиницы. Базовая идея была та же самая — при «срезании» восьмого бита текст должен оставаться более или менее понятным. Например, в чешском варианте КОИ-8 (ČSN 369103) буквы Čč должны превращаться в cC, Žž — в zZ и т. д. В настоящее время эти кодировки используются в 1C.
Примечания
- ↑ KOI8 Unified // Fingertip Software site
Ссылки
Кодировки символов Основы → алфавит • текст ( файл • данные ) • набор символов • конверсия Исторические кодировки → Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2 Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646 совре-
менное
8-битное
представ-
лениесимволы → ASCII ( управляющие • печатные ) не-ASCII ( псевдографика ) 8бит. код.стр. Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16 Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4 IBM&DOS → 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ ) Много-
байтныеТрадиционные → DBCS ( GB2312 ) • HTML Unicode → UTF-16 • UTF-8 • список символов ( кириллица ) Связанные
темы →интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение Утилиты: iconv • recode Категории:- Кодировки кириллицы
- ГОСТ
Wikimedia Foundation. 2010.