- recode
-
recode Тип перекодировка текста
Разработчик Франсуа Пинар (François Pinard)
Операционная система UNIX‐подобные
Последняя версия 3.6 (2001)
Лицензия recode, Free Recode — утилита для преобразования текста. Предназначена главным образом для перевода текстовых файлов в другую кодировку, может при этом также изменять формат переводов строки. Поставляется со многими системами на основе Linux. В настоящее время поддержка данной программы, по‐видимому, прекращена.
Особенности
Не использует обычные библиотеки преобразования текста, а основан на собственной логике. В отличие от таких утилит (и библиотек) как iconv, recode умеет преобразовывать символы, точный эквивалент которых в выходном наборе символов отсутствует.
Синтаксис
Параметры перекодировки указываются как
recode входная_кодировка..выходная_кодировка
Если указано имя файла (или несколько имён), то файл(ы) подвергаются перекодировке. Если имя файла не указано, то читается стандартный ввод, а результат записывается на стандартный вывод.
Примеры
Изменяет кодировку списка файлов из UTF-8 (Linux) в CP1251 (Windows), корректирует перевод строки
find * | recode UTF-8..CP1251/CR-LF > list.txt
Дамп
Если вместо имени выходной кодировки задать слово dump, то выводится список всех поданных на вход символов, по одному на каждой строке. Для каждого символа указывается код в Unicode, двухбуквенная мнемоника (если существует) и название символа.
Ссылки
- Официальная страница recode (англ.) на сайте GNU
- recode (1) (англ.)
- RFC 1345: Character Mnemonics & Character Sets
Кодировки символов Основы → алфавит • текст ( файл • данные ) • набор символов • конверсия Исторические кодировки → Докомп.: семафорная (Макарова) • Морзе • Бодо • МТК-2 Комп.: 6 бит • УПП • RADIX-50 • EBCDIC ( ДКОИ-8 ) • КОИ-7 • ISO 646 совре-
менное
8-битное
представ-
лениесимволы → ASCII ( управляющие • печатные ) не-ASCII ( псевдографика ) 8бит. код.стр. Разные → Кириллица: КОИ-8 • ГОСТ 19768-87 • MacCyrillic ISO 8859 → 1(лат.) 2 3 4 5(кир.) 6 7 8 9 10 11 12 13 14 15(€) 16 Windows → 1250 1251(кир.) 1252 1253 1254 1255 1256 1257 1258 | WGL4 IBM&DOS → 437 • 850 • 852 • 855 • 866 «альт.» • ( МИК ) • ( НИИ ЭВМ ) Много-
байтныеТрадиционные → DBCS ( GB2312 ) • HTML Unicode → UTF-16 • UTF-8 • список символов ( кириллица ) Связанные
темы →интерфейс пользователя • раскладка клавиатуры • локаль • перевод строки • шрифт • кракозябры • транслит • нестандартные шрифты • текст как изображение Утилиты: iconv • recode Категории:- Программное обеспечение по алфавиту
- Преобразователи текста
Wikimedia Foundation. 2010.