Компрессор данных

Компрессор данных

Сжатие без потерь (англ. Lossless data compression) — метод сжатия информации, при использовании которого закодированная информация может быть восстановлена с точностью до бита. При этом оригинальные данные полностью восстанавливаются из сжатого состояния. Этот тип сжатия принципиально отличается от сжатия данных с потерями. Для каждого из типов цифровой информации, как правило, существуют свои оптимальные алгоритмы сжатия без потерь.

Сжатие данных без потерь используется во многих приложениях. Например, оно используется в популярном файловом формате Gzip. Оно также используется как компонент в сжатии с потерями.

Сжатие без потерь используется, когда важна идентичность сжатых данных оригиналу. Обычный пример — исполняемые файлы и исходный код. Некоторые графические файловые форматы, такие как PNG или TIFF,

Содержание

Техника сжатия без потерь

Из комбинаторики следует, что нет алгоритма сжатия без потерь, способного уменьшить хотя бы на байт любой файл. Впрочем, признак качества алгоритма сжатия не в этом — алгоритм должен эффективно работать на тех данных, на которые он рассчитан.

Многоцелевые алгоритмы сжатия отличаются тем, что способны уменьшать широкий диапазон данных — исполняемые файлы, файлы данных, тексты, графику и т. д., и применяются в архиваторах. Специализированные же алгоритмы рассчитаны на некоторый тип файлов (текст, графику, звук и т. д.), зато сжимают такие файлы намного сильнее. Например: архиваторы сжимают звук примерно на треть (в 1,5 раза), в то время как

Большинство алгоритмов сжатия без потерь работают в две стадии: на первой генерируется статистическая модель для входящих данных, вторая отображает входящие данные в битовом представлении, используя модель для получения «вероятностных» (то есть часто встречаемых) данных, которые используются чаще, чем «невероятностные».

Статистические модели алгоритмов для текста (или текстовых бинарных данных, таких как исполняемые файлы) включают:

Алгоритмы кодирования через генерирование битовых последовательностей:

Методы сжатия без потерь

Полный список смотрите в Категория:Сжатие данных

Многоцелевые

  • Кодирование длин серий — простая схема, дающая хорошее сжатие данных, которые содержат много повторяющихся значений
  • LZW — используется в gif и во многих других.
  • Deflate — используется в gzip, усовершенствованной версии zip и как часть процесса сжатия PNG.
  • 7-zip.

Сжатие аудио

Сжатие графики

  • ABO — Adaptive Binary Optimization
  • GIF — (без потерь только для изображений содержащих менее 256 цветов)
  • JPEG 2000 — (включает сжатие без потерь; также, испытан Sunil Kumar, профессором университета штата Сан-Диего)
  • PGF — Progressive Graphics File (сжатие с/без потерь)
  • PNG — Portable Network Graphics
  • Qbit Lossless Codec — фокусируется на intra-frame («одна картинка») сжатии без потерь

Сжатие видео

Сжатие текстов

  • PPM — архиватор HA (автор Harry Hirvola), использующий алгоритм PPM, известен высокой степенью сжатия на текстовых файлах; по этому параметру он превосходит даже

Примеры алгоритмов

  • Семейство алгоритмов RLE (Run-length encoding — Кодирование длин серий)

Примеры форматов и их реализаций


Wikimedia Foundation. 2010.

Игры ⚽ Нужен реферат?

Полезное


Смотреть что такое "Компрессор данных" в других словарях:

  • компрессор сигнала электросвязи — компрессор Устройство, предназначенное для осуществления заданного закона компрессии сигнала электросвязи. [ГОСТ 22670 77] Тематики сети передачи данных Синонимы компрессор EN compressor …   Справочник технического переводчика

  • компрессор — 3.1 компрессор: Машина для сжатия воздуха. Источник …   Словарь-справочник терминов нормативно-технической документации

  • Компрессор объемного действия — 39. Компрессор объемного действия D. Verdrängerverdichfer Е. Displacement compressor Компрессор, в котором рабочий процесс осуществляется в результате циклического изменения объемов рабочих камер Источник: ГОСТ 28567 90: Компрессоры. Термины и… …   Словарь-справочник терминов нормативно-технической документации

  • Компрессор —         устройство для сжатия и подачи воздуха или другого газа под давлением. Степень повышения давления в К. более 3. Для подачи воздуха с повышением его давления менее чем в 2 3 раза применяют воздуходувки (См. Воздуходувка), а при напорах до… …   Большая советская энциклопедия

  • ГОСТ Р 54381-2011: Компрессоры холодильные. Условия испытаний по определению основных характеристик, допуски и представление данных производителями — Терминология ГОСТ Р 54381 2011: Компрессоры холодильные. Условия испытаний по определению основных характеристик, допуски и представление данных производителями оригинал документа: 3.1 компрессор объемного действия (positive displacement… …   Словарь-справочник терминов нормативно-технической документации

  • Сжатие данных — Возможно, эта статья содержит оригинальное исследование. Добавьте ссылки на источники, в противном случае она может быть выставлена на удаление. Дополнительные сведения могут быть на странице обсуждения. (26 мая 2012) …   Википедия

  • OpenSUSE — KDE 4.3 в openSUSE 11.2 Р …   Википедия

  • openSUSE — KDE 4.7 в openSUSE 12.1 Разработчик Novell, Inc. Семейство ОС …   Википедия

  • ГОСТ 23851-79: Двигатели газотурбинные авиационные. Термины и определения — Терминология ГОСТ 23851 79: Двигатели газотурбинные авиационные. Термины и определения оригинал документа: 293. Аварийное выключение ГТД Аварийное выключение Ндп. Аварийное отключение ГТД D. Notausschaltung Е. Emergency shutdown F. Arrêt urgent… …   Словарь-справочник терминов нормативно-технической документации

  • Toshiba — (Тошиба) Компания Toshiba, её история и деятельность. Прибыль и показатели компании Toshiba. Представительство Toshiba в России. Содержание Раздел 1. История Раздел 1.1. Рост мирового гиганта Раздел 2. Деятельность фирмы Раздел 2.1. Показатели… …   Энциклопедия инвестора


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»