PPM

PPM

PPM

PPM (англ. Prediction by Partial Matching — предсказание по частичному совпадению) — адаптивный статистический алгоритм сжатия данных без потерь, основанный на контекстном моделировании и предсказании. Модель PPM использует контекст — множество символов в несжатом потоке, предшествующих данному, чтобы предсказывать значение символа на основе статистических данных. Сама модель PPM лишь предсказывает значение символа, непосредственное сжатие осуществляется алгоритмами энтропийного кодирования, как например, алгоритм Хаффмана, арифметическое кодирование.

Длина контекста, который используется при предсказании обычно сильно ограничена. Эта длина обозначается n и определяет порядок модели PPM, что обозначается как PPM(n). Неограниченные модели так же существуют и обозначаются просто PPM*. Если предсказание символа по контексту из n символов не может быть произведено, то происходит попытка предсказать его с помощью n-1 символов. Рекурсивный переход к моделям с меньшим порядком происходит пока предсказание не произойдёт в одной из моделей, либо когда контекст станет нулевой длины (n=0). Модели степени 0 и −1 следует описать особо. Модель нулевого поpядка эквивалента случаю контекстно-свободного моделиpования, когда веpоятность символа опpеделяется исключительно из частоты его появления в сжимаемом потоке данных. Подобная модель обычно пpименяется вместе с кодиpованием по Хаффману. Модель поpядка −1 пpедставляют собой статическую модель, пpисваивающую веpоятности символа опpеделенное фиксиpованное значение; обычно все символы, котоpые могут встpетиться в сжимаемом потоке данных, пpи этом считаются pавновеpоятными. Для получения хоpошей оценки веpоятности символа необходимо учитывать контексты pазных длин. PPM пpедставляет собой ваpиант стpатегии пеpемешивания, когда оценки веpоятностей, сделанные на основании контекстов pазных длин, объединяются в одну общую веpоятность. Полученная оценка кодиpуется любым энтpопийным кодеpом (ЭК), обычно это некая pазновидность аpифметического кодеpа. На этапе энтpопийного кодиpования и пpоисходит собственно сжатие.

Большое значение для алгоритма PPM имеет проблема обработки новых символов, ещё не встречавшихся во входном потоке. Это проблема носит название проблема нулевой частоты. Некоторые варианты реализаций PPM полагают счётчик нового символа равным фиксированной величине, например, единице. Другие реализации, как например, PPM-D, увеличивают псевдосчётчик нового символа каждый раз, когда, действительно, в потоке появляется новый символ. (Другими словами, PPM-D оценивает вероятность появления нового символа как отношение числа уникальных символов к общему числу используемых символов).

Опубликованные исследование алгоритмов семейства PPM появились в середине 1980-х годов. Программные реализации не были популярны до 1990-х годов, потому как модели PPM требуют значительное количество оперативной памяти. Современные реализации PPM являются лучшими среди алгоритмов сжатия без потерь для текстов на естественном языке.

Практическое использование

Варианты алгоритма PPM на данный момент широко используются, главным образом для компрессии избыточной информации и текстовых данных. Следующие архиваторы используют PPM[1]:

  • boa, основан на PPMz (Ian Sutton)
  • HA, PPM order 4, оригинальный метод оценки вероятности ухода (Harry Hirvola)
  • lgha, основан на коде архиватора ha (Юрий Ляпко)
  • ppmpacktc, основан на коде PPMd, PPMz, PPMVC и коде HA с реализацией hsc (Александр Мясников)
  • arhangel, основан на алгоритмах ha с добавлением набора фильтров для различных данных (Юрий Ляпко)
  • PPMd — реализация PPM order-2..16, применяется наследование информации (Дмитрий Шкарин)
  • ppmz — реализован метод Z (Charles Bloom)
  • rk — реализация PPMz с набором фильтров (Malcolm Taylor)
  • rkuc — PPM с порядками 16-12-8-5-3-2-1-0 (Malcolm Taylor)
  • rkive (Malcolm Taylor)
  • x1 — реализация LZP и PPM (Stig Valentini)
  • RAR — реализация варианта PPMd
  • 7-Zip — реализация варианта PPMd
  • WinZip (версии 10 и выше) — реализация варианта PPMd

Примечания


Wikimedia Foundation. 2010.

Игры ⚽ Поможем сделать НИР

Полезное


Смотреть что такое "PPM" в других словарях:

  • ppm — 〈Abk. für engl.〉 part per million, gibt an, dass auf eine Million Teilchen einer Sorte ein Teilchen einer anderen Sorte kommt * * * ppm ↑ pp Einheiten. * * * I ppm   [Abk. für Parts per Million, dt. »Teile pro Million«], Mengenangaben …   Universal-Lexikon

  • Ppm — ppm, PPM: Миллионная доля (ppm, от англ. parts per million  частей на миллион)  единица измерения концентрации. ppm (англ. pages per minute)  единица измерения скорости работы принтеров и сканеров. PPM  формат… …   Википедия

  • ppm — parts per million; a measurement showing how much of a particular substance something contains: • employees exposed to formaldehyde concentrations of 1 ppm or more * * * ppm UK US noun [plural] MEASURES ► ABBREVIATION FOR parts per million: the… …   Financial and business terms

  • PPM — (PPM, ppm) Proporción de la concentración de una sustancia con respecto a la concentración de otra, como una unidad de soluto disuelta en un millón de unidades de disolvente. Se puede expresar también en términos de peso peso, volumen volumen o… …   Diccionario médico

  • PPM — may refer to:* In music: ** Please Please Me , the first album by The Beatles. * In computing: **Perl package manager, a packaging system for distributing precompiled modules for use with the Activestate binary distribution of the Perl… …   Wikipedia

  • PPM — puede referir a: Partes por millón, unidad de medida. Páginas por minuto, referido a la velocidad de impresión Pulsaciones por minuto, unidad utilizada para expresar la velocidad de una pieza en música Partido Popular Monárquico, Portugal… …   Wikipedia Español

  • ppm — Abreviatura de partes por millón. Diccionario Mosby Medicina, Enfermería y Ciencias de la Salud, Ediciones Hancourt, S.A. 1999 …   Diccionario médico

  • PPM — ● PPM Abréviation de l anglais part per million (partie par million), désignant une concentration d une substance égale à 10−6, soit un millionième …   Encyclopédie Universelle

  • ppm — simb. TS chim. parts per million, parti per milione …   Dizionario italiano

  • ppm — 〈Physik; Abk. für engl.〉 part per million, gibt an, dass auf eine Million Teilchen einer Sorte ein Teilchen einer anderen Sorte kommt …   Lexikalische Deutsches Wörterbuch


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»