Мера включения

Мера включения

Меры включения — несимметричные меры сходства отражающие степень близости одного объекта относительно другого. Использовать меры включения по отдельности не имеет смысла. Меры включения также известны как асимметричные меры, направленные меры конвергенции. Меры включения отражают отношения «целого-части». Также существует понятие мер невключения, которые определяются как дополнение мер включения до 1. Обычно меры включения представляют в виде матрицы включения

Следует особо отметить, что меры включения более информативны в общем и особенно для разновеликих по числу признаков объектов, чем меры сходства, так как последние, по сути, представляют собой усреднённые показатели и, следовательно, теряют часть информации об объектах, а несимметричные меры включения адекватно оценивают более распространённые в природе нетранзитивные отношения. Например, один список может включаться на 100 % в другой список, а другой список в свою очередь включаться только на 10 %. При этом коэффициент сходства не сможет адекватно отразить эти отношения, так как, например, 10 общих видов значительны для одного списка в 10 видов, но не столь значимы для большого списка в (к примеру) 100 видов. Мера сходства Сёренсена в данном случае будет равна около 20 %.[1][2]
В общем виде меры несимметричные меры сходства можно представить так: K_0 (A;B) = \frac{conv(A,B)}{S(B)}; K_0 (B;A) = \frac{conv(A,B)}{S(A)}. А конкретную меру включения можно рассчитать из общей формулы континуума мер сходства Сёмкина.

Содержание

Меры включения для конечных множеств

Подобные меры, под названием коэффициентов «полноты» и «точности» нашли широкое применение в информационно-поисковых системах[3][4]. Под названием «коэффициентов неспецифичности» одной флоры относительно другой использовались во флористике Б. А. Юрцевым[5][6]. После работ Б. И. Семкина и Т. А. Комаровой[7][8] меры включения стали широко использоваться в синэкологии и биогеографии[9].
Наиболее часто используются меры:

 K(A;B) = \frac{n(A \cap B)}{n(A)}; K(B;A) = \frac{n(A \cap B)}{n(B)}

Меры включения для дескриптивных множеств

Для случая дескриптивных множеств (дескриптивная интерпретация), в экологии это выборки по обилию, меры введены Б. И. Семкиным и Т. А. Комаровой. Например:

 K(A;B) = \frac{m(A \wedge B)}{n(A)} = { \sum_{i=1}^r min(A_i, B_i) \over \sum_{i=1}^r (A_i)};
 K(B;A) = \frac{m(A \wedge B)}{n(B)} = { \sum_{i=1}^r min(A_i, B_i) \over \sum_{i=1}^r (B_i)}.

Меры включения для вероятностей

Если сравнивается встречаемость видов (вероятностная интерпретация), то есть учитываются вероятности встреч объектов, то аналогом вышеприведённым мерам будут несимметричные меры (меры включения событий) Дайса (association index), предложенные Л. Р. Дайсом в 1945 году[10]:

 K(A;B) = \frac{h}{a} = \frac{P(A \cap B)}{P(A)}; K(B;A) = \frac{h}{b} = \frac{P(A \cap B)}{P(B)}

Меры Дайса, как и все меры включения событий, являются вероятностными мерами и по сути являются условными вероятностями.

Меры включения для информационной интерпретации

Для информационной аналитической интерпретации используются относительные меры односторонней зависимости.[11][12]

 K(A;B) = \frac{I(A,B)}{H(A)}; K(B;A) = \frac{I(A,B)}{H(B)}

См. также

Литература

  1. Сёмкин Б. И. О связи между средними значениями двух мер включения и мерами сходства // Бюлл. БСИ ДВО РАН [Электронный ресурс] : науч. журн. / Ботан. сад-институт ДВО РАН. — Владивосток, 2009. Вып. 3. С. 91-101.
  2. Сёмкин Б. И., Орешко А. П., Горшков М. В. Об использовании биоинформационных технологий в сравнительной флористике. II. Меры включения дескриптивных множеств и их использование // Бюлл. БСИ ДВО РАН [Электронный ресурс] : науч. журн. / БСИ ДВО РАН. — Владивосток, 2009. Вып. 4. С. 58-70.
  3. Clevardon C.W. The testing of index Language Devices // Aslib Proceedings. 1963. V. 15. № 4. P. 106—130.
  4. Сэлтон Г. А. Автоматическая обработка, хранение и поиск информации. — М.: Сов. радио, 1973. — 560 с.
  5. Юрцев Б. А. Флора Сунтар-Хаята. — Л.: Наука, 1968. — 235 с.
  6. Сёмкин Б. И. Количественные показатели для оценки односторонних флористических связей, предложенных Б. А. Юрцевым // Бот. ж. 2007. Т. 92. № 4. С. 114—127.
  7. Сёмкин Б. И., Комарова Т. А. Анализ фитоценотических описаний с использованием мер включения (на примере растительных сообществ долины реки Амгуэмы на Чукотке) // Бот. ж. 1977. Т. 62. № 1. С. 54-63.
  8. Сёмкин Б. И., Комарова Т. А. Использование мер включения при изучении вторичных сукцессий (на примере послепожарных сообществ Сихотэ-Алиня) // Бот. ж. 1985. Т. 70. № 1. С. 89-97.
  9. Андреев В. Л. Классификационные построения в экологии и систематике. — М.: Наука, 1980. — 142 с.
  10. Dice L.R. Measures of the amount of ecological association between species // Ecology. 1945. V. 26. № 3. P. 297—302.
  11. Nakahama H., Nishioka S. Statistical dependency between intervals in neuronal impulse sequences // J. Theoret. Biol. 1966. V. 12. № 1. P. 140—146.
  12. Nakahama H., Nishioka S., Otsuka T., Aikawa S. Statistical dependency between interspike intervals of spontaneous activity in thalamic lemniscal neurons // J. Neurophysiol. 1966. V. 29. № 5. P. 921—934.

Wikimedia Foundation. 2010.

Игры ⚽ Нужно сделать НИР?

Полезное


Смотреть что такое "Мера включения" в других словарях:

  • МЕРА — множества, обобщение понятия длины отрезка, площади фигуры, объема тела, интуитивно соответствующее массе множества при нек ром распределении массы по пространству. Понятие М. множества возникло в теории функций действительного переменного в… …   Математическая энциклопедия

  • защитная мера — 2.24 защитная мера (safeguard): Сложившаяся практика, процедура или механизм обработки риска. Примечание Следует заметить, что понятие «защитная мера» может считаться синонимом понятию «контроль» (см. 2.7). Источник …   Словарь-справочник терминов нормативно-технической документации

  • ГОСТ Р 51898-2002: Аспекты безопасности. Правила включения в стандарты — Терминология ГОСТ Р 51898 2002: Аспекты безопасности. Правила включения в стандарты оригинал документа: 3.10 анализ риска: Систематическое использование информации для выявления опасности и количественной оценки риска. Определения термина из… …   Словарь-справочник терминов нормативно-технической документации

  • ЛЕБЕГА МЕРА — в счетно аддитивная мера являющаяся продолжением объема как функции n мерных интервалов на более широкий класс множеств, измеримых по Лебегу. Класс содержит в себе класс борелевских множеств и состоит из множеств вида Не всякое подмножество Rn… …   Математическая энциклопедия

  • Коэффициент сходства — (также мера сходства, индекс сходства) безразмерный показатель, применяемый в биологии для количественного определения степени сходства биологических объектов. Также известен под названиями: мера ассоциации, мера подобия и др. более редкие… …   Википедия

  • риск — 2.19 риск (risk): Потенциальная опасность нанесения ущерба организации в результате реализации некоторой угрозы с использованием уязвимостей актива или группы активов. Примечание Определяется как сочетание вероятности события и его последствий.… …   Словарь-справочник терминов нормативно-технической документации

  • ГОСТ Р ИСО/ТС 14798-2003: Лифты, эскалаторы и пассажирские конвейеры. Методология анализа риска — Терминология ГОСТ Р ИСО/ТС 14798 2003: Лифты, эскалаторы и пассажирские конвейеры. Методология анализа риска: 3.18 анализ риска: Систематическое использование информации для выявления опасности и количественной оценки риска (ГОСТ Р 51898).… …   Словарь-справочник терминов нормативно-технической документации

  • Матрица мер конвергенции — матрица содержащая в качестве элементов меры сходства объектов. Матрица отражает попарное сходство объектов. Сходство является показателем, измеренном в порядковой шкале и, следовательно, возможно лишь определение отношений вида: больше , меньше… …   Википедия

  • устройство — 2.5 устройство: Элемент или блок элементов, который выполняет одну или более функцию. Источник: ГОСТ Р 52388 2005: Мототранспортны …   Словарь-справочник терминов нормативно-технической документации

  • ГОСТ Р МЭК 60204-1-2007: Безопасность машин. Электрооборудование машин и механизмов. Часть 1. Общие требования — Терминология ГОСТ Р МЭК 60204 1 2007: Безопасность машин. Электрооборудование машин и механизмов. Часть 1. Общие требования оригинал документа: TN систем питания Испытания по методу 1 в соответствии с 18.2.2 могут быть проведены для каждой цепи… …   Словарь-справочник терминов нормативно-технической документации


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»