- Критерий знаков
-
В математической статистике критерий знаков используется при проверке нулевой гипотезы о равенстве медиан двух непрерывно распределенных случайных величин. Критерий применяется к паре связных выборок. Это непараметрический критерий, то есть он не использует никаких данных о характере распределения, и может применяться в широком спектре ситуаций, однако при этом он может иметь меньшую мощность, чем более специализированные критерии.
Описание метода
Рассмотрим две непрерывно распределенные случайные величины X и Y, и пусть нулевая гипотеза выполняется, то есть их медианы равны. Тогда
. Иными словами, каждая из случайных величин равновероятно больше другой.
Рассмотрим пару связных выборок
. Будем считать, что в выборке нет элементов, для которых
(иначе уберем эти элементы из выборки). Построим статистику w, равную числу элементов в выборке, при которых
. При выполнении нулевой гипотезы, эта величина имеет биномиальное распределение:
.
Для применения критерия необходимо вычислить «левый хвост» биномиального распределения до w:
. Согласно критерию, при уровне значимости
:
- против двусторонней альтернативной гипотезы
-
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
-
- если
, то нулевая гипотеза отвергается;
- если
- против альтернативы
-
- если
, то нулевая гипотеза отвергается;
- если
Пример задачи
Первая выборка — это значения некоторой характеристики состояния пациентов, записанные до лечения. Вторая выборка — это значения той же характеристики состояния тех же пациентов, записанные после лечения.
Порядок элементов (в данном случае пациентов) в выборках и объёмы выборок обязаны совпадать. Такие выборки и называются связными.
Требуется выяснить, является ли лечение эффективным, то есть имеется ли значимое отличие в состоянии пациентов до и после лечения, или различия чисто случайны.
Заданы две выборки одинаковой длины
.
Дополнительные предположения:
- обе выборки простые;
- выборки связные, то есть элементы
соответствуют одному и тому же объекту, но измерения сделаны в разные моменты (например, до и после обработки).
Нулевая гипотеза
.
Если в выборке имеются случаи
, то их следует исключить из выборки, уменьшив число наблюдений. Статистика критерия — это число w элементов в выборке, при которых
.
Ссылки
- Критерий знаков // MachineLearning.ru.
Категории:- Статистические критерии
- Непараметрические статистические критерии
- против двусторонней альтернативной гипотезы
Wikimedia Foundation. 2010.