Критерий Краскела

Критерий Краскела

Критерий Краскела — Уоллиса предназначен для проверки равенства медиан нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона — Манна — Уитни. Критерий Краскела — Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному преобразованию шкалы измерения.

Известен также под названиями: H-критерий Краскела — Уоллиса, односторонний дисперсионный анализ Краскела — Уоллиса (англ. Kruskal — Wallis one-way analysis of variance), тест Крускала — Уоллиса (англ. Kruskal — Wallis test).

Содержание

Примеры задач

Проходит чемпионат мира по футболу. Первая выборка — опрос болельщиков с вопросом «Каковы шансы на победу сборной России?» до начала чемпионата. Вторая выборка —- после первой игры, третья — после второго матча и т. д. Значения в выборках — шансы России на победу по десятибальной шкале (1 —- «никаких перспектив», 10 — «отвезти в Россию кубок —- дело времени»). Требуется проверить, зависят ли результаты опросов от хода чемпионата.

Описание критерия

Заданы k выборок:

x_1^{n_1}=\{x_{11},\;\ldots,\;x_{1n_1}\},\;\ldots,\;x_k^{n_k}=\{x_{k1},\;\ldots,\;x_{kn_k}\}.

Объединённая выборка будет иметь вид:

x=x_1^{n_1}\cup x_2^{n_2}\cup\ldots\cup x_k^{n_k}.

Дополнительные предположения:

  1. обе выборки простые, объединённая выборка независима;
  2. выборки взяты из неизвестных непрерывных распределений F_1(x),\;\ldots,\;F_k(x).

Проверяется нулевая гипотеза H_0\colon F_1(x)=\ldots=F_k(x) при альтернативе H_1\colon F_1(x)=F_2(x-\Delta_1)=\ldots=F_k(x-\Delta_{k-1}).

Упорядочим все N=\sum_{i=1}^k n_i элементов выборок по возрастанию и обозначим R_{ij} ранг j-го элемента i-й выборки в полученном вариационном ряду.

Статистика критерия Краскела — Уоллиса для проверки гипотезы о наличии сдвига в параметрах положения двух сравниваемых выборок имеет вид:

H=\sum_{i=1}^k\left(1-\frac{n_i}{N}\right)\left\{\frac{\bar{R}_i-\dfrac{N+1}{2}}{\sqrt{\dfrac{(N-n_i)(N+1)}{12n_i}}}\right\}^2 = \frac{12}{N(N+1)}\sum_{i=1}^k\left(\bar{R}_i-\frac{N+1}{2}\right)^2 =
 =\frac{12}{N(N+1)}\sum_{i=1}^k\frac{R_i^2}{n_i}-3(N+1),

где

R_i=\sum_{j=1}^k R_{ij};
\bar{R}_i=\frac{1}{n_i}R_i.

Гипотеза сдвига отклоняется на уровне значимости \alpha, если H\geqslant H_\alpha, где H_\alpha — критическое значение, при k\leqslant 5 и n_i\leqslant 8 вычисляемое по таблицам. При бо́льших значениях применимы различные аппроксимации.

Аппроксимация Краскела — Уоллиса

Пусть

M=\frac{N^3-\displaystyle{\sum_{i=1}^k n_i^3}}{N(N+1)};
\nu_1=(k-1)\frac{(k-1)(M-k+1)-V}{\dfrac{1}{2}MV};
\nu_2=\frac{M-k+1}{k-1}\nu_1;
V=2(k-1)-\frac{2\left\{3k^2-6k+N(2k^2-6k+1)\right\}}{5N(N+1)}-\frac{6}{5}\sum_{i=1}^k\frac{1}{n_i}.

Тогда статистика F=\frac{H(M-k+1)}{(k-1)(M-H)} будет иметь при отсутствии сдвига F-распределение с \nu_1 и \nu_2 степенями свободы. Таким образом, нулевая гипотеза отклоняется на уровне значимости \alpha, если F>F_{\alpha}(\nu_1,\;\nu_2).

Аппроксимация Имана — Давенпорта

В соответстви с ней нулевая гипотеза сдвига отклоняется с достоверностью \alpha, если J\geqslant J_\alpha, где J=\frac{H}{2}\left(1+\frac{N-k}{N-1-H}\right); J_\alpha=\left\{(k-1)F_\alpha(k-1;\;N-l)+\chi_\alpha^2(k-1)\right\}, F_\alpha(f_1;\;f_2) и \chi_\alpha^2(a) — соответственно критические значения статистик Фишера и хи-квадрат с соответствующими степенями свободы.

Это более точная аппроксимация, чем аппроксимация Краскела — Уоллиса. При наличии связанных рангов (то есть когда совпадают значения величин из разных выборок и им присваиваются одинаковые средние ранги) необходимо использовать модифицированную статистику H^*=H\left\{1-\left(\sum_{j=1}^q \frac{T_j}{N^3-N} \right) \right\} ^{-1}, где T_j=t_j^3-t_j; t_j — размер j-й группы одинаковых элементов; q — количество групп одинаковых элементов. При n_i\geqslant 20 справедлива аппроксимация распределения статистики H; \chi^2-распределением с f=k-1 степенями свободы, то есть нулевая гипотеза отклоняется, если H\geqslant\chi_\alpha^2(k-1).

См. также

Литература

  • Kruskal W. H., Wallis W. A. Use of ranks in one-criterion variance analysis. // Journal of the American Statistical Association. — 1952, 47 № 260. — Pp. 583—621.
  • Ликеш И., Ляга Й. Основные таблицы математической статистики. — М.: Финансы и статистика, 1985.
  • Кобзарь А. И. Прикладная математическая статистика. — М.: Физматлит, 2006. — 466—468 с.

Ссылки

Столбчатая диаграмма · Совмещённая диаграмма · Диаграмма управления · Лесная диаграмма · Гистограмма · Q-Q диаграмма · Диаграмма выполнения · Диаграмма разброса · Стебель-листья · Ящик с усами

Wikimedia Foundation. 2010.

Игры ⚽ Нужна курсовая?

Полезное


Смотреть что такое "Критерий Краскела" в других словарях:

  • Критерий Краскела — Уоллиса — предназначен для проверки равенства средних нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному …   Википедия

  • Критерий Краскела-Уоллиса — предназначен для проверки равенства средних нескольких выборок. Данный критерий является многомерным обобщением критерия Уилкоксона Манна Уитни. Критерий Краскела Уоллиса является ранговым, поэтому он инвариантен по отношению к любому монотонному …   Википедия

  • Критерий Кохрена — Критерий Кохрена  используют при сравнении трёх и более выборок одинакового объёма . Расхождение между дисперсиями считается случайным при выбранном уровне значимости , если: где   квантиль случайной величины при числе суммируемых… …   Википедия

  • Критерий согласия Колмогорова — или Критерий согласия Колмогорова Смирнова  статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… …   Википедия

  • Критерий Вальда — (максиминный критерий[1])  один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на …   Википедия

  • Критерий согласия Пирсона — Критерий Пирсона, или критерий χ² (Хи квадрат)  наиболее часто употребляемый критерий для проверки гипотезы о законе распределения. Во многих практических задачах точный закон распределения неизвестен, то есть является гипотезой, которая… …   Википедия

  • Критерий Фишера — (F критерий, φ* критерий, критерий наименьшей значимой разности)  апостериорный статистический критерий, используемый для сравнения дисперсий двух вариационных рядов, то есть для определения значимых различий между групповыми средними в… …   Википедия

  • Критерий Лиллиефорса — статистический критерий, названный по имени Хьюберта Лиллиефорса, профессора статистики Университета Джорджа Вашингтона, являющийся модификацией критерия Колмогорова–Смирнова. Используется для проверки нулевой гипотезы о том, что выборка… …   Википедия

  • Критерий Уилкоксона — Для улучшения этой статьи желательно?: Найти и оформить в виде сносок ссылки на авторитетные источники, подтверждающие написанное. Добавить иллюстрации. Т Крит …   Википедия

  • U-критерий Манна — U критерий Манна  Уитни (англ. Mann Whitney U test)  статистический критерий, используемый для оценки различий между двумя независимыми выборками по уровню какого либо признака, измеренного количественно. Позволяет выявлять… …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»