t-критерий Стьюдента

t-критерий Стьюдента

t-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.

t-статистика строится обычно по следующему общему принципу: в числителе случайная величина с нулевым математическим ожиданием (при выполнении нулевой гипотезы), а в знаменателе — выборочное стандартное отклонение этой случайной величины, получаемое как квадратный корень из несмещенной оценки дисперсии.

Содержание

История

Данный критерий был разработан Уильямом Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны (руководство Гиннесса считало таковой использование статистического аппарата в своей работе), статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).

Требования к данным

Для применения данного критерия необходимо, чтобы исходные данные имели нормальное распределение. В случае применения двухвыборочного критерия для независимых выборок также необходимо соблюдение условия равенства дисперсий. Существуют, однако, альтернативы критерию Стьюдента для ситуации с неравными дисперсиями.

Требование нормальности распределения данных является необходимым для точного t-теста. Однако, даже при других распределениях данных возможно использование t-статистики. Во многих случаях эта статистика асимптотически имеет стандартное нормальное распределение — N(0,1), поэтому можно использовать квантили этого распределения. Однако, часто даже в этом случае используют квантили не стандартного нормального распределения, а соответствующего распределения Стьюдента, как в точном t-тесте. Асимптотически они эквивалентны, однако на малых выборках доверительные интервалы распределения Стьюдента шире и надежнее.

Одновыборочный t-критерий

Применяется для проверки нулевой гипотезы H_0:M_x=m о равенстве математического ожидания \,M_x некоторому известному значению \,m.

Очевидно, при выполнении нулевой гипотезы E(\overline X)=m. С учётом предполагаемой независимости наблюдений V(\overline X)=\sigma^2/n. Используя несмещенную оценку дисперсии s^2_X=\sum^n_{t=1} (X_t-\overline X)^2/(n-1) получаем следующую t-статистику:

t = \frac{|\overline x - m|}{s_X / \sqrt{n}}

При нулевой гипотезе распределение этой статистики  t(n-1). Следовательно, при превышении критического значения нулевая гипотеза отвергается.

Двухвыборочный t-критерий для независимых выборок

Пусть имеются две независимые выборки объемами n_1~,~n_2 нормально распределенных случайных величин X_1,~X_2. Необходимо проверить по выборочным данным нулевую гипотезу равенстве математических ожиданий этих случайных величин H_0:~M_1=M_2.

Рассмотрим разность выборочных средних \Delta =\overline X_1 - \overline X_2. Очевидно, если нулевая гипотеза выполнена E(\Delta)=M_1-M_2=0. Дисперсия этой разности равна исходя из независимости выборок: V(\Delta)=\frac {\sigma^2_1}{n_1}+ \frac {\sigma^2_2}{n_2}. Тогда используя несмещенную оценку дисперсии s^2=\frac {\sum^n_{t=1}(X_t-\overline X)^2}{n-1} получаем несмещенную оценку дисперсии разности выборочных средних: s^2_{\Delta}=\frac {s^2_1}{n_1}+ \frac {s^2_2}{n_2}. Следовательно, t-статистика для проверки нулевой гипотезы равна

 t = \frac{|\overline X_1 - \overline X_2|}{\sqrt{\frac{s_1^2}{n_1}+\frac{s_2^2}{n_2}}}

Эта статистика при справедливости нулевой гипотезы имеет распределение t(df), где  df = \frac{(s_1^2/n_1 + s_2^2/n_2)^2}{(s_1^2/n_1)^2/(n_1-1) + (s_2^2/n_2)^2/(n_2-1)}

Случай одинаковой дисперсии

В случае, если дисперсии выборок предполагаются одинаковыми, то V(\Delta)=\sigma^2(\frac {1}{n_1}+ \frac {1}{n_2}). Тогда t-статистика равна:

 t = \frac{|\overline X_1 - \overline X_2|}{s_X \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} ~,~~s_X=\sqrt {\frac{(n_1 - 1)s_1^2 + (n_2 - 1)s_2^2}{n_1 + n_2 - 2}}

Эта статистика имеет распределение t(n_1 + n_2 - 2)

Двухвыборочный t-критерий для зависимых выборок

Для вычисления эмпирического значения t-критерия в ситуации проверки гипотезы о различиях между двумя зависимыми выборками (например, двумя пробами одного и того же теста с временным интервалом) применяется следующая формула:

t = \frac {|M_d|}{s_d / \sqrt {n}}

где M_d — средняя разность значений, s_d — стандартное отклонение разностей, а n — количество наблюдений

Эта статистика имеет распределение  t(n - 1).

Проверка линейного ограничения на параметры линейной регрессии

С помощью t-теста можно также проверить произвольное (одно) линейное ограничение на параметры линейной регрессии, оцененной обычным методом наименьших квадратов. Пусть необходимо проверить гипотезу H_0:c^Tb=a. Очевидно, при выполнении нулевой гипотезы E(c^T \hat b-a)=c^TE(\hat b)-a=0. Здесь использовано свойство несмещенности МНК-оценок параметров модели E(\hat b)=b. Кроме того, V(c^T \hat b-a)=c^TV(\hat b)c=\sigma^2 c^T(X^TX)^{-1}c. Используя вместо неизвестной дисперсии ее несмещенную оценку s^2=ESS/(n-k) получаем следующую t-статистику:

t=\frac {|c^T\hat b-a|}{s \sqrt {c^T(X^TX)^{-1}c}}

Эта статистика при выполнении нулевой гипотезы имеет распределение t(n-k), поэтому если значение статистики выше критического, то нулевая гипотеза о линейном ограничении отклоняется.

Проверка гипотез о коэффициенте линейной регрессии

Частным случаем линейного ограничения является проверка гипотезы о равенстве коэффициента b_j регрессии некоторому значению a. В этом случае соответстующая t-статистика равна:

t=\frac {|\hat{b}_j-a|}{s_{\hat{b}_j}}

где s_{\hat{b}_j} — стандартная ошибка оценки коэффициента — квадратный корень из соответствующего диагонального элемента ковариационной матрицы оценок коэффициентов.

При справедливости нулевой гипотезы распределение этой статистики — t(n-k). Если значение статистики выше критического значения, то отличие коэффициента от a является статистически значимым (неслучайным), в противном случае — незначимым (случайным, то есть истинный коэффициент вероятно равен или очень близок к предполагаемому значению a)

Замечание

Одновыборочный тест для математических ожиданий можно свести к проверке линейного ограничения на параметры линейной регрессии. В одновыборочном тесте это «регрессия» на константу. Поэтому s^2 регрессии это и есть выборочная оценка дисперсии изучаемой случайной величины, матрица X^TX равна n, а оценка «коэффициента» модели равна выборочному среднему. Отсюда и получаем выражение для t-статистики, приведенное выше для общего случая.

Аналогично можно показать, что двухвыборочный тест при равенстве дисперсий выборок также сводится к проверке линейных ограничений. В двухвыборочном тесте это «регрессия» на константу и фиктивную переменную, идентифицирующую подвыборку в зависимости от значения (0 или 1): y=a + b D. Гипотеза о равенстве математических ожиданий выборок может быть сформулирована как гипотеза о равенстве коэффициента b этой модели нулю. Можно показать, что соответствующая t-статистика для проверки этой гипотезы равна t-статистике, приведенной для двухвыборочного теста.

Также к проверке линейного ограничения можно свести и в случае разных дисперсий. В этом случае дисперсия ошибок модели принимает два значения. Исходя из этого можно также получить t-статистику, аналогичную приведенной для двухвыборочного теста.

Непараметрические аналоги

Аналогом двухвыборочного критерия для независимых выборок является U-критерий Манна–Уитни. Для ситуации с зависимыми выборками аналогами являются критерий знаков и T-критерий Вилкоксона

Литература

Student. The probable error of a mean. // Biometrika. 1908. № 6 (1). P. 1-25.

Столбчатая диаграмма · Совмещённая диаграмма · Диаграмма управления · Лесная диаграмма · Гистограмма · Q-Q диаграмма · Диаграмма выполнения · Диаграмма разброса · Стебель-листья · Ящик с усами

Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "t-критерий Стьюдента" в других словарях:

  • Критерий Стьюдента t-к — Критерий Стьюдента, t к. * крытэрый Ст’юдэнта, t к. * Student’s criterion or t c. or S. t test статистический критерий существенности разности между сравниваемыми средними. Определяется отношением этой разности к ошибке разности: При значениях t… …   Генетика. Энциклопедический словарь

  • Критерий Стьюдента — t критерий Стьюдента общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства… …   Википедия

  • критерий Стьюдента — Stjūdento kriterijus statusas T sritis augalininkystė apibrėžtis Skirtumo tarp dviejų vidurkių patikimumo rodiklis, išreiškiamas skirtumo ir jo paklaidos santykiu. atitikmenys: angl. Student’s test rus. критерий Стьюдента …   Žemės ūkio augalų selekcijos ir sėklininkystės terminų žodynas

  • T-критерий Стьюдента — общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на сравнении с распределением Стьюдента. Наиболее частые случаи применения t критерия связаны с проверкой равенства средних значений в двух… …   Википедия

  • критерий Стьюдента — Статистический критерий, в котором, в предположении нулевой гипотезы, используемая статистика соответствует t распределению (распределению Стьюдента). Примечание. Вот примеры применения этого критерия: 1. проверка равенства среднего из… …   Словарь социологической статистики

  • КРИТЕРИЙ СТЬЮДЕНТА — Биометрический показатель достоверности разницы (td) между средними значениями двух сравниваемых между собой групп животных (M1 и М2) по какому либо признаку. Достоверность разницы определяется по формуле: Полученное значение td сравнивается с… …   Термины и определения, используемые в селекции, генетике и воспроизводстве сельскохозяйственных животных

  • КРИТЕРИЙ СТЬЮДЕНТА — оценивает близость двух средних значений с точки зрения отнесения или не отнесения ее к случайной (при заданном уровне значимости), отвечая на вопрос о том, отличаются ли средние значения статистически достоверно друг от друга [10, c. 98; 47, c.… …   Современный образовательный процесс: основные понятия и термины

  • Критерий согласия Колмогорова — или Критерий согласия Колмогорова Смирнова  статистический критерий, использующийся для определения того, подчиняются ли два эмпирических распределения одному закону, либо того, подчиняется ли полученное распределение предполагаемой модели.… …   Википедия

  • критерий статистический — показатели, сочетающие в себе методы расчета, теоретическую модель распределения и правила принятия решения о правдоподобности нулевой или одной из альтернативных гипотез. Обычно делятся на параметрические, в коих предполагается обязательным… …   Большая психологическая энциклопедия

  • Критерий Вальда — (максиминный критерий[1])  один из критериев принятия решений в условиях неопределённости. Критерий крайнего пессимизма. История Критерий Вальда был предложен Абрахамом Вальдом в 1955 году для выборок равного объема, а затем распространен на …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»