ДОСТАТОЧНАЯ СТАТИСТИКА

ДОСТАТОЧНАЯ СТАТИСТИКА

для семейства распределений вероятностей {Pq; } или для параметра - статистика (векторная случайная величина) такая, что для любого события Асуществует вариант условной вероятности Pq( А|Х=x), не зависящий от 9. Это эквивалентно требованию, что условное распределение любой другой статистики У при условии Х = х не зависит от 9.

Знание Д. с. Xдает исчерпывающий материал для статистич. выводов о параметре 0, поскольку любые дополнительные статистич. данные ничего не добавляют к той информации о параметре, к-рая содержится в распределении X. Математич. выражением этого свойства является один из результатов теории статистич. решений, утверждающий, что множество решающих правил, основанных на Д. с, образует существенно полный класс. Переход от исходного семейства распределений к семейству распределений Д. с. наз. редукцией статистической задачи. Смысл редукции заключается в уменьшении (часто весьма значительном) размерности пространства наблюдений.

Практический способ нахождения Д. с. основан на следующей теореме факторизации. Пусть семейство q} доминировано s-конечной мерой mи пусть р q=dPq/dm- плотность распределения Р q относительно меры m. Статистика Xдостаточна для семейства q} в том и только в том случае, когда

где gq , h- неотрицательные измеримые функции (hне зависит от q). Для дискретных распределений в качестве m можно взять "считающую" меру: в этом случае р q.(w) в соотношении (*) имеет смысл вероятности элементарного события {w}.

Пусть, напр., X1,..., Х п- последовательность независимых случайных ведичин, принимающих значение 1 с неизвестной вероятностью v и значение О с вероятностью 1-v (схема Бернулли). Тогда

Равенство (*) выполняется7 если положить

Таким образом, эмпирическая частота

является Д. с. для неизвестной вероятности v в схеме Бернулли.

Пусть Х 1, ..., Х п- последовательность независимых нормально распределенных величин с неизвестными средним значением m и дисперсией а 2. Совместная плотность распределения X1, ..., Х п по мере Лебега дается выражением

зависящим от х 1,..., х п только через величины

Поэтому векторная статистика

является Д. с. для двумерного параметра q=(m,s2). Д. с. здесь будет и совокупность выборочного среднего

и выборочной дисперсии

поскольку величины

могут быть выражены через и

Для одного и того же семейства распределений может существовать много Д. с. В частности, тривиальной Д. с. является совокупность всех наблюдений [в рассмотренных выше примерах ( Х 1, ..., Х п)]. Однако основной интерес представляют статистики, позволяющие осуществить действительную редукцию статистич. задачи. Д. с. наз. минимальной, или необходимой, если она есть функция от любой другой Д. с. Необходимая Д. с. осуществляет максимально возможную редукцию статистич. задачи. В рассмотренных примерах найденные Д. с. являются необходимыми.

Важное применение понятия достаточности - метод улучшения несмещенных оценок, основанный на теореме Рао - Блэкуэлла - Кол моторова: если X- Д. с. для семейства {Pq}, Х 1- произвольная статистика, принимающая значения в векторном пространстве Rd, то для действительной непрерывной выпуклой функции gна Rd

где - условное математич. ожидание статистики Х 1 относительно X(к-рое фактически не зависит от 0 в силу достаточности X). В качестве функции потерь gздесь часто берется положительно определенная квадратичная форма на Rd.

Статистика Xназ. полной, если равенство Е qf(X)=0, влечет f(Х)=0 почти наверное относительно Р q , Одно из следствий теоремы Рао - Блэкуэлла - Колмогорова утверждает, что если существует полная Д. с. X, то она является равномерно по 0 наилучшей несмещенной оценкой своего математич. ожидания е(q)=Е q Х. Подобная ситуация имеет место в приведенных примерах. Так, эмпирическая частота является равномерно наилучшей несмещенной оценкой вероятности v в схеме Бернулли, а выборочные среднее m и дисперсия m2 - равномерно наилучшие несмещенные оценки параметров нормального распределения m и о 2.

В теоретическом плане иногда удобнее иметь дело не с Д. с, а с достаточными сг-алгебрами. Если {Р q; } - семейство распределений на вероятностном пространстве (W, A), то s-подалгебра наз. достаточной для {Р q}, если для любого события существует вариант условной вероятности , не зависящий от 0. Статистика Xдостаточна тогда и только тогда, когда достаточна порождаемая ею s-подалгебра

Лит.:[1] Halmos P. R., Savage L. I., "Ann. Math. Statistics", 1949, v. 20, p. 225-41; [2] Колмогоров А. Н., "Изв. АН СССР. Сер. матем.", 1950, т. 14, № 4, с. 303-26; [3] Рао С. Р., Линейные статистические методы и их применения, пер. с англ., М., 1968.

А. С. Холево.


Математическая энциклопедия. — М.: Советская энциклопедия. . 1977—1985.

Игры ⚽ Поможем написать реферат

Полезное


Смотреть что такое "ДОСТАТОЧНАЯ СТАТИСТИКА" в других словарях:

  • Достаточная статистика — для параметра , определяющая некоторое семейство распределений вероятности  статистика такая, что условная вероятность выборки при данном значении не зависит от параметра То есть выполняется равенств …   Википедия

  • ДОСТАТОЧНАЯ СТАТИСТИКА — См. статистика, достаточная …   Толковый словарь по психологии

  • Достаточная статистика —         совокупность функций от результатов наблюдений, которые содержат ту же статистическую информацию о неизвестных величинах, что и сами результаты наблюдений. В случае существования Д. с. можно обширную совокупность результатов наблюдений… …   Большая советская энциклопедия

  • МИНИМАЛЬНАЯ ДОСТАТОЧНАЯ СТАТИСТИКА — необходимая достаточная статистика, статистика X, являющаяся достаточной статистикой для семейства распределений и такая, что для любой другой достаточной статистики Yимеет место , где g нек рая измеримая функция. Достаточная статистика… …   Математическая энциклопедия

  • НЕОБХОДИМАЯ ДОСТАТОЧНАЯ СТАТИСТИКА — см. Минимальная достаточная статистика …   Математическая энциклопедия

  • СТАТИСТИКА, ДОСТАТОЧНАЯ — Статистика, которая использует все доступные данные в выборке для обеспечения оценки параметра популяции …   Толковый словарь по психологии

  • Статистика — (Statistics) Статистика это общетеоретическая наука, изучающая количественные изменения в явлениях и процессах. Государственная статистика, службы статистики, Росстат (Госкомстат), статистические данные, статистика запросов, статистика продаж,… …   Энциклопедия инвестора

  • РАО - БЛЭКУЭЛЛА - КОЛМОГОРОВА ТЕОРЕМА — утверждение из теории статистич. оценивания, на основе к рого построен метод улучшения несмещенных статистич. оценок. Пусть X случайная величина, принимающая значения в выборочном пространстве , , причем семейство вероятностных распределений ,… …   Математическая энциклопедия

  • РАО - КРАМЕРА НЕРАВЕНСТВО — н е р а в е нс т в о Ф р е ш е, н е р а в е н с т в о и н ф о р м а ц и и, неравенство в математич. статистике, устанавливающее нижнюю границу риска в задаче статистич. оценивания неизвестного параметра относительно квадратичной функции потерь.… …   Математическая энциклопедия

  • НЕЙМАНА СТРУКТУРА — структура, определяемая статистикой, не зависящей от достаточной статистики. Понятие Н. с. введено Ю. Нейманом (J. Neyman, см. [1]) в связи с задачей построения подобных критериев в теории проверки статистич. гипотез, при этом сам термин Н. с.… …   Математическая энциклопедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»