СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ
СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ

- один из осн. разделов матем. статистики, <посвящённый оцениванию параметров теоретич. моделей по косвенным измерениямили распределений случайной величины х по наблюдению её реализаций. <Если предполагается, что распределение является элементом параметрич. семейства 8067-93.jpg, то возникает задача параметрического оценивания. Когда вид распределениянеизвестен, говорят о задаче непараметрического оценивания. При параметрич. <оценивании различают два подхода: точечное оценивание и интервальноеоценивание.

Точечное оценивание. Пусть распределение случайной величины х - заданнаяф-ция 8067-94.jpgс неизвестными параметрами а, а x = (x1,x2,...,xN)- вектор возможных значений х. Точечное оценивание заключаетсяв выборе ф-ции 8067-95.jpg,значение к-рой при заданном аг можно использовать вместо параметра . в качестве его приближённого значения. Ф-цию 8067-96.jpgназ. оценкой параметра а, принцип выбора ф-ции - методом оценивания. <Очевидно, что можно предложить много оценок, поэтому необходимо изучитьследующие осн. свойства оценок.

Состоятельность. При увеличении объёма N наблюдений (измерений)оценка должна приближаться к истинному значению параметра. Оценку 8067-97.jpgназывают состоятельной по вероятности, если для любых 8067-98.jpg,•8067-99.jpgсуществует такое N, что вероятность реализации неравенства 8067-100.jpgбудет меньше 8067-101.jpgПримером состоятельной оценки служит выборочное среднее 8067-102.jpg,к-рое является оценкой ср. значения величины 8067-103.jpg,если ф-ция ллотности вероятности р(х )имеет конечную дисперсию.

Смещение. Под смещением оценки 8067-104.jpgпринято понимать отклонение её ср. значения 8067-105.jpgот истинного значения 8067-106.jpg.Оценку 8067-107.jpg наз. <несмещённой, если при любых N и а имеем 8067-108.jpg, или 8067-109.jpg. Несмещённая оценка обычно предпочтительнее смещённой, т. к. смещениеявляется систематич. ошибкой в оценке, к-рая зависит от истинного значенияпараметра а и поэтому редко поддаётся вычислению. Выборочное среднееявляется несмещённой оценкой, тогда как выборочная дисперсия

8067-110.jpg являетсясмещённой оценкой дисперсии 8067-111.jpg

Эффективность. Простейшей характеристикой точности оценки является ср. <значение квадрата её расстояния от истинного значения:
8067-112.jpg

где 8067-113.jpg- дисперсия оценки 8067-114.jpg,равная
8067-115.jpg

Дисперсия характеризует «ширину» распределения, т. е. «шумовую» составляющуюошибки 8067-116.jpgоценки 8067-117.jpg. Поэтому в классе оценок с данным смещением 8067-118.jpgпредпочтительнее оценка с мин. дисперсией. Справедливо неравенство Крамера- Рао:
8067-119.jpg

к-рое и определяет максимально достижимую точность (в смысле 8067-120.jpgв классе оценок с данным смещением 8067-121.jpgпо выборке х. Величину
8067-122.jpg

где 8067-123.jpg- ф-ция плотности распределения 8067-124.jpg,называют количеством информации по Р. Фишеру (R. Fisher) о параметре ав оценке Величину 8067-125.jpg
8067-126.jpg

где 8067-127.jpg- ф-ция правдоподобия, а 8067-128.jpg- плотность ф-ции распределения х, называют количеством информациипо Р. Фишеру о параметре в выборке х. В классе несмещённых оценок
8067-129.jpg

и информац. смысл величин 8067-130.jpgи 8067-131.jpg становитсяочевидным: их значение определяет минимально достижимое расстояние 8067-132.jpgот а. Первое неравенство в (1), (3) превращается в равенство лишь тогда, <когда ф-ция плотности распределения оценки имеет экспоненц. форму:
8067-133.jpg

то и второе неравенство в (1), (3) превращается в равенство. Такую оценкуназывают эффективной в смысле Крамера - Рао. Оценку, для к-рой выполняетсяравенство (5), т. е. такую, в к-рой количество информации о параметре . такое же, как в самой выборке х, называют достаточной статистикой. <Условием существования достаточной статистики 8067-134.jpgявляется факторизация ф-ции правдоподобия:8067-135.jpg.Неравенство Крамера - Рао полезно тем, что позволяет ещё на стадии планированияэксперимента оценить максимально достижимую точность «измерения» параметровизучаемых распределений.

Требования (3) и (4) являются достаточно жёсткими, поэтому при конечных N эфф. оценки редки. В связи с этим рассматривают поведение 8067-136.jpgпри 8067-137.jpg и наз. <оценку асимптотически эффективной, если при 8067-138.jpg.Заметим, что асимптотич. несмещённость следует из состоятельности оценки. <Рассмотрим наиб. общие и распространённые методы получения точечных оценок.

Метод максимума правдоподобия (подробнее см. Максимального правдоподобияметод).

В этом методе вероятность реализации вектора наблюдений х,8068-1.jpg, после подстановки в неё реализовавшихся значений х рассматриваюткак ф-цию параметров а и называют ф-цией правдоподобия:8068-2.jpg. В качестве оценки в методе макс. правдоподобия для вектора параметров а берут то значение 8068-3.jpg,к-рое соответствует макс. значению ф-ции правдоподобия. При нек-рых общихпредположениях оценки в методе макс. правдоподобия состоятельны, асимптотическиэффективны и асимптотически нормально распределены. При конечных N оценкав методе макс. правдоподобия имеет оптим. свойства только в том случае, <когда существует достаточная статистика. Метод наименьших квадратов (подробнеесм. Наименьших квадратов метод), В этом методе в качестве оценкивектора параметров а берут то значение 8068-4.jpg,к-рое соответствует минимуму квадратичной формы.
8068-5.jpg

где D - матрица ошибок измерений х п. При нек-рыхобщих предположениях оценка в методе наим. квадратов состоятельна и асимптотическинормально распределена, но не является асимптотически эффективной. Если 8068-6.jpg- линейные ф-ции параметров а, то в классе линейных несмещённыхоценок оценки 8068-7.jpgв методе наим. квадратов имеют наим. дисперсии.

Метод моментов. Пусть mi - выборочные моменты,8068-8.jpg- моменты ф-ции плотности распределения, . В методе моментов выбирают в 8068-9.jpgкачестве оценки параметров а решение 8068-10.jpgсистемы ур-ний 8068-11.jpg.Оценки в методе моментов состоятельны, асимптотически несмещены, но неявляются асимптотически эффективными,8068-12.jpg -метод. Если объём выборки х велик и данные х п сгруппированыв гистограмму, то для оценки параметров а используют 8068-13.jpg -метод, <являющийся частным случаем метода наим. квадратов. Пусть У; - число наблюдений, <попавших в Z-канал гистограммы, а 8068-14.jpg- их ожидаемое число:
8068-15.jpg

В качестве оценки параметров а берут значение 8068-16.jpg,соответствующее минимуму квадратичной формы
8068-17.jpg

либо модифицированный 8068-18.jpg -метод
8068-19.jpg

Оценки в 8068-20.jpg -методеи модифицированном 8068-21.jpg -методесостоятельны, асимптотически нормально распределены и асимптотически эффективны. <Своё название эти методы получили по той причине, что при больших Yl (приближение нормального распределения)8068-22.jpgраспределено по 8068-23.jpg -распределениюс числом степеней свободы k = L - I -1, где L - число каналовгистограммы, I - число параметров.

Интервальное оценивание состоит в отыскании интервала [a1,a2],к-рый с заданной вероятностью 8068-24.jpgсодержит истинное значение параметра а. Др. словами, нужно найтитакой интервал [a1,a2] (как ф-цию вектора наблюдений х), к-рый «накроет» с вероятностью В истинное значение а приданном значении х. Это т. н. доверительный интервал с вероятностнымсодержанием 8068-25.jpg (или коэф. доверия 8068-26.jpg).Такое определение неоднозначно, его обычно доопределяют требованием минимальностидлины среди всех интервалов с коэф. доверия 8068-27.jpg

Пусть распределение 8068-28.jpgзависит от одного параметра а и 8068-29.jpg- к.-л. точечная оценка а, ф-ция плотности вероятности к-рой равна 8068-30.jpg.Тогда центр. доверит. интервал определяется как решение ур-ний
8068-31.jpg

Такой доверит. интервал может и не быть минимальным. Однако, если точечнаяоценка 8068-32.jpgасимптотически эффективна, то при больших N этот интервал будетблизок к минимальному.

Более общий подход к получению доверит. интервалов заключается в поискетакой ф-ции от оценки и параметра, распределение к-рой не зависит от искомогопараметра. Напр., пусть вектор оценок 8068-33.jpgраспределён по многомерному Гаусса распределению со средним . и матрицей вторых моментов D. Тогда квадратичная форма 8068-34.jpgраспределена по закону 8068-35.jpg (см. Распределение), к-рое не зависит от а. Задаваясь вероятностью 8068-36.jpgтого, что 8068-37.jpg,находим 8068-38.jpgи доверит. область для а:8068-39.jpg, имеющую вид гиперэллипсоида с центром в точке 8068-40.jpg Этот пример имеет практич. применение, т. к. асимптотически, при больших N, мн. методы оценивания дают нормально распределённые оценки параметров.

Непараметрическое оценивание. В этом случае не делают к.-л. предположенийо плотности ф-ции распределения. В качестве точечной оценки часто используютгистограмму. В этом методе оценивания числовую ось, на к-рой определены х п, делят на ряд областей rj (j =1,2,...,k), называемых каналами гистограммы. Тогда 8068-41.jpgзадают константами 8068-42.jpgв каждой области rj, причём 8068-43.jpg.Здесь C(N) - коэф. нормировки, gj(x) - индикаторная ф-цияобласти rj:
8068-44.jpg

Более формально оценки ф-ции плотности вероятности записывают в виде
8068-45.jpg

Гистограмма является простой в вычислит. плане, но смещённой и несостоятельнойоценкой. Поэтому используют более сложные, но состоятельные оценки, напр. <метод ближайших соседей (см. Непараметрические методы статистики).В качестве точечной оценки ф-ции распределения можно взять выборочную ф-циюраспределения:
8068-46.jpg

где подразумевается, что х 1, ..., х N расположеныв порядке их возрастания. Эта оценка оказывается несмещённой и состоятельной. <Ф-ция распределения Р(х )допускает и интервальную оценку. Рассмотримстатистику 8068-47.jpg, для к-рой асимптотич. распределением является 8068-48.jpg=8068-49.jpg. Т. к. это распределение не зависит от Р(х), можно вычислить 8068-50.jpg, для к-рого вероятность 8068-51.jpgравна 8068-52.jpg, и задать доверит. зону для Р(х):8068-53.jpg

Считается, что асимптотич. распределение справедливо при N8068-54.jpg80.

Лит.: Митропольский А. К., Техника статистических вычислений,2 изд., М., 1971; Р а о С. Р., Линейные статистические методы и их применения, <пер. с англ., М., 1968; Кендалл М., Стьюрт А., Статистические выводы исвязи, пер. с англ., М., 1973; Статистические методы в экспериментальнойфизике, пер. с англ., М., 1976. В. П. Жигунов, С. В. Клименко.

Физическая энциклопедия. В 5-ти томах. — М.: Советская энциклопедия. . 1988.


.

Игры ⚽ Нужно сделать НИР?

Полезное


Смотреть что такое "СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ" в других словарях:

  • СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ — раздел статистического вывода , предназначенный для оценивания характеристик (параметров) генеральной совокупности по результатам выборочного исследования. С.О. параметров генеральной совокупности возможно, если выборка извлечена с использованием …   Социология: Энциклопедия

  • Статистическое оценивание —         совокупность способов, употребляемых в математической статистике (См. Математическая статистика) для приближённого определения неизвестных распределений вероятностей (или каких либо их характеристик) по результатам наблюдений. В наиболее… …   Большая советская энциклопедия

  • СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ — один из основных разделов математич. статистики, посвященный оцениванию по случайным наблюдениям тех или иных характеристик их распределения. Пример 1. Пусть X1,. . ., Х n независимые случайные величины (наблюдения) с общим распределением на… …   Математическая энциклопедия

  • ОЦЕНИВАНИЕ СТАТИСТИЧЕСКОЕ — один из основных разделов статистики математич. (см.), посвященный оцениванию по случайным наблюдениям тех или иных характеристик из распределения. В социологич. исследованиях чаще всего используются два вида О.с. точечное и интервальное.… …   Российская социологическая энциклопедия

  • ОЦЕНКА ИНТЕРВАЛЬНАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ …   Социология: Энциклопедия

  • ОЦЕНКА НЕСМЕЩЕННАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ …   Социология: Энциклопедия

  • ОЦЕНКА РОБАСТНАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ …   Социология: Энциклопедия

  • ОЦЕНКА СОСТОЯТЕЛЬНАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ …   Социология: Энциклопедия

  • ОЦЕНКА ТОЧЕЧНАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ …   Социология: Энциклопедия

  • ОЦЕНКА ЭФФЕКТИВНАЯ — СТАТИСТИЧЕСКОЕ ОЦЕНИВАНИЕ …   Социология: Энциклопедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»