Бутстреппинг (статистика)

Бутстреппинг (статистика)

Статистический бутстрэппинг (англ. Bootstrapping) — компьютерный метод определения статистик вероятностных распределений. Основан на многократном генерировании выборок методом Монте-Карло на базе данных обучающей выборки.[1]

Позволяет просто и быстро оценивать самые разные статистики (доверительные интервалы, дисперсию, корреляцию и так далее) для сложных моделей.

Содержание

Принцип статистического бутстрэппинга

Бутстреппинг основан на том, что зачастую наиболее достоверную информацию о форме распределения случайной величины несёт имеющаяся у нас выборка значений этой случайной величины. Например, выборка наблюдений с двумя пиками в гистограмме не будет хорошо аппроксимироваться кривой нормального распределения, которая имеет только одну вершину. И вместо того, чтобы постулировать неадекватную форму распределения случайной величины (например, нормальную), мы используем форму распределения, которую даёт нам выборка.

В качестве примера предположим, что мы исследуем высоту людей во всем мире. Мы не можем измерить всех людей, а вместо этого выбираем лишь малую часть. Пусть в нашей выборке N людей. Мы можем посчитать среднее значение. Но для того, чтобы рассуждать о доверительном интервале роста населения, нам нужно некоторое представление о вариабельности среднего.

В простейшем варианте бутстреппинга мы, используя наши исходные данные о росте N различных людей, составляем новую выборку, также размера N. Это новая выборка взята из исходной случайным образом так, что одно значение может быть выбрано несколько раз (то есть, строя новую выборку, мы каждый раз случайным образом выбираем из N имеющихся значений). У такой выборки будет другое среднее. Сделав такую выборку много раз (возможно, 1000 или 10000 раз), каждый раз вычисляя среднее, мы получаем гистограмму распределения, которая можем ответить на вопросы о доверительном интервале.

Основной принцип бутстрепинга: имитировать многократное получение выборки из генеральной совокупности методом Монте-Карло, используя данные из имеющейся у нас выборки.

См. также

Примечания

Публикации


Wikimedia Foundation. 2010.

Игры ⚽ Нужно решить контрольную?

Полезное


Смотреть что такое "Бутстреппинг (статистика)" в других словарях:

  • Статистика — Гистограмма (метод графических изображений) У этого термина существуют и другие значения, с …   Википедия

  • Ресемплинг (статистика) — Эта статья предлагается к удалению. Пояснение причин и соответствующее обсуждение вы можете найти на странице Википедия:К удалению/2 июля 2012. Пока процесс обсуждения н …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»