- Среднее арифметическое
-
В математике и статистике сре́днее арифмети́ческое - одна из наиболее распространённых мер центральной тенденции, представляющая собой сумму всех наблюденных значений деленную на их количество.
Предложена (наряду со средним геометрическим и средним гармоническим) еще пифагорейцами [1] и является одной из наиболее распространенных мер центральной тенденции.
Частными случаями среднего арифметического являются генеральное среднее ( генеральной совокупности) и выборочное среднее ( выборки).
Содержание
Введение
Обозначим множество данных X = (x1, x2, …, xn), тогда выборочное среднее обычно обозначается горизонтальной чертой над переменной (, произносится «x с чертой»).
Для обозначения среднего арифметического всей совокупности используется греческая буква μ. Для случайной величины, для которой определено среднее значение, μ есть вероятностное среднее или математическое ожидание случайной величины. Если множество X является совокупностью случайных чисел с вероятностным средним μ, тогда для любой выборки xi из этой совокупности μ = E{xi} есть математическое ожидание этой выборки.
На практике разница между μ и в том, что μ является типичной ненаблюдаемой переменной, потому что видеть можно скорее выборку, а не всю генеральную совокупность. Поэтому, если выборку представлять случайным образом (в терминах теории вероятностей), тогда (но не μ) можно трактовать как случайную переменную, имеющую распределение вероятностей на выборке (вероятностное распределение среднего).
Обе эти величины вычисляются одним и тем же способом:
Если X — случайная переменная, тогда математическое ожидание X можно рассматривать как среднее арифметическое значений в повторяющихся измерениях величины X. Это является проявлением закона больших чисел. Поэтому выборочное среднее используется для оценки неизвестного математического ожидания.
В элементарной алгебре доказано, что среднее n + 1 чисел больше среднего n чисел тогда и только тогда, когда новое число больше чем старое среднее, меньше тогда и только тогда, когда новое число меньше среднего, и не меняется тогда и только тогда, когда новое число равно среднему. Чем больше n, тем меньше различие между новым и старым средними значениями.
Заметим, что имеется несколько других «средних» значений, в том числе среднее степенное, среднее Колмогорова, гармоническое среднее, арифметико-геометрическое среднее и различные средне-взвешенные величины.
Примеры
- Для трёх чисел сложим их и поделим на 3:
- Для четырёх чисел сложим их и поделим на 4:
Непрерывная случайная величина
Для непрерывно распределённой величины среднее арифметическое на отрезке определяется через определённый интеграл:
Некоторые проблемы применения среднего
Отсутствие робастности
Хотя среднее арифметическое часто используется в качестве средних значений или центральных тенденций, это понятие не относится к робастной статистике, что означает, что среднее арифметическое подвержено сильному влиянию «больших отклонений». Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию «среднего», а значения среднего из робастной статистики (например, медиана) может лучше описывать центральную тенденцию.
Классическим примером является подсчёт среднего дохода. Арифметическое среднее может быть неправильно истолковано в качестве медианы, из-за чего может быть сделан вывод, что людей с большим доходом больше, чем на самом деле. «Средний» доход истолковывается таким образом, что доходы большинства людей находятся вблизи этого числа. Этот «средний» (в смысле среднего арифметического) доход является выше, чем доходы большинства людей, так как высокий доход с большим отклонением от среднего делает сильный перекос среднего арифметического (в отличие от этого, средний доход по медиане «сопротивляется» такому перекосу). Однако, этот «средний» доход ничего не говорит о количестве людей вблизи медианного дохода (и не говорит ничего о количестве людей вблизи модального дохода). Тем не менее, если легкомысленно отнестись к понятиям «среднего» и «большинство народа», то можно сделать неверный вывод о том, что большинство людей имеют доходы выше, чем они есть на самом деле. Например, отчёт о «среднем» чистом доходе в Медине, штат Вашингтон, подсчитанный как среднее арифметическое всех ежегодных чистых доходов жителей, даст на удивление большое число из-за Билла Гейтса. Рассмотрим выборку (1, 2, 2, 2, 3, 9). Среднее арифметическое равно 3.17, но пять значений из шести ниже этого среднего.
Сложный процент
Если числа перемножать, а не складывать, нужно использовать среднее геометрическое, а не среднее арифметическое. Наиболее часто этот казус случается при расчёте окупаемости инвестиций в финансах.
Например, если акции в первый год упали на 10 %, а во второй год выросли на 30 %, тогда некорректно вычислять «среднее» увеличение за эти два года как среднее арифметическое (−10 % + 30 %) / 2 = 10 %; правильное среднее значение в этом случае дают совокупные ежегодные темпы роста, по которым годовой рост получается только 8,2 %.
Причина этого в том, что проценты имеют каждый раз новую стартовую точку: 30 % — это 30 % от меньшего числа. Если акции в начале стоили $30 и упали на 10 %, они теперь стоят $27. Если акции выросли на 30 %, они теперь стоят $35.1. Арифметическое среднее этого роста 10 %, но поскольку акции выросли за 2 года на $5.1, средний рост в 8,2 % даёт конечный результат $35.1 [$30 (1 — 10 %) (1 + 30 %) = $30 (1 + 8,2 %) (1 + 8,2 %) = $35.1]. Если же использовать таким же образом среднее арифметическое значение 10 %, мы не получим фактическое увеличение [$30 (1 + 10 %) (1 + 10 %) = $36.3].
В общем, сложный процент даёт 90 % * 130 % = 117 % общий рост, а годовой прирост , то есть 8,2 % в год.
Направления
Особую осторожность нужно иметь при расчёте циклических данных, таких как фазы или углы. Наивное вычисление среднего арифметического 1° и 359° даёт результат 180°. Это неверно по двум причинам:
- Во-первых, угловые меры определены только до 360° (или 2π, при измерении в радианах). Таким образом, ту же пару можно записать 1° и −1°, или 1° и 719°, но каждая из которых даёт различные средние значения.
- Во-вторых, в этой ситуации, 0° (эквивалентно 360°) геометрически лучшее среднее значение: меньше дисперсия (обе точки на 1° от него, и на 179° от 180°, вычисленного среднего).
В целом применение такого рассмотрения средней величины ведёт к искусственному сдвигу его к середине числового диапазона. Решение этой проблемы заключается в использовании оптимальной формализации (а именно, определение среднего в качестве центральной точки, то есть точки, от которой наименьшая дисперсия), а также переопределение вычитания как модульного расстояния (то есть как расстояние от окружности; в частности, модульное расстояние между 1° и 359° — это 2°, а не 358°).
Примечания
- ↑ Cantrell, David W., "Pythagorean Means" from MathWorld
См. также
- Взвешенное среднее
- Винсоризованное среднее
- Гармоническое среднее
- Геометрическое среднее
- Медиана
- Мода
- Среднее Колмогорова
- Усеченное среднее
- Неравенство между средним арифметическим и средним геометрическим
- Неравенство Швейцера
Ссылки
- Арифметическая средняя // Энциклопедический словарь Брокгауза и Ефрона: В 86 томах (82 т. и 4 доп.). — СПб., 1890—1907.
- Финансовая математика
- Прикладная математика
Статистические показатели Описательная
статистикаНепрерывные
данныеКоэффициент сдвига Среднее (Арифметическое, Геометрическое, Гармоническое) · Медиана · Мода · Размах Вариация Ранг · Среднеквадратическое отклонение · Коэффициент вариации · Квантиль (Дециль, Процентиль/Перцентиль/Центиль) Моменты Математическое ожидание · Дисперсия · Асимметрия · Эксцесс Дискретные
данныеЧастота · Таблица контингентности Статистический
вывод и
проверка
гипотезСтатистический
выводДоверительный интервал (Частотная вероятность) · Достоверный интервал (Байесовский вывод) · Статистическая значимость · Мета-анализ Планирование
экспериментаГенеральная совокупность · Планирование выборки · Районированная выборка · Репликация · Группировка · Чувствительность и специфичность Объём выборки Статистическая мощность · Мера эффекта · Стандартная ошибка Общая оценка Байесовская оценка решения · Метод максимального правдоподобия · Метод моментов нахождения оценок · Оценка минимального расстояния · Оценка максимального интервала Статистические
критерииZ-тест · t-критерий Стьюдента · Критерий Фишера · Критерий Пирсона (Хи-квадрат) · Критерий согласия Колмогорова · Тест Вальда · U-критерий Манна — Уитни · Критерий Уилкоксона · Критерий Краскела — Уоллиса · Критерий Кохрена · Критерий Лиллиефорса Анализ выживания Функция выживания · Оценка Каплана — Мейера · Логранк-тест · Интенсивность отказов · Пропорциональная модель опасностей Корреляция Коэффициент корреляции Пирсона · Ранг корреляций (Коэффициент Спирмана для ранга корреляций, Коэффициент тау Кендалла для ранга корреляций) · Переменная смешивания Линейные модели Основная линейная модель · Обобщённая линейная модель · Анализ вариаций · Ковариационный анализ Регрессия Линейная · Нелинейная · Непараметрическая регрессия · Полупараметрическая регрессия · Логистическая регрессия Столбчатая диаграмма · Совмещённая диаграмма · Диаграмма управления · Лесная диаграмма · Гистограмма · Q-Q диаграмма · Диаграмма выполнения · Диаграмма разброса · Стебель-листья · Ящик с усами Категория:- Средние величины
Wikimedia Foundation. 2010.