- Анализ временных рядов (time-series analysis)
-
А. в. р. наз. статистический анализ данных, собранных в ходе наблюдений за единичным объектом (напр., отдельным человеком, семьей или городом), производимых последовательно во времени, либо через определенные интервалы, либо непрерывно. Как и традиционные параметрические методы анализа данных, методы А. в. р. используются для описания связей между переменными, предсказания будущего поведения и проверки эффектов проведенного лечения. Есть два математически эквивалентных подхода к разработке концептуальных моделей и вычислительных процедур А. в. р. Один подход, наз. анализом во временной области или анализом временных характеристик (time-domain analysis), связан с использованием понятий, сходных с теми, что применяются в традиционном корреляционном и регрессионном анализе. Др. подход получил название анализа частотных характеристик (frequency-domain analysis); он предполагает изучение частотных составляющих и основан на понятиях спектрального анализа. Далее рассматривается ряд осн. идей, связанных с анализом временных характеристик.
Основные понятия анализа временных рядов
Модель временного ряда представляет собой уравнение, к-рое связывает наблюдение, полученное в нек-рый конкретный момент времени, с наблюдениями, полученными ранее по той же и/или др. характеристикам изучаемой переменной. Напр., если дискретные данные о весе тела собираются через равные промежутки времени на одном объекте, интерес могут представлять два вопроса: а) в какой степени связаны смежные (или несмежные) наблюдения в данном временном ряду, и б) насколько успешно можно предсказать будущие показатели веса тела. Ответы на оба этих вопроса требуют вычисления выборочной автокорреляционной функции, идентификации модели временного ряда и оценивания соотв. параметров.
Коэффициент автокорреляции отражает, в сущности, обычную корреляцию, вычисляемую между образующими временной ряд текущими и запаздывающими значениями зависимой переменной (весом тела в нашем примере). Этот коэффициент (вычисляемый по формуле, весьма похожей на формулу коэффициента корреляции Пирсона) является мерой линейной зависимости между наблюдениями, разделенными определенными временными интервалами, — т. е. мерой линейной связи между смежными наблюдениями.
Совокупность коэффициентов автокорреляции, основанных на разной величине лага, есть не что иное, как расчетная автокорреляционная функция, график к-рой обычно наз. коррелограммой. Для проверки значимости этих коэффициентов применяют соотв. статистические критерии.
Идентификация модели. Для прогнозирования будущих показателей на основе имеющихся временных рядов необходимо идентифицировать модель, к-рая наилучшим образом описывает процесс порождения выборочного временного ряда. Для идентификации такой модели можно воспользоваться расчетной автокорреляционной функцией. Из множества моделей для описания динамики временных рядов чаще всего используются три: модель белого шума, авторегрессионная модель первого порядка и авторегрессионная модель второго порядка. Если расчетная автокорреляционная функция представляет собой совокупность незначимых автокорреляций, это явное указание на то, что изменчивость данного времени ого ряда лучше всего охарактеризовать как «белый шум», или случайные флуктуации.
Авторегрессионная модель первого порядка во мн. случаях является хорошим средством представления данных временного ряда; следовательно, форма автокорреляционной функции этой модели должна быть сравнима с формой расчетной автокорреляционной функции. Известно, что авторегрессионная модель первого порядка связана с автокорреляциями, к-рые быстро затухают при лагах более высокого порядка. Если в авторегрессионной модели первого порядка известна автокорреляция с лагом, равным 1, автокорреляция с лагом 2 равна квадрату автокорреляции с лагом 1, а автокорреляция с любым большим лагом равна автокорреляции с единичным лагом в k-й степени, где k — величина лага.
Для представления нек-рых данных лучше подходит др. полезная модель — авторегрессионная модель второго порядка. Если эта модель лучше соответствует данным, чем авторегрессионная модель первого порядка, поведение во время t можно предсказать с меньшей погрешностью, используя информ. с запаздыванием на два шага в добавление к информ. о среднем и замере с запаздыванием на один шаг.
Осн. идея, лежащая в основе идентификации модели временного ряда, остается одной и той же и для простых, и для сложных моделей: соответствие структуры наблюдаемых данных (характеризуемых различными видами автокорреляции) известной структуре, связываемой с определенным классом моделей. После того как модель предварительно идентифицирована, производится оценка ее параметров.
Диагностическая проверка. Так как в основе идентификации модели временного ряда лежит до нек-рой степени субъективная процедура, иногда рекомендуется оценить адекватность идентифицированной модели путем проверки значимости автокорреляционной функции остатков данной модели. Это целесообразно, поскольку остатки модели временного ряда не являются автокоррелированными. Фактически, осн. цель А. в. р. — узнать, что необходимо сделать с исходными данными (т. е. какие модели нужно подобрать) для того, чтобы получить остатки, соответствующие белому шуму. Нек-рые временные ряды требуют очень сложных моделей для получения остатков, относящихся к белому шуму. Это часто имеет место в тех случаях, когда ряд не является стационарным, т. е. когда среднее, дисперсия и/или структура автокорреляции изменяются во времени.
Модели вмешательства
В психол. исслед. часто возникает необходимость оценить эффективность вмешательства. Если данные собирались через равные интервалы до и после воздействия на некий элемент выборки, напр. чел., группу или округ, нередко представляется полезным статистически описать наблюдаемый эффект и проверить его статистическую значимость. Есть две осн. стратегии анализа таких эффектов.
Первый подход дает легко интерпретируемый результат и потому весьма полезен. Он предполагает идентифицирование общепринятой модели временного ряда на полученных до вмешательства данных. Производится оценка параметров модели, а затем делаются предсказания относительно поведения, ожидаемого после вмешательства. Эти предсказания осн. на предположении, что характер процесса до вмешательства не изменится и после вмешательства. Когда после вмешательства обнаруживается несоответствие между предсказываемыми и наблюдаемыми значениями, различие можно статистически оценить. Если различие статистически значимо, это служит доказательством того, что наблюдаемое изменение связано с вмешательством. Поскольку статистический критерий различия можно вычислить для каждой точки временного ряда после вмешательства, нетрудно определить тот момент, когда данное вмешательство начинает вызывать эффект.
Второй — гораздо чаще используемый подход — предполагает оценивание и проверку эффекта вмешательства. Связанная с применением этого подхода трудность заключается в том, что «эффект» вмешательства часто бывает комплексным; поэтому в данном случае целесообразно рассматривать паттерн эффекта, а не его среднее различие.
Двумерный анализ
А. в. р. можно использовать при изучении связей между двумя или большим числом временных рядов. Существует неск. видов корреляции между временными рядами (наз. иногда кросс-корреляцией), поскольку существует множество вариантов временного запаздывания изменений двух рядов. Цель исслед. таких корреляций — выяснение того, какой из двух рядов будет «ведущим».
См. также Корреляционные методы
Б. И. Хьютема
.