Анализ распределенных лагов

Общая цель

Анализ распределенных лагов - это специальный метод оценки запаздывающей зависимости между рядами. Например, предположим, Вы производите компьютерные программы и хотите установить зависимость между числом запросов, поступивших от покупателей, и числом реальных заказов. Вы могли бы записывать эти данные ежемесячно в течение года и затем рассмотреть зависимость между двумя переменными: число запросов и число заказов зависит от запросов, но зависит с запаздыванием. Однако очевидно, что запросы предшествуют заказам, поэтому можно ожидать, что число заказов. Иными словами, в зависимости между числом запросов и числом продаж имеется временной сдвиг (лаг).

Такого рода зависимости с запаздыванием особенно часто возникают в эконометрике. Например, доход от инвестиций в новое оборудование отчетливо проявится не сразу, а только через определенное время. Более высокий доход изменяет выбор жилья людьми; однако эта зависимость, очевидно, тоже проявляется с запаздыванием. (Подобные задачи возникают в страховании, где временной ряд клиентов и ряд денежных поступлений сдвинуты друг относительно друга).

Во всех этих случаях, имеется независимая или объясняющая переменная, которая воздействует на зависимые переменные с некоторым запаздыванием (лагом). Метод распределенных лагов позволяет исследовать такого рода зависимость.

Подробные обсуждения зависимостей с распределенными лагами имеются в большинстве эконометрических учебниках. Мы предполагаем, что Вы знакомы с понятием корреляции, кросскорреляции и основными идеями множественной регрессии.

Общая модель

Пусть y - зависимая переменная, a независимая или объясняющая x. Эти переменные измеряются несколько раз в течение определенного отрезка времени. В некоторых учебниках по эконометрике зависимая переменная называется также эндогенной переменной, a зависимая или объясняемая переменная экзогенной переменной. Простейший способ описать зависимость между этими двумя переменными дает следующее линейное уравнение:

В этом уравнении значение зависимой переменной в момент времени t является линейной функцией переменной x, измеренной в моменты t -1, t-2 и т.д. Таким образом, зависимая переменная представляет собой линейные функции x и x, сдвинутых на 1, 2, и т.д. временные периоды. Бета коэффициенты () могут рассматриваться как параметры наклона в этом уравнении. Будем рассматривать это уравнение как специальный случай уравнения линейной регрессии. Если коэффициент переменной с определенным запаздыванием (лагом) значим, то можете заключить, что переменная y предсказывается (или объясняется) с запаздыванием.

Распределенный лаг Алмона

Обычная проблема, возникающая в множественной регрессии, состоит в том, что соседние значения x сильно коррелируют. В самом крайнем случае, это приводит к тому, что корреляционная матрица не будет обратимой и коэффициенты бета не могут быть вычислены. В менее экстремальных ситуациях вычисления этих коэффициентов и их стандартные ошибки становятся ненадежными из-за вычислительных ошибок (ошибок округления). В контексте множественной регрессии эта проблема хорошо известна как проблема мультиколлинеарности.

Алмон (1965) предложил специальную процедуру, которая в данном случае уменьшает мультиколлинеарность. Именно, пусть каждый неизвестный коэффициент записан в виде:

Алмон показал, что во многих случаях (в частности, чтобы избежать мультиколлинеарности) легче оценить коэффициенты альфа, чем непосредственно коэффициенты бета. Такой метод оценивания коэффициентов бета называется полиномиальной аппроксимацией.

Неправильная спецификация. Общая проблема полиномиальной аппроксимации, состоит в том, что длина лага и степень полинома неизвестны заранее. Последствия неправильного определения (спецификации) этих параметров потенциально серьезны (в силу смещения, возникающего в оценках при неправильном задании параметров).

Пример

Обзор и файл данных. Данный пример основан на отчетах Министерства образования США. Имеем следующие данные:
1) число учащихся (переменная Children),
2) число учителей (Teachers),
3) среднюю зарплату учителей (Salary).

Данные собирались через каждые 10 лет за период с 1900 по 1980 год.


Рисунок 1. Файл данных.

Разумно предположить, что число учителей зависит от числа учеников. Однако мы можем ожидать некоторую задержку (лаг) в проявлении этой зависимости. В силу демографических изменений увеличивается число учеников, для которых нужно больше учителей. Однако требуется время, чтобы "создать" этих учителей. Возрастание спроса на учителей приводит к возрастанию их заработной платы (но опять с некоторой задержкой).

Просмотр результатов. Результаты будут представлены в двух таблицах результатов.


Рисунок 2. Таблица результатов регрессионного анализа (зависимая переменная Teachers).


Рисунок 3. Таблица коэффициентов регрессии.

Результаты показывают, что имеется сильная, однако лишь маргинально значимая, зависимость между переменными (R = 0.88). Заметим, что регрессионный анализ распределенных лагов не позволяет включать свободный член в уравнение. Как и во многих эконометрических моделях, свободный член в данном примере полагается равным 0, так как очевидно, если число учеников равно 0, то число учителей также должно равняться 0.

Коэффициенты регрессии. Результаты анализа показывают, что имеется 10-ти летнее запаздывание зависимости (числа учителей от количества детей). Но конечно, из-за малого числа наблюдений, t значение не значимо.

Заработная плата. Теперь повторим этот анализ, выбрав переменную Salary как зависимую переменную.


Рисунок 4. Таблица коэффициентов регрессии (зависимая переменная Salary).

Как и ранее, наибольшее t значение имеется во второй строке таблицы результатов и определяет 10-летний лаг.

Заключение. Результаты этого анализа дают основание предположить, что число учителей и их заработок зависят от количества учеников, однако эта зависимость проявляется с задержкой в 10 лет. Это то время, которое необходимо системе, чтобы отреагировать на изменение спроса.

Распределенный лаг Алмона. Стандартные оценки регрессии для анализа лагов иногда сталкиваются с проблемой мультиколлинеарности. Повторим анализ тех же данных, используя метод Алмона.

Этот метод приближает коэффициенты регрессии полиномом степени меньше, чем длина лага.


Рисунок 5. Распределенный лаг Алмона. Коэффициенты регрессии (зависимая переменная Teachers).

В данном случае t значение для 10-ти летнего лага значительно больше, чем для других лагов (что также подтверждает гипотезу о 10-ти летнем запаздывании зависимости). Если Вы проведете анализ с заработной платой, то увидите следующие результаты.


Рисунок 6. Распределенный лаг Алмона. Коэффициенты регрессии (зависимая переменная Salary).

Снова коэффициенты регрессии наиболее значимы на лаге 1.




(c) Copyright StatSoft, Inc., 1984-2003
STATISTICA является торговой маркой StatSoft, Inc.