Применение методов сезонной декомпозиции и методов экспоненциального сглаживания на примере построения прогноза объемов импорта Российской Федерации


Большаков П.С.
Senior Statistician
StatSoft Russia Technical support department
mailto:projects@statsoft.ru
www.statsoft.ru

Введение
Использование методов сезонной декомпозиции
Шаг 1. Выделение структурных компонент временного ряда
Шаг 2. Прогнозирование тренда
Шаг 3. Получение и анализ результатов
Резюме

Введение

В данном примере приводится анализ и построение прогноза объемов импорта Российской Федерации. Данные по импорту содержат месячные показатели в млн. долл. США начиная с января 2000 г. и заканчивая февралем 2003г. Динамика импорта показана на рисунке 1. Файл данных можно найти по адресу: http://www.cbr.ru/statistics/credit_statistics/

Рисунок 1. Динамика объемов импорта РФ

При первом рассмотрение графика можно сразу заметить растущий тренд и ярко выраженную сезонную составляющую с минимумом в январе и максимумом в декабре.

В данном примере рассмотрен метод построения прогноза ряда на 12 месяцев вперед. Для построения прогноза использовались два метода: метод Census X 11 для выделения тренд-циклической и сезонной компонент и метод Экспоненциального сглаживания для построения прогноза тренд-циклической компоненты. Итоговый прогноз получается композицией прогнозов для сезонной и тренд-циклической компонент.

Использование методов сезонной декомпозиции

В данной части приведен пример использования методов сезонной декомпозиции. Ниже, на рисунке 2 приведен файл данных.

Рисунок 2. Панель инструментов STATISTICA и файл данных.

Шаг 1. Выделение структурных компонент временного ряда

Для выделения компонент временного ряда и построения прогноза сезонной компоненты воспользуемся методом Census X 11. Для этого на панели инструментов в меню Statistics - Анализ выберите Advanced Linear/Nonlinear Models -> Time series/forecasting -Углубленные методы анализа -> Временные ряды и прогнозирование.

Рисунок 3. Выбор метода анализа.

Перед вами появится стартовая панель модуля Time series and forecasting - Временные ряды и прогнозирование.

Рисунок 4. Стартовая панель модуля Time series and forecasting - Временные ряды и прогнозирование.

При помощи кнопки Variables - Переменные выберите переменную, содержащую данные по импорту. Далее, нажмите кнопку X11/Y2K (Census 2). Перед вами появится диалог Месячная сезонная корректировка (метод Census 2).

Рисунок 5. Диалог метода Census 2, вкладка Quick-Быстрый.

Как видно из рисунка 1, данный ряд обладает аддитивной сезонностью. На вкладке Quick-Быстрый задайте тип модели - Additive - Аддитивная и укажите дату начала ряда. Перейдите на вкладку Вывод.

Рисунок 6. Вкладка Вывод.

На вкладке Вывод нажмите кнопку в разделе таблиц, в появившемся диалоге, установите галочки напротив необходимых таблиц для вывода как показано на рисунке 7.

Рисунок 7. Список выводимых результатов.

Проделайте аналогичную процедуру для выводимых графиков.

В итоге, у вас должны быть отмечены таблицы D10 - D13 и графики G1-G4 и снимите остальные галочки. Нажмите кнопку ОК. В диалоге сезонной декомпозиции нажмите кнопку ОК.

В рабочей книге (в зависимости от настроек пользователя) появятся результаты.

Рисунок 8. Результаты сезонной декомпозиции.

Таблица D10 содержит значения выделенной сезонной компоненты.
Таблица D10а содержит прогноз сезонности на год вперед.
Таблица D11 содержит значения сезонной корректировки ряда.
Таблица D12 содержит выделенные значения тренд-цикла.
Таблица D13 содержит значения шума.
Графики G1-G4 отображают динамику соответствующих компонент ряда.

Далее, при помощи данных таблиц или вкладки Forecast - Прогноз необходимо выделить значения сезонности и ее прогноза и значения тренд-цикла.

Рисунок 9. Данные и выделенные компоненты.

На рисунке 9 представлены значения тренд-цикла, сезонности импорта и прогноз сезонности на 12 месяцев вперед, прогноз сезонности отмечен красным цветом.

Шаг 2. Прогнозирование тренда

Для получения конечного результата - прогноза объемов импорта на 12 месяцев вперед, нам необходимо получить прогноз тренд-циклической компоненты на 12 месяцев вперед.

Рисунок 10. График тренд-циклической компоненты.

Для построения прогноза тренд-циклической компоненты воспользуемся методами экспоненциального сглаживания. Для этого, перейдите на стартовую панель модуля выберите переменную, содержащую значения тренд-цикла и нажмите кнопку Exponential smoothing & forecasting - Экспоненциальное сглаживание и прогноз. Перед вами появится диалог задания параметров экспоненциального сглаживания.

Рисунок 11. Диалог экспоненциального сглаживания. Вкладка Advanced-Дополнительно.

На вкладке Advanced-Дополнительно необходимо выбрать модель прогнозирования: Демпфированный тренд без сезонности и указать длину прогноза 12 месяцев в разделе Forecast - Прогноз. Необходимые значения установок указаны на рисунке 11.

Выбор окончательной модели должен основываться на результатах полученных ошибок при оценки разных моделей. В данном случае, выбор можно сделать практически без какого-либо перебора моделей:

Далее, перейдите на вкладку автоматического поиска параметров модели.

Рисунок 12. Вкладка автоматического поиска.

На вкладке автоматического поиска параметров нажмите кнопку Automatic search - Автоматический поиск.

Система автоматически найдет оптимальные параметры модели и построит прогноз.

Рисунок 13. График значений тренда исходного ряда и прогноз.

Полученный прогноз обладает средней абсолютной относительной ошибкой равной =0.64%, что является достаточно неплохим показателем. Подставляем полученный прогноз в файл с исходным рядом и прогнозом сезонности. Для этого можно воспользоваться данными таблицы результатов построения прогноза или вкладкой Forecast - Прогноз.

Рисунок 14. Файл исходных данных с прогнозами сезонности и тренд-циклической компонент.

Шаг 3. Получение и анализ результатов

Для получения прогноза исходного ряда достаточно вспомнить тип выбранной модели в диалоге Census X11, в котором мы разделили исходный ряд на несколько частей. Теперь нам необходимо "склеить" полученные части и их прогнозы. В диалоге Census X11 мы использовали аддитивную модель: Ft=TCt + St + et где, Ft - прогноз значения ряда во времени t, TCt - прогноз значения тренд-циклической компоненты ряда во времени t, et - значения ошибки или шума. Воспользовавшись типом модели, построим прогноз - сложим TCt и St.

Для того чтобы сложить две переменные по наблюдениям, воспользуемся диалогом настройки переменных. Для того чтобы вызвать этот диалог, дважды щелкните правой кнопкой мышки по заголовку соответствующей переменной.

Рисунок 15. Рабочая таблица и диалог настройки переменных.

В диалоге переменных, введите формулу "=v10+v11" в окно формул. После этого нажмите кнопку ОК. Построим график исходного ряда и полученного прогноза.

Рисунок 16. График исходного ряда и график прогноза на 12 месяцев вперед.

Резюме

В данном примере для построения прогноза использованы методы сезонной декомпозиции Census X11 и экспоненциального сглаживания. Стоит отметить что, этот методом является достаточно общим, так как сам метод Census X11 обобщает методы экспоненциального сглаживания, кроме этого, этому методу требуется не менее 36 (3 сезонных цикла) наблюдений, тогда как методам экспоненциального сглаживания требуется для получения значимых оценок минимум 5 сезонных циклов (в нашем случае - 60 наблюдений или 5 лет.)

Полученный прогноз обладает значением средней абсолютной относительной ошибки на уровне 2% и значением R2 на уровне 0.97, что является очень хорошими результатом.
Если вы воспользуетесь методом сезонной АРПСС (ARIMA), то получите значения возможных отклонений, что позволит более точно понять структуру и природу ряда.




(c) Copyright StatSoft, Inc., 1984-2003
STATISTICA является торговой маркой StatSoft, Inc.