Занятие 19. Моделирование сезонных колебаний
Простейший подход к моделированию сезонных колебаний – это расчет значений сезонной компоненты методом скользящей средней и построение аддитивной или мультипликативной модели временного ряда.
Общий вид аддитивной модели следующий
Y = T + S + E | ( |
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как сумма трендовой (T), сезонной (S) и случайной (E) компонент.
Общий вид мультипликативной модели выглядит так:
Y = T · S · E | ( |
Эта модель предполагает, что каждый уровень временного ряда может быть представлен как произведение трендовой (T), сезонной (E) и случайной (E) компонент.
Выбор одной из двух моделей осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, строят аддитивную модель временного ряда, в которой значения сезонной компоненты предполагаются постоянными для различных циклов. Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда, которая ставит уровни ряда в зависимость от значений сезонной компоненты.
Построение аддитивной и мультипликативной моделей сводится к расчету значений T , S и Eдля каждого уровня ряда.
Процесс построения модели включает в себя следующие шаги.
1. Выравнивание исходного ряда методом скользящей средней.
2. Расчет значений сезонной компоненты S
3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (T + E) в аддитивной или (T · E) в мультипликативной модели.
4. Аналитическое выравнивание уровней (T + E) или (T · E) и расчет значений T с использованием полученного уравнения тренда.
5. Расчет полученных по модели значений (T + E) или (T · E).
6. Расчет абсолютных и/или относительных ошибок. Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок E для анализа взаимосвязи исходного ряда и других временных рядов.
Методику построения каждой из моделей рассмотрим на примерах.
Пример.
Построение аддитивной модели временного ряда. Обратимся к данным об объеме правонарушений на таможне за четыре года, представленным в табл. 9.1.
Таблица 9.1
Год | Квартал | t | Количество возбужденных дел, y i |
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV |
Рассчитаем компоненты аддитивной модели временного ряда.
Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
1.1. Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии (гр. 3 табл. 9.2).
1.2. Разделив полученные суммы на 4, найдем скользящие средние (гр. 4 табл. 9.2). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.
1.3. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние (гр. 5 табл. 9.2).
Таблица 9.2
№ квартала,t | Количество правонарушений, yi | Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированная скользящая средняя | Оценка сезонной компоненты |
– | – | – | – | ||
657,5 | – | – | |||
655,25 | 213,75 | ||||
665,5 | 349,5 | ||||
708,75 | 693,75 | -336,75 | |||
709,375 | -238,375 | ||||
718,25 | 714,125 | 277,875 | |||
689,25 | 703,75 | 316,25 | |||
689,25 | 689,25 | -299,25 | |||
660,5 | 674,875 | -319,875 | |||
678,25 | 669,375 | 322,625 | |||
690,625 | 214,375 | ||||
-233 | |||||
690,5 | 687,75 | -233,75 | |||
– | – | – | – | ||
– | – | – | – |
Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (гр. 6 табл. 9.2). Используем эти оценки для расчета значений сезонной компоненты S (табл. 9.3). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты Si. В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.
Таблица 9.3
Показатели | Год | № квартала, i | |||
I | II | III | IV | ||
– | – | 213,75 | 349,5 | ||
-336,75 | -238,375 | 277,875 | 316,25 | ||
-299,25 | -319,875 | 322,625 | 214,375 | ||
-233 | -233,75 | – | – | ||
Всего за i-й квартал | -869 | -792 | 814,25 | 880,125 | |
Средняя оценка сезонной компоненты для i-го квартала, Si | -289,667 | -264 | 271,417 | 293,375 | |
Скорректированная сезонная компонента, Si | -292,448 | -266,781 | 268,636 | 290,593 |
Для данной модели имеем:
–289,667–264+271,417+293,375=11,125.
Корректирующий коэффициент: k = 11,125/4 = 2,781.
Рассчитываем скорректированные значения сезонной компоненты (Si = Si – k) и заносим полученные данные в таблицу 9.3.
Проверим равенство нулю суммы значений сезонной компоненты:
–292,448–266,781+268,636+290,593=0.
Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины T+E=Y–S (гр. 4 табл. 9.4). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Таблица 9.4
t | yt | Si | yt-Si | Т | Т+S | E = yt - (T + S) | E2 |
-292,448 | 667,448 | 672,700 | 380,252 | -5,252 | 27,584 | ||
-266,781 | 637,781 | 673,624 | 406,843 | -35,843 | 1284,721 | ||
268,636 | 600,364 | 674,547 | 943,183 | -74,183 | 5503,117 | ||
290,593 | 724,407 | 675,470 | 966,063 | 48,937 | 2394,830 | ||
-292,448 | 649,448 | 676,394 | 383,946 | -26,946 | 726,087 | ||
-266,781 | 737,781 | 677,317 | 410,536 | 60,464 | 3655,895 | ||
268,636 | 723,364 | 678,240 | 946,876 | 45,124 | 2036,175 | ||
290,593 | 729,407 | 679,163 | 969,756 | 50,244 | 2524,460 | ||
-292,448 | 682,448 | 680,087 | 387,639 | 2,361 | 5,574 | ||
-266,781 | 621,781 | 681,010 | 414,229 | -59,229 | 3508,074 | ||
268,636 | 723,364 | 681,933 | 950,569 | 41,431 | 1716,528 | ||
290,593 | 614,407 | 682,857 | 973,450 | -68,450 | 4685,403 | ||
-292,448 | 753,448 | 683,780 | 391,332 | 69,668 | 4853,630 | ||
-266,781 | 720,781 | 684,703 | 417,922 | 36,078 | 1301,622 | ||
268,636 | 651,364 | 685,627 | 954,263 | -34,263 | 1173,953 | ||
290,593 | 636,407 | 686,550 | 977,143 | -50,143 | 2514,320 |
Шаг 4. Определим компоненту T данной модели. Для этого проведем аналитическое выравнивание ряда (T+E) с помощью линейного тренда по формулам (9.1). Результаты аналитического выравнивания следующие:
Т = 671,777+0,9233t.
Подставляя в это уравнение значения t = 1,2,...,16, найдем уровни T для каждого момента времени (гр. 5 табл. 9.4).
Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням T значения сезонной компоненты для соответствующих кварталов (гр. 6 табл. 9.4).
На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.
Рис. 9.4.
Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок.
Следовательно, можно сказать, что аддитивная модель объясняет 97% общей вариации уровней временного ряда количества правонарушений по кварталам за 4 года.
Шаг 6. Прогнозирование по аддитивной модели. Предположим, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года. Прогнозное значение Ft уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
Т=671,777+0,9233t.
Получим
Т17=671,777+0,9233·17=687,473;
Т18 = 671,777 + 0,9233·18 = 688,396.
Значения сезонных компонент за соответствующие кварталы равны: S1= - 292,448 и S2= - 266,781. Таким образом,
F17=T17+S1=687,473–292,448≈395;
F18 = T18+S2 = 688,396 – 266,781 ≈ 422;
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 395 и 422 правонарушений соответственно.
Построение мультипликативной модели. рассмотрим на данных предыдущего примера.
Шаг 1. Методика, применяемая на этом шаге, полностью совпадает с методикой построения аддитивной модели.
Таблица 9.5
№ квартала, t | Количество правонарушений, yt | Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированная скользящая средняя | Оценка сезонной компоненты |
– | – | – | – | ||
657,5 | – | – | |||
655,25 | 1,3262 | ||||
665,5 | 1,5252 | ||||
708,75 | 693,75 | 0,5146 | |||
709,375 | 0,6640 | ||||
718,25 | 714,125 | 1,3891 | |||
689,25 | 703,75 | 1,4494 | |||
689,25 | 689,25 | 0,5658 | |||
660,5 | 674,875 | 0,5260 | |||
678,25 | 669,375 | 1,4820 | |||
690,625 | 1,3104 | ||||
0,6643 | |||||
690,5 | 687,75 | 0,6601 | |||
– | – | – | – | ||
– | – | – | – |
Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (гр. 6 табл. 9.5). Эти оценки используются для расчета сезонной компоненты S (табл. 9.6). Для этого найдем средние за каждый квартал оценки сезонной компоненты Si. Так же как и в аддитивной модели считается, что сезонные воздействия за период взаимопогашаются. В мультипликативной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле. В нашем случае число периодов одного цикла равно 4.
Таблица 9.6
Показатели | Год | № квартала, i | |||
I | II | III | IV | ||
– | – | 1,3262 | 1,5252 | ||
0,5146 | 0,6640 | 1,3891 | 1,4494 | ||
0,5658 | 0,5260 | 1,4820 | 1,3104 | ||
0,6643 | 0,6601 | – | – | ||
Всего за i-й квартал | 1,7447 | 1,8501 | 4,1973 | 4,2850 | |
Средняя оценка сезонной компоненты для i-го квартала, | 0,5816 | 0,6167 | 1,3991 | 1,4283 | |
Скорректированная сезонная компонента, Si | 0,5779 | 0,6128 | 1,3901 | 1,4192 |
Имеем
0,5816+0,6167+1,3991+1,4283=4,0257.
Определяем корректирующий коэффициент:
Скорректированные значения сезонной компоненты Si получаются при умножении ее средней оценки на Si корректирующий коэффициент k.
Проверяем условие равенство 4 суммы значений сезонной компоненты: 0,5779+0,6128+1,3901+1,4192=4.
Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. В результате получим величины T·E=Y/S (гр. 4 табл. 9.7), которые содержат только тенденцию и случайную компоненту.
Таблица 9.7
t | yt | Si | yt / Si | T | T·S | E= yt / (T·S) |
0,5779 | 648,9012 | 654,9173 | 378,4767 | 0,9908 | ||
0,6128 | 605,4178 | 658,1982 | 403,3439 | 0,9198 | ||
1,3901 | 625,1349 | 661,4791 | 919,5221 | 0,9451 | ||
1,4192 | 715,1917 | 664,7600 | 943,4274 | 1,0759 | ||
0,5779 | 617,7539 | 668,0409 | 386,0608 | 0,9247 | ||
0,6128 | 768,6031 | 671,3218 | 411,3860 | 1,1449 | ||
1,3901 | 713,6177 | 674,6027 | 937,7652 | 1,0578 | ||
1,4192 | 718,7148 | 677,8836 | 962,0524 | 1,0602 | ||
0,5779 | 674,8572 | 681,1645 | 393,6450 | 0,9907 | ||
0,6128 | 579,3081 | 684,4454 | 419,4281 | 0,8464 | ||
1,3901 | 713,6177 | 687,7263 | 956,0083 | 1,0377 | ||
1,4192 | 637,6832 | 691,0072 | 980,6774 | 0,9228 | ||
0,5779 | 797,7159 | 694,2881 | 401,2291 | 1,1490 | ||
0,6128 | 740,8616 | 697,5690 | 427,4703 | 1,0621 | ||
1,3901 | 661,8229 | 700,8499 | 974,2515 | 0,9443 | ||
1,4192 | 653,1849 | 704,1308 | 999,3024 | 0,9277 |
Шаг 4. Определим компоненту T в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни T·E. В результате получим уравнение тренда:
Т=651,6364+3,2809t.
Подставляя в это уравнение значения t=1, 2, …16, найдем уровни T для каждого момента времени (гр. 5 табл. 9.7).
Шаг 5. Найдем уровни ряда, умножив значения T на соответствующие значения сезонной компоненты (гр. 6 табл. 9.7). На одном графике откладываем фактические значения уровней временного ряда и теоретические, полученные по мультипликативной модели.
Рис. 9.5.
Расчет ошибки в мультипликативной модели производится по формуле:
E=Y/(T·S).
Для сравнения мультипликативной модели и других моделей временного ряда можно, по аналогии с аддитивной моделью, использовать сумму квадратов абсолютных ошибок (yt - T · S)2:
Сравнивая показатели детерминации аддитивной и мультипликативной моделей, делаем вывод, что они примерно одинаково аппроксимируют исходные данные.
Шаг 6. Прогнозирование по мультипликативной модели. Если предположить, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года, прогнозное значение Ft уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
Т=651,6364+3,2809t.
Получим
Т17=651,6364+3,2809·17=707,4117;
Т18=651,6364+3,2809·18=710,6926.
Значения сезонных компонент за соответствующие кварталы равны: S1=0,5779 и S2=0,6128. Таким образом
F17=T17·S1=707,4117·0,5779≈409;
F18=T18·S2=710,6926·0,6128≈436;
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 409 и 436 правонарушений соответственно.
Таким образом, аддитивная и мультипликативная модели дают примерно одинаковый результат по прогнозу.
Конец формы