Задания для самостоятельного решения
По 27 регионам страны изучается зависимость средней заработной платы, y от валового регионального продукта (ВРП) на душу населения, x.
В представленной таблице N- это две последние цифры в номере зачетной книжки
Номер региона | ВРП на душу населения, тыс.руб., x | Средняя заработная плата, тыс.руб., y | Номер региона | ВРП на душу населения, тыс.руб., x | Средняя заработная плата, тыс.руб., y |
35,8+N/10 | 3,5 | 32,5+N/10 | 3,3 | ||
22,5+N/10 | 2,6 | 32,4+N/10 | 3,3 | ||
28,3+N/10 | 3,2 | 50,9+N/10 | 3,9 | ||
26,0+N/10 | 2,6 | 44,8+N/10 | 4,7 | ||
20,0+N/10 | 2,6 | 79,1+N/10 | 6,5 | ||
31,8+N/10 | 3,5 | 47,4+N/10 | 5,0 | ||
30,5+N/10 | 3,1 | 53,3+N/10 | 4,5 | ||
29,5+N/10 | 2,9 | 33,1+N/10 | 3,7 | ||
41,5+N/10 | 3,4 | 48,4+N/10 | 4,5 | ||
41,3+N/10 | 4,8 | 61,1+N/10 | 7,2 | ||
34,5+N/10 | 3,0 | 38,9+N/10 | 3,4 | ||
34,9+N/10 | 3,1 | 26,2+N/10 | 2,9 | ||
34,7+N/10 | 3,3 | 59,3+N/10 | 5,4 | ||
26,8+N/10 | 2,6 |
Задача 4 Временные ряды
Пример. Построение аддитивной модели временного ряда.
Пусть имеются некоторые условные данные об общем количестве правонарушений на таможне одного из субъектов РФ
Год | Квартал | Количество возбужденных дел, | |
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV |
Рассчитаем компоненты аддитивной модели временного ряда.
Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
1.1. Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы правонарушений (гр. 3 табл. 4.5).
1.2. Разделив полученные суммы на 4, найдем скользящие средние (гр. 4 табл. 4.5). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.
1.3. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние (гр. 5 табл. 4.5).
Таблица 4.5
№ квартала, | Количество правонарушений, | Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированная скользящая средняя | Оценка сезонной компоненты |
– | – | – | – | ||
657,5 | – | – | |||
655,25 | 213,75 | ||||
665,5 | 349,5 | ||||
708,75 | 693,75 | -336,75 | |||
709,375 | -238,375 | ||||
718,25 | 714,125 | 277,875 | |||
689,25 | 703,75 | 316,25 | |||
689,25 | 689,25 | -299,25 | |||
660,5 | 674,875 | -319,875 | |||
678,25 | 669,375 | 322,625 | |||
690,625 | 214,375 | ||||
-233 | |||||
690,5 | 687,75 | -233,75 | |||
– | – | – | – | ||
– | – | – | – |
Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (гр. 6 табл. 4.5). Используем эти оценки для расчета значений сезонной компоненты (табл. 4.6). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.
Таблица 4.6
Показатели | Год | № квартала, | |||
I | II | III | IV | ||
– | – | 213,75 | 349,5 | ||
-336,75 | -238,375 | 277,875 | 316,25 | ||
-299,25 | -319,875 | 322,625 | 214,375 | ||
-233 | -233,75 | – | – | ||
Всего за -й квартал | -869 | -792 | 814,25 | 880,125 | |
Средняя оценка сезонной компоненты для -го квартала, | -289,667 | -264 | 271,417 | 293,375 | |
Скорректированная сезонная компонента, | -292,448 | -266,781 | 268,636 | 290,593 |
Для данной модели имеем:
.
Корректирующий коэффициент: .
Рассчитываем скорректированные значения сезонной компоненты ( ) и заносим полученные данные в таблицу 4.6.
Проверим равенство нулю суммы значений сезонной компоненты:
.
Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4 табл. 4.7). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Таблица 4.7
-292,448 | 667,448 | 672,700 | 380,252 | -5,252 | 27,584 | ||
-266,781 | 637,781 | 673,624 | 406,843 | -35,843 | 1284,721 | ||
268,636 | 600,364 | 674,547 | 943,183 | -74,183 | 5503,117 | ||
290,593 | 724,407 | 675,470 | 966,063 | 48,937 | 2394,830 | ||
-292,448 | 649,448 | 676,394 | 383,946 | -26,946 | 726,087 | ||
-266,781 | 737,781 | 677,317 | 410,536 | 60,464 | 3655,895 | ||
268,636 | 723,364 | 678,240 | 946,876 | 45,124 | 2036,175 | ||
290,593 | 729,407 | 679,163 | 969,756 | 50,244 | 2524,460 | ||
-292,448 | 682,448 | 680,087 | 387,639 | 2,361 | 5,574 | ||
-266,781 | 621,781 | 681,010 | 414,229 | -59,229 | 3508,074 | ||
268,636 | 723,364 | 681,933 | 950,569 | 41,431 | 1716,528 | ||
290,593 | 614,407 | 682,857 | 973,450 | -68,450 | 4685,403 | ||
-292,448 | 753,448 | 683,780 | 391,332 | 69,668 | 4853,630 | ||
-266,781 | 720,781 | 684,703 | 417,922 | 36,078 | 1301,622 | ||
268,636 | 651,364 | 685,627 | 954,263 | -34,263 | 1173,953 | ||
290,593 | 636,407 | 686,550 | 977,143 | -50,143 | 2514,320 |
Шаг 4. Определим компоненту данной модели. Для этого проведем аналитическое выравнивание ряда ( ) с помощью линейного тренда. Результаты аналитического выравнивания следующие:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 4.7).
Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих кварталов (гр. 6 табл. 4.7).
На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.
Рис. 4.6.
Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок.
.
Следовательно, можно сказать, что аддитивная модель объясняет 97% общей вариации уровней временного ряда количества правонарушений по кварталам за 4 года.
Шаг 6. Прогнозирование по аддитивной модели. Предположим, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом,
;
.
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 395 и 422 правонарушений соответственно.
Пример. Построение мультипликативной модели рассмотрим на данных предыдущего примера.
Шаг 1. Методика, применяемая на этом шаге, полностью совпадает с методикой построения аддитивной модели.
Таблица 4.8
№ квартала, | Количество правонарушений, | Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированная скользящая средняя | Оценка сезонной компоненты |
– | – | – | – | ||
657,5 | – | – | |||
655,25 | 1,3262 | ||||
665,5 | 1,5252 | ||||
708,75 | 693,75 | 0,5146 | |||
709,375 | 0,6640 | ||||
718,25 | 714,125 | 1,3891 | |||
689,25 | 703,75 | 1,4494 | |||
689,25 | 689,25 | 0,5658 | |||
660,5 | 674,875 | 0,5260 | |||
678,25 | 669,375 | 1,4820 | |||
690,625 | 1,3104 | ||||
0,6643 | |||||
690,5 | 687,75 | 0,6601 | |||
– | – | – | – | ||
– | – | – | – |
Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (гр. 6 табл. 4.8). Эти оценки используются для расчета сезонной компоненты (табл. 4.9). Для этого найдем средние за каждый квартал оценки сезонной компоненты . Так же как и в аддитивной модели считается, что сезонные воздействия за период взаимопогашаются. В мультипликативной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле. В нашем случае число периодов одного цикла равно 4.
Таблица 4.9
Показатели | Год | № квартала, | |||
I | II | III | IV | ||
– | – | 1,3262 | 1,5252 | ||
0,5146 | 0,6640 | 1,3891 | 1,4494 | ||
0,5658 | 0,5260 | 1,4820 | 1,3104 | ||
0,6643 | 0,6601 | – | – | ||
Всего за -й квартал | 1,7447 | 1,8501 | 4,1973 | 4,2850 | |
Средняя оценка сезонной компоненты для -го квартала, | 0,5816 | 0,6167 | 1,3991 | 1,4283 | |
Скорректированная сезонная компонента, | 0,5779 | 0,6128 | 1,3901 | 1,4192 |
Имеем
.
Определяем корректирующий коэффициент:
.
Скорректированные значения сезонной компоненты получаются при умножении ее средней оценки на корректирующий коэффициент .
Проверяем условие равенство 4 суммы значений сезонной компоненты:
.
Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. В результате получим величины (гр. 4 табл. 4.10), которые содержат только тенденцию и случайную компоненту.
Таблица 4.10
0,5779 | 648,9012 | 654,9173 | 378,4767 | 0,9908 | ||
0,6128 | 605,4178 | 658,1982 | 403,3439 | 0,9198 | ||
1,3901 | 625,1349 | 661,4791 | 919,5221 | 0,9451 | ||
1,4192 | 715,1917 | 664,7600 | 943,4274 | 1,0759 | ||
0,5779 | 617,7539 | 668,0409 | 386,0608 | 0,9247 | ||
0,6128 | 768,6031 | 671,3218 | 411,3860 | 1,1449 | ||
1,3901 | 713,6177 | 674,6027 | 937,7652 | 1,0578 | ||
1,4192 | 718,7148 | 677,8836 | 962,0524 | 1,0602 | ||
0,5779 | 674,8572 | 681,1645 | 393,6450 | 0,9907 | ||
0,6128 | 579,3081 | 684,4454 | 419,4281 | 0,8464 | ||
1,3901 | 713,6177 | 687,7263 | 956,0083 | 1,0377 | ||
1,4192 | 637,6832 | 691,0072 | 980,6774 | 0,9228 | ||
0,5779 | 797,7159 | 694,2881 | 401,2291 | 1,1490 | ||
0,6128 | 740,8616 | 697,5690 | 427,4703 | 1,0621 | ||
1,3901 | 661,8229 | 700,8499 | 974,2515 | 0,9443 | ||
1,4192 | 653,1849 | 704,1308 | 999,3024 | 0,9277 |
Шаг 4. Определим компоненту в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни . В результате получим уравнение тренда:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 4.10).
Шаг 5. Найдем уровни ряда, умножив значения на соответствующие значения сезонной компоненты (гр. 6 табл. 4.10). На одном графике откладываем фактические значения уровней временного ряда и теоретические, полученные по мультипликативной модели.
Рис. 4.7.
Расчет ошибки в мультипликативной модели производится по формуле:
.
Для сравнения мультипликативной модели и других моделей временного ряда можно, по аналогии с аддитивной моделью, использовать сумму квадратов абсолютных ошибок :
.
Сравнивая показатели детерминации аддитивной и мультипликативной моделей, делаем вывод, что они примерно одинаково аппроксимируют исходные данные.
Шаг 6. Прогнозирование по мультипликативной модели. Если предположить, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года, прогнозное значение уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом
;
.
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 409 и 436 правонарушений соответственно.
Таким образом, аддитивная и мультипликативная модели дают примерно одинаковый результат по прогнозу.
Варианты индивидуальных заданий
Имеются условные данные об объемах потребления электроэнергии ( ) жителями региона за 16 кварталов.
Требуется:
1.Построить автокорреляционную функцию и сделать вывод о наличии сезонных колебаний.
2.Построить аддитивную модель временного ряда (для нечетных вариантов) или мультипликативную модель временного ряда (для четных вариантов).
3.Сделать прогноз на 2 квартала вперед.
Варианты 1, 2
5,8 | 7,9 | ||
4,5 | 5,5 | ||
5,1 | 6,3 | ||
9,1 | 10,8 | ||
7,0 | 9,0 | ||
5,0 | 6,5 | ||
6,0 | 7,0 | ||
10,1 | 11,1 |
Варианты 3, 4
5,5 | 8,0 | ||
4,6 | 5,6 | ||
5,0 | 6,4 | ||
9,2 | 10,9 | ||
7,1 | 9,1 | ||
5,1 | 6,4 | ||
5,9 | 7,2 | ||
10,0 | 11,0 |
Варианты 5, 6
5,3 | 8,2 | ||
4,7 | 5,5 | ||
5,2 | 6,5 | ||
9,1 | 11,0 | ||
7,0 | 8,9 | ||
5,0 | 6,5 | ||
6,0 | 7,3 | ||
10,1 | 11,2 |
Варианты 7, 8
5,5 | 8,3 | ||
4,8 | 5,4 | ||
5,1 | 6,4 | ||
9,0 | 10,9 | ||
7,1 | 9,0 | ||
4,9 | 6,6 | ||
6,1 | 7,5 | ||
10,0 | 11,2 |
Варианты 9, 10