Самостоятельная работа студента 4 Модели временных рядов
Методические рекомендации
Пусть имеются некоторые условные данные об общем количестве правонарушений на таможне одного из субъектов РК (таблица 3).
Таблица 3 Исходные данные
Год | Квартал | Количество возбужденных дел, | |
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV | |||
I | |||
II | |||
III | |||
IV |
Построим поле корреляции (рисунок 2):
Рисунок 2 Поле корреляции
Уже исходя из графика видно, что значения образуют пилообразную фигуру. Рассчитаем несколько последовательных коэффициентов автокорреляции. Для этого составляем первую вспомогательную таблицу.
Таблица 4 Вспомогательная таблица
– | – | – | – | – | – | ||
-328,33 | -288,13 | 94601,72 | 107800,59 | 83018,90 | |||
169,67 | -292,13 | -49565,70 | 28787,91 | 85339,94 | |||
315,67 | 205,87 | 64986,98 | 99647,55 | 42382,46 | |||
-342,33 | 351,87 | -120455,66 | 117189,83 | 123812,50 | |||
-228,33 | -306,13 | 69898,66 | 52134,59 | 93715,58 | |||
292,67 | -192,13 | -56230,69 | 85655,73 | 36913,94 | |||
320,67 | 328,87 | 105458,74 | 102829,25 | 108155,48 | |||
-309,33 | 356,87 | -110390,60 | 95685,05 | 127356,20 | |||
-344,33 | -273,13 | 94046,85 | 118563,15 | 74600,00 | |||
292,67 | -308,13 | -90180,41 | 85655,73 | 94944,10 | |||
205,67 | 328,87 | 67638,69 | 42300,15 | 108155,48 | |||
-238,33 | 241,87 | -57644,88 | 56801,19 | 58501,10 | |||
-245,33 | -202,13 | 49588,55 | 60186,81 | 40856,54 | |||
220,67 | -209,13 | -46148,72 | 48695,25 | 43735,36 | |||
227,67 | 256,87 | 58481,59 | 51833,63 | 65982,20 | |||
Сумма | 9,05 | 0,05 | 74085,16 | 1153766,39 | 1187469,73 | ||
Среднее значение | 699,33 | 663,13 | – | – | – | – | – |
Следует заметить, что среднее значение получается путем деления не на 16, а на 15, т.к. у нас теперь на одно наблюдение меньше.
Теперь вычисляем коэффициент автокорреляции первого порядка по формуле:
.
Составляем вспомогательную таблицу для расчета коэффициента автокорреляции второго порядка.
Таблица 5 Вспомогательная таблица для
расчета коэффициента автокорреляции второго порядка.
– | – | – | – | – | – | ||
– | – | – | – | – | – | ||
145,57 | -269,79 | -39273,33 | 21190,62 | 72786,64 | |||
291,57 | -273,79 | -79828,95 | 85013,06 | 74960,96 | |||
-366,43 | 224,21 | -82157,27 | 134270,94 | 50270,12 | |||
-252,43 | 370,21 | -93452,11 | 63720,90 | 137055,44 | |||
268,57 | -287,79 | -77291,76 | 72129,84 | 82823,08 | |||
296,57 | -173,79 | -51540,90 | 87953,76 | 30202,96 | |||
-333,43 | 347,21 | -115770,23 | 111175,56 | 120554,78 | |||
-368,43 | 375,21 | -138238,62 | 135740,66 | 140782,54 | |||
268,57 | -254,79 | -68428,95 | 72129,84 | 64917,94 | |||
181,57 | -289,79 | -52617,17 | 32967,66 | 83978,24 | |||
-262,43 | 347,21 | -91118,32 | 68869,50 | 120554,78 | |||
-269,43 | 260,21 | -70108,38 | 72592,52 | 67709,24 | |||
196,57 | -183,79 | -36127,60 | 38639,76 | 33778,76 | |||
203,57 | -190,79 | -38839,12 | 41440,74 | 36400,82 | |||
Сумма | -0,02 | -0,06 | -1034792,71 | 1037835,43 | 1116776,36 | ||
Среднее значение | 723,43 | 644,79 | – | – | – | – | – |
Следовательно
.
Аналогично находим коэффициенты автокорреляции более высоких порядков, а все полученные значения заносим в сводную таблицу.
Таблица 6 Сводная таблица
Лаг | Коэффициент автокорреляции уровней |
0,063294 | |
–0,961183 | |
–0,036290 | |
0,964735 | |
0,050594 | |
–0,976516 | |
–0,069444 | |
0,964629 | |
0,162064 | |
-0,972918 | |
-0,065323 | |
0,985761 |
Коррелограмма:
Рисунок 3 Коррелограмма
Анализ коррелограммы и графика 3 исходных уровней временного ряда позволяет сделать вывод о наличии в изучаемом временном ряде сезонных колебаний периодичностью в четыре квартала.
Моделирование тенденции временного ряда
Пример. Построение аддитивной модели временного ряда. Обратимся к данным об объеме правонарушений на таможне за четыре года, представленным в табл. 4.1.
Было показано, что данный временной ряд содержит сезонные колебания периодичностью 4, т.к. количество правонарушений в первый-второй кварталы ниже, чем в третий-четвертый. Рассчитаем компоненты аддитивной модели временного ряда.
Шаг 1. Проведем выравнивание исходных уровней ряда методом скользящей средней. Для этого:
1.1. Просуммируем уровни ряда последовательно за каждые четыре квартала со сдвигом на один момент времени и определим условные годовые объемы потребления электроэнергии (гр. 3 табл 5).
1.2. Разделив полученные суммы на 4, найдем скользящие средние (гр. 4 табл. 5). Полученные таким образом выровненные значения уже не содержат сезонной компоненты.
1.3. Приведем эти значения в соответствие с фактическими моментами времени, для чего найдем средние значения из двух последовательных скользящих средних – центрированные скользящие средние (гр. 5 табл. 5).
Таблица 6 Расчетные данные
№ квартала, | Количество правонарушений, | Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированная скользящая средняя | Оценка сезонной компоненты |
– | – | – | – | ||
657,5 | – | – | |||
655,25 | 213,75 | ||||
665,5 | 349,5 | ||||
708,75 | 693,75 | -336,75 | |||
709,375 | -238,375 | ||||
718,25 | 714,125 | 277,875 | |||
689,25 | 703,75 | 316,25 | |||
689,25 | 689,25 | -299,25 | |||
660,5 | 674,875 | -319,875 | |||
678,25 | 669,375 | 322,625 | |||
690,625 | 214,375 | ||||
-233 | |||||
690,5 | 687,75 | -233,75 | |||
– | – | – | – | ||
– | – | – | – |
Шаг 2. Найдем оценки сезонной компоненты как разность между фактическими уровнями ряда и центрированными скользящими средними (гр. 6 табл. 5) Используем эти оценки для расчета значений сезонной компоненты (табл. 6). Для этого найдем средние за каждый квартал (по всем годам) оценки сезонной компоненты . В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.
Таблица 7 Расчетные данные
Показатели | Год | № квартала, | |||
I | II | III | IV | ||
– | – | 213,75 | 349,5 | ||
-336,75 | -238,375 | 277,875 | 316,25 | ||
-299,25 | -319,875 | 322,625 | 214,375 | ||
-233 | -233,75 | – | – | ||
Всего за -й квартал | -869 | -792 | 814,25 | 880,125 | |
Средняя оценка сезонной компоненты для -го квартала, | -289,667 | -264 | 271,417 | 293,375 | |
Скорректированная сезонная компонента, | -292,448 | -266,781 | 268,636 | 290,593 |
Для данной модели имеем:
.
Корректирующий коэффициент: .
Рассчитываем скорректированные значения сезонной компоненты ( ) и заносим полученные данные в таблицу 4.
Проверим равенство нулю суммы значений сезонной компоненты:
.
Шаг 3. Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4 табл. 8). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.
Таблица 8 Расчетные данные
-292,448 | 667,448 | 672,700 | 380,252 | -5,252 | 27,584 | ||
-266,781 | 637,781 | 673,624 | 406,843 | -35,843 | 1284,721 | ||
268,636 | 600,364 | 674,547 | 943,183 | -74,183 | 5503,117 | ||
290,593 | 724,407 | 675,470 | 966,063 | 48,937 | 2394,830 | ||
-292,448 | 649,448 | 676,394 | 383,946 | -26,946 | 726,087 | ||
-266,781 | 737,781 | 677,317 | 410,536 | 60,464 | 3655,895 | ||
268,636 | 723,364 | 678,240 | 946,876 | 45,124 | 2036,175 | ||
290,593 | 729,407 | 679,163 | 969,756 | 50,244 | 2524,460 | ||
-292,448 | 682,448 | 680,087 | 387,639 | 2,361 | 5,574 | ||
-266,781 | 621,781 | 681,010 | 414,229 | -59,229 | 3508,074 | ||
268,636 | 723,364 | 681,933 | 950,569 | 41,431 | 1716,528 | ||
290,593 | 614,407 | 682,857 | 973,450 | -68,450 | 4685,403 | ||
-292,448 | 753,448 | 683,780 | 391,332 | 69,668 | 4853,630 | ||
-266,781 | 720,781 | 684,703 | 417,922 | 36,078 | 1301,622 | ||
268,636 | 651,364 | 685,627 | 954,263 | -34,263 | 1173,953 | ||
290,593 | 636,407 | 686,550 | 977,143 | -50,143 | 2514,320 |
Шаг 4. Определим компоненту данной модели. Для этого проведем аналитическое выравнивание ряда ( ) с помощью линейного тренда. Результаты аналитического выравнивания следующие:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 8).
Шаг 5. Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих кварталов (гр. 6 табл. 8).
На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.
Рисунок 4 Фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели
Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок.
.
Следовательно, можно сказать, что аддитивная модель объясняет 97% общей вариации уровней временного ряда количества правонарушений по кварталам за 4 года.
Шаг Прогнозирование по аддитивной модели. Предположим, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом,
;
.
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 395 и 422 правонарушений соответственно.
Построение мультипликативной модели рассмотрим на данных предыдущего примера.
Шаг 1. Методика, применяемая на этом шаге, полностью совпадает с методикой построения аддитивной модели.
Таблица 9 Исходные данные
№ квартала, | Количество правонарушений, | Итого за четыре квартала | Скользящая средняя за четыре квартала | Центрированная скользящая средняя | Оценка сезонной компоненты |
– | – | – | – | ||
657,5 | – | – | |||
655,25 | 1,3262 | ||||
665,5 | 1,5252 | ||||
708,75 | 693,75 | 0,5146 | |||
709,375 | 0,6640 | ||||
718,25 | 714,125 | 1,3891 | |||
689,25 | 703,75 | 1,4494 | |||
689,25 | 689,25 | 0,5658 | |||
660,5 | 674,875 | 0,5260 | |||
678,25 | 669,375 | 1,4820 | |||
690,625 | 1,3104 | ||||
0,6643 | |||||
690,5 | 687,75 | 0,6601 | |||
– | – | – | – | ||
– | – | – | – |
Шаг 2. Найдем оценки сезонной компоненты как частное от деления фактических уровней ряда на центрированные скользящие средние (гр. 6 табл. 9). Эти оценки используются для расчета сезонной компоненты (табл. 10). Для этого найдем средние за каждый квартал оценки сезонной компоненты . Так же как и в аддитивной модели считается, что сезонные воздействия за период взаимопогашаются. В мультипликативной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна числу периодов в цикле. В нашем случае число периодов одного цикла равно 4.
Таблица 10 Расчет сезонной компоненты
Показатели | Год | № квартала, | |||
I | II | III | IV | ||
– | – | 1,3262 | 1,5252 | ||
0,5146 | 0,6640 | 1,3891 | 1,4494 | ||
0,5658 | 0,5260 | 1,4820 | 1,3104 | ||
0,6643 | 0,6601 | – | – | ||
Всего за -й квартал | 1,7447 | 1,8501 | 4,1973 | 4,2850 | |
Средняя оценка сезонной компоненты для -го квартала, | 0,5816 | 0,6167 | 1,3991 | 1,4283 | |
Скорректированная сезонная компонента, | 0,5779 | 0,6128 | 1,3901 | 1,4192 |
Имеем
.
Определяем корректирующий коэффициент:
.
Скорректированные значения сезонной компоненты получаются при умножении ее средней оценки на корректирующий коэффициент .
Проверяем условие равенство 4 суммы значений сезонной компоненты:
.
Шаг 3. Разделим каждый уровень исходного ряда на соответствующие значения сезонной компоненты. В результате получим величины (гр. 4 табл. 11), которые содержат только тенденцию и случайную компоненту.
Таблица 11 Расчетные данные
0,5779 | 648,9012 | 654,9173 | 378,4767 | 0,9908 | ||
0,6128 | 605,4178 | 658,1982 | 403,3439 | 0,9198 | ||
1,3901 | 625,1349 | 661,4791 | 919,5221 | 0,9451 | ||
1,4192 | 715,1917 | 664,7600 | 943,4274 | 1,0759 | ||
0,5779 | 617,7539 | 668,0409 | 386,0608 | 0,9247 | ||
0,6128 | 768,6031 | 671,3218 | 411,3860 | 1,1449 | ||
1,3901 | 713,6177 | 674,6027 | 937,7652 | 1,0578 | ||
1,4192 | 718,7148 | 677,8836 | 962,0524 | 1,0602 | ||
0,5779 | 674,8572 | 681,1645 | 393,6450 | 0,9907 | ||
0,6128 | 579,3081 | 684,4454 | 419,4281 | 0,8464 | ||
1,3901 | 713,6177 | 687,7263 | 956,0083 | 1,0377 | ||
1,4192 | 637,6832 | 691,0072 | 980,6774 | 0,9228 | ||
0,5779 | 797,7159 | 694,2881 | 401,2291 | 1,1490 | ||
0,6128 | 740,8616 | 697,5690 | 427,4703 | 1,0621 | ||
1,3901 | 661,8229 | 700,8499 | 974,2515 | 0,9443 | ||
1,4192 | 653,1849 | 704,1308 | 999,3024 | 0,9277 |
Шаг 4. Определим компоненту в мультипликативной модели. Для этого рассчитаем параметры линейного тренда, используя уровни . В результате получим уравнение тренда:
.
Подставляя в это уравнение значения , найдем уровни для каждого момента времени (гр. 5 табл. 11).
Шаг 5. Найдем уровни ряда, умножив значения на соответствующие значения сезонной компоненты (гр. 6 табл. 11). На одном графике откладываем фактические значения уровней временного ряда и теоретические, полученные по мультипликативной модели.
Рисунок 5 Фактические значения уровней временного ряда и теоретические, полученные по мультипликативной модели.
Расчет ошибки в мультипликативной модели производится по формуле:
.
Для сравнения мультипликативной модели и других моделей временного ряда можно, по аналогии с аддитивной моделью, использовать сумму квадратов абсолютных ошибок :
.
Сравнивая показатели детерминации аддитивной и мультипликативной моделей, делаем вывод, что они примерно одинаково аппроксимируют исходные данные.
Шаг Прогнозирование по мультипликативной модели. Если предположить, что по нашему примеру необходимо дать прогноз об общем объеме правонарушений на I и II кварталы 2003 года, прогнозное значение уровня временного ряда в мультипликативной модели есть произведение трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда
.
Получим
;
.
Значения сезонных компонент за соответствующие кварталы равны: и . Таким образом
;
.
Т.е. в первые два квартала 2003 г. следовало ожидать порядка 409 и 436 правонарушений соответственно.
Таким образом, аддитивная и мультипликативная модели дают примерно одинаковый результат по прогнозу.
Автокорреляция в остатках. Критерий Дарбина-Уотсона. Проверим гипотезу о наличии автокорреляции в остатках для аддитивной модели нашего временного ряда. Исходные данные и промежуточные расчеты заносим в таблицу:
Таблица 4.12 Промежуточные расчеты
-5,252 | – | – | 27,584 | ||
-35,843 | -5,252 | 935,8093 | 1284,7 | ||
-74,183 | -35,843 | 1469,956 | 5503,1 | ||
48,937 | -74,183 | 15158,53 | 2394,8 | ||
-26,946 | 48,937 | 5758,23 | 726,09 | ||
60,464 | -26,946 | 7640,508 | 3655,9 | ||
45,124 | 60,464 | 235,3156 | 2036,2 | ||
50,244 | 45,124 | 26,2144 | 2524,5 | ||
2,361 | 50,244 | 2292,782 | 5,574 | ||
-59,229 | 2,361 | 3793,328 | 3508,1 | ||
41,431 | -59,229 | 10132,44 | 1716,5 | ||
-68,450 | 41,431 | 12073,83 | 4685,4 | ||
69,668 | -68,45 | 19076,58 | 4853,6 | ||
36,078 | 69,668 | 1128,288 | 1301,6 | ||
-34,263 | 36,078 | 4947,856 | |||
-50,143 | -34,263 | 252,1744 | 2514,3 | ||
Сумма | -0,002 | 50,141 | 84921,85 | 37911,97 |
Фактическое значение критерия Дарбина-Уотсона для данной модели составляет:
.
Сформулируем гипотезы: – в остатках нет автокорреляции; – в остатках есть положительная автокорреляция; – в остатках есть отрицательная автокорреляция. Зададим уровень значимости . По таблице значений критерия Дарбина-Уотсона определим для числа наблюдений и числа независимых параметров модели (мы рассматриваем только зависимость от времени ) критические значения и . Фактическое значение -критерия Дарбина-Уотсона попадает в интервал (1,37<2,24<2,63). Следовательно, нет основания отклонять гипотезу об отсутствии автокорреляции в остатках.
Существует несколько ограничений на применение критерия Дарбина-Уотсона.
1. Он неприменим к моделям, включающим в качестве независимых переменных лаговые значения результативного признака.
2. Методика расчета и использования критерия Дарбина-Уотсона направлена только на выявление автокорреляции остатков первого порядка.
3. Критерий Дарбина-Уотсона дает достоверные результаты только для больших выборок.
Варианты индивидуальных заданий. Общая постановка задачи. СРС1 Парная регрессия и корреляция
По территориям региона приводятся данные за 200_ г. (см. таблицу своего варианта).
Требуется:
1) Построить линейное уравнение парной регрессии от .
2) Рассчитать линейный коэффициент парной корреляции и среднюю ошибку аппроксимации.
3) Оценить статистическую значимость параметров регрессии и корреляции с помощью -критерия Фишера и -критерия Стьюдента.
4) Выполнить прогноз заработной платы при прогнозном значении среднедушевого прожиточного минимума , составляющем 107% от среднего уровня.
5) Оценить точность прогноза, рассчитав ошибку прогноза и его доверительный интервал.
6) На одном графике построить исходные данные и теоретическую прямую.
Вариант 1
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, тенге, | Среднедневная заработная плата, тенге, |
Вариант 2
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, тенге, | Среднедневная заработная плата, тенге, |
Вариант 3
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, тенге, | Среднедневная заработная плата, тенге, |
Вариант 4
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, тенге, | Среднедневная заработная плата, тенге, |
Вариант 5
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, тенге, | Среднедневная заработная плата, тенге, |
Вариант 6
Номер региона | Среднедушевой прожиточный минимум в день одного трудоспособного, тенге, | Среднедневная заработная плата, тенге, |
Вариант 7