Подборка модели вида ARIMA (p,k,q) для ряда А
1.1 В первую очередь, протестируем ряд А на стационарность. Рассмотрим график временного ряда А:
Уже на основании графика можем заключить, что исходный ряд не является стационарным. В качестве дополнительного подтверждения этой гипотезы, проведем расширенный тест Дики-Фуллера ряда А. Пусть порядок лага будет определен пакетом Gretl автоматически, пусть будет учтена константа и тренд. В результате получим следующее:
Тест Дики-Фуллера для A
объем выборки 99
нулевая гипотеза единичного корня: a = 1
тест с константой
модель: (1-L)y = b0 + (a-1)*y(-1) + e
коэф. автокорреляции 1-го порядка для e: 0,068
оценка для (a - 1): 0,0202285
тестовая статистика: tau_c(1) = 30,1664
P-значение 1
с константой и трендом
модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
коэф. автокорреляции 1-го порядка для e: -0,009
лаг для разностей: F(9, 78) = 0,685 [0,7202]
оценка для (a - 1): 0,0225823
тестовая статистика: tau_ct(1) = 3,38825
асимпт. р-значение 1
Поскольку P-value = 1 превышает любой разумный уровень значимости, делаем вывод, что гипотеза Но теста Дики-Фуллера (гипотеза о нестационарности ряда) принимается, и ряд А не является стационарным.
Перейдем к первым разностям ряда и рассмотрим новый временной ряд d_A. График этого временного ряда имеет вид:
На основании этого графика также можем сделать вывод о том, что процесс d_A не является стационарным. Для подтверждения этого вывода, снова проведем тест Дики-Фуллера и получим следующее:
Расширенный тест Дики-Фуллера для d_A
включая 6 лага(-ов) для (1-L)d_A (максимальное значение равно 12)
объем выборки 92
нулевая гипотеза единичного корня: a = 1
тест с константой
модель: (1-L)y = b0 + (a-1)*y(-1) + ... + e
коэф. автокорреляции 1-го порядка для e: 0,005
лаг для разностей: F(6, 84) = 9,077 [0,0000]
оценка для (a - 1): 0,0618306
тестовая статистика: tau_c(1) = 1,49658
асимпт. р-значение 0,9993
с константой и трендом
модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
коэф. автокорреляции 1-го порядка для e: -0,056
лаг для разностей: F(5, 85) = 1,698 [0,1440]
оценка для (a - 1): -0,319884
тестовая статистика: tau_ct(1) = -1,76781
асимпт. р-значение 0,7205
P-value по прежнему превышает любой разумный уровень значимости, и гипотеза Но теста Дики-Фуллера снова принимается: ряд d_A не является стационарным. Поэтому, перейдем ко вторым разностям ряда А, рассмотрим новый временной ряд d_d_A. Рассмотрим график ряда d_d_A:
На основании представленного графика можем сделать первичное предположение о том, что ряд является стационарным. Подтвердим данное предположение результатами теста Дики-Фуллера для временного ряда d_d_A:
Расширенный тест Дики-Фуллера для d_d_A
включая 4 лага(-ов) для (1-L)d_d_A (максимальное значение равно 12)
объем выборки 93
нулевая гипотеза единичного корня: a = 1
тест с константой
модель: (1-L)y = b0 + (a-1)*y(-1) + ... + e
коэф. автокорреляции 1-го порядка для e: -0,049
лаг для разностей: F(4, 87) = 7,583 [0,0000]
оценка для (a - 1): -3,40646
тестовая статистика: tau_c(1) = -7,17745
асимпт. р-значение 1,088e-010
с константой и трендом
модель: (1-L)y = b0 + b1*t + (a-1)*y(-1) + ... + e
коэф. автокорреляции 1-го порядка для e: 0,005
лаг для разностей: F(5, 84) = 7,100 [0,0000]
оценка для (a - 1): -4,19552
тестовая статистика: tau_ct(1) = -6,92063
асимпт. р-значение 4,208e-009
Поскольку в данном случае P-value = 1,088e-10 < 0,01 (а также меньше любого другого разумного уровня значимости), делаем вывод, что гипотеза Но теста Дики-Фуллера о нестационарности ряда отклоняется, и ряд d_d_A является стационарным.
Нестационарный процесс А удалось свести к стационарному процессу d_d_A, и именно с этим процессом мы продолжим работу в следующих пунктах.
1.2. Сделаем первые предположения о виде ряда на основании его коррелограммы. Коррелограмма ряда d_d_A (пусть максимальное число лагов составит 20) имеет следующий вид:
Вид ACF ряда наводит на мысль о том, что ряд d_d_A является МА процессом первого порядка (поскольку есть только одно, первое, значение функции ACF, статистически значимо отличное от нуля).
1.3. Попробуем непосредственно построить модель. В первую очередь проверим предположение того, что ряд А описывается моделью ARIMA (0,2,1), или ряд d_d_A описывается моделью ARIMA (0,0,1) = MA (1):
Модель 1: ARMA, использованы наблюдения 1980:3-2004:4 (T = 98)
Зависимая переменная: d_d_A
Стандартные ошибки рассчитаны на основе Гессиана
Коэффициент | Ст. ошибка | z | P-значение | ||
const | 0,118343 | 0,0217786 | 5,4339 | <0,00001 | *** |
theta_1 | -0,825297 | 0,0582614 | -14,1654 | <0,00001 | *** |
Среднее зав. перемен | 0,124087 | Ст. откл. зав. перемен | 1,484416 | |
Среднее инноваций | -0,014903 | Ст. откл. инноваций | 1,170854 | |
Лог. правдоподобие | -155,0853 | Крит. Акаике | 316,1706 | |
Крит. Шварца | 323,9255 | Крит. Хеннана-Куинна | 319,3073 |
Действительная часть | Мнимая часть | Модуль | Частота | ||
MA | Корень 1 | 1,2117 | 0,0000 | 1,2117 | 0,0000 |
Обратим внимание на то, что в полученной модель характеризуется приемлемыми значениями критерия каике и Шварца, а также хороша значимостью константы и первого лага МА-составляющей модели.
На построение именно этой модели нас натолкнул вид коллерограммы ряда d_d_A. Чтобы убедиться, что полученная модель хороша, обратим внимание на то, что добавление лагов AR-составляющей и дополнительных лагов MA-составляющей модели не улучшает ее характеристик. Например, попробуем описать ряд d_d_A моделью ARMA (2,0,2):
Модель 2: ARMA, использованы наблюдения 1980:3-2004:4 (T = 98)
Зависимая переменная: d_d_A
Стандартные ошибки рассчитаны на основе Гессиана
Коэффициент | Ст. ошибка | z | P-значение | ||
const | 0,118738 | 0,0232806 | 5,1003 | <0,00001 | *** |
phi_1 | 0,356885 | 0,64692 | 0,5517 | 0,58118 | |
phi_2 | -0,177353 | 0,123524 | -1,4358 | 0,15107 | |
theta_1 | -1,12246 | 0,652809 | -1,7194 | 0,08554 | * |
theta_2 | 0,279339 | 0,554187 | 0,5041 | 0,61423 |
Среднее зав. перемен | 0,124087 | Ст. откл. зав. перемен | 1,484416 | |
Среднее инноваций | -0,011494 | Ст. откл. инноваций | 1,157414 | |
Лог. правдоподобие | -153,9798 | Крит. Акаике | 319,9595 | |
Крит. Шварца | 335,4693 | Крит. Хеннана-Куинна | 326,2329 |
Действительная часть | Мнимая часть | Модуль | Частота | ||
AR | Корень 1 | 1,0061 | -2,1508 | 2,3745 | -0,1804 |
Корень 2 | 1,0061 | 2,1508 | 2,3745 | 0,1804 | |
MA | Корень 1 | 1,3333 | 0,0000 | 1,3333 | 0,0000 |
Корень 2 | 2,6850 | 0,0000 | 2,6850 | 0,0000 |
Модель (2) уступает модели (1) по всем показателям качества: во-первых, критерии Шварца и Акаике здесь выше, во-вторых, в модели появилось несколько незначимых лагов. Поэтому, будем отдавать предпочтение модели (1).
Попробуем улучшить модель (1), прибегая к учету сезонности. Добавим первую разность сезонной компоненты и первый порядок МА. Получим модель (3):
Модель 3: ARIMA, использованы наблюдения 1981:3-2004:4 (T = 94)
Зависимая переменная: (1-Ls) d_d_A
Стандартные ошибки рассчитаны на основе Гессиана
Коэффициент | Ст. ошибка | z | P-значение | ||
const | 0,00731114 | 0,00119846 | 6,1004 | <0,00001 | *** |
theta_1 | -1 | 0,0532804 | -18,7686 | <0,00001 | *** |
Theta_1 | -0,999986 | 0,216516 | -4,6185 | <0,00001 | *** |
Среднее зав. перемен | 0,038700 | Ст. откл. зав. перемен | 1,995767 | |
Среднее инноваций | 0,019520 | Ст. откл. инноваций | 1,087806 | |
Лог. правдоподобие | -151,9717 | Крит. Акаике | 311,9435 | |
Крит. Шварца | 322,1166 | Крит. Хеннана-Куинна | 316,0527 |
Действительная часть | Мнимая часть | Модуль | Частота | ||
MA | Корень 1 | 1,0000 | 0,0000 | 1,0000 | 0,0000 |
MA (сезонные) | Корень 1 | 1,0000 | 0,0000 | 1,0000 | 0,0000 |
При переходе к модели (3) критерии Шварца и Акаике дополнительно снизились в сравнении с моделью (1), к тому же, дополнительно учтенная сезонная компонента оказался значимой на 1%м уровне. Останавливаясь на модели (3), обратим также внимание на график коррелограммы остатков (при рассмотрении 20 лагов):
Все представленные остатки статистически незначимо отличаются от нуля, а значит, остатки данной модели описываются процессом белого шума, как и должно быть. Будем считать, что модель (3), модель ARIMA (0,2,1) для ряда А, является наиболее удачной. Ряд А будет описываться регрессией следующего вида: