Модель временного ряда «Среднемесячные удои молока» с трендом вида
Модель временного ряда «Среднемесячные удои молока» с трендом вида
Модель временного ряда «Среднемесячные удои молока» с трендом вида
Модель временного ряда «Среднемесячные удои молока» с трендом вида
Модель временного ряда «Среднемесячные удои молока» с трендом вида
Модель временного ряда «Среднемесячные удои молока» с трендом вида
Проведем сравнительный анализ полученных моделей.
Остатки всех моделей примерно одинаково неслучайно распределены на графиках их зависимости от времени (наблюдается определенная закономерность в расположении остатков на графиках). Выбор наилучшей модели будем осуществлять с помощью сравнения и .
Ею будет являться модель №1, а именно, , т.к. она имеет наибольшее значение и наименьшее значение , т.е. наиболее точно описывает исходные данные.
По графику остатков наилучшей модели (как, впрочем, и всех остальных) видно, что остатки не имеют примерно одинакового среднего значения, равного нулю, и примерно постоянной дисперсии, следовательно, мы можем предположить, что нарушается предположение о независимости остатков (остатки коррелированны), значит, необходимо проверить ряд на наличие автокорреляции в остатках.
Для этого произведем расчет статистики Дарбина-Уотсона.
Выдвинем гипотезу : отсутствие автокорреляции в остатках, а также альтернативные гипотезы и : наличие положительной и отрицательной автокорреляций в остатках.
Вычислим статистику Дарбина-Уотсона по формуле:
где – коэффициент автокорреляции первого порядка и вычисляется так:
, где ,
= 42,2196
=27,97
,
Следовательно, мы видим, что статистика Дарбина-Уотсона принимает значение, равное .
Наша модель имеет вид , следовательно, =3+1=4 (количество объясняющих переменных в модели, включая сезонность), а =55. Значит, статистики Дарбина-Уотсона и принимают следующие критические значения:
=1,41
=1,72
Разобьем промежуток [0;4]с помощью найденных табличных значений на 5 частей:
[0;1,41], [1,41; 1,72], [1,72;2,28], [2,28; 2,59], [2;59,4]
Как видим, расчетное значение статистики попадает в первый промежуток, следовательно, гипотеза отвергается в пользу гипотезы о наличии положительной автокорреляции.
Отметим, что на графике временного ряда «Среднемесячные удои молока (галлоны)» предположительно наблюдаются структурные изменения, следовательно, нужно выдвинуть гипотезу о структурной стабильности и проверить ее с помощью теста Чоу и подхода Гуйарати.
Далее, если окажется, что наши предположения верны и для наиболее эффективного описания исходных данных нужно использовать кусочную модель, произведем проверку вновь полученных моделей на автокорреляцию в остатках.
А именно, на графике присутствует точка с координатой , равной 40 месяцам, в которой может происходить это изменение, что связано с какими-либо глобальными событиями или/и изменениями общей экономической ситуации.
В нашем случае таким глобальным событием для Робинзона вполне мог явиться перевод коз в новый загон после того, как он заметил, что на старом месте расположения стало ухудшаться качество, а тем более количество травы, которая росла на участке, следовательно, для всего стада ее перестало хватать, как впрочем, не хватало и времени вырасти новой траве.
Значит, проверим гипотезу : наличие структурной стабильности.
Рассмотрим случай, когда =40, т.е. модель (1) описывает данные за первые три года и еще четыре месяца, а модель (2) – все остальные наблюдения (восемь месяцев четвертого и семь месяцев последнего (пятого) года наблюдений).
Построим таблицу:
Уравнение | Вид | Число наблю дений | ESS | Число параметров | Число степеней свободы |
(1) | 24,72 | ||||
(2) | 1,66 | ||||
(3) | 42,21 |
Используя для оценивания неизвестных параметров метод наименьших квадратов, получим, что:
Построим графики получившихся моделей:
По графику довольно сложно сделать какой-либо вывод о том, значительное изменение каких конкретно параметров произошло, а следовательно, какую модель следует использовать, т.к. тренд имеет нелинейный вид.
Рассчитаем
Проверим гипотезу о структурной стабильности:
Если F>Fкр., то гипотеза отвергается, значит, предположение о структурной стабильности не верно, для улучшения характеристики выбранной модели исходных данных необходимо использовать кусочную модель.
Следовательно, действительно существует такое =40, в момент которого происходят определенные структурные изменения (глобальное для Робинзона событие – перегон овец в новый загон).
Произведем формальную проверку значимости изменений отдельных параметров уравнения с помощью подхода Гуйарати, который основан на введении фиктивной переменной.
Пусть
Рассмотрим уравнение:
При
При
Значит,
Оценка статистической значимости (различий параметров), а также , , эквивалентна статистической значимости уравнения Гуйарати. Воспользуемся основным преимуществом данного подхода, которое состоит в том, что необходимо оценивать параметры только одного уравнения, а не трех, как в тесте Чоу, и оценим параметры полученного уравнения:
После выдвижения гипотезы: , рассчитаем t-статистику по формуле: , сравним ее расчетное и критическое значения и сведем полученные результаты в следующую таблицу:
Параметр | Значение параметров | Расчетное значение -статистики Стьюдента | Критическое значение -статистики Стьюдента | Значимость параметра |
35182,9 | 1,41 | 2,00 | Не значим | |
486069,5 | -1,42 | 2,00 | Не значим | |
-486017 | 1,42 | 2,00 | Не значим | |
-1148324 | -1,42 | 2,00 | Не значим |
Как видим, все параметры являются незначимыми, а следовательно, являются незначимыми и разности , , , , значит для описания зависимости среднемесячных удоев молока от времени, исходя из результатов подхода Гуйарати, лучше было бы использовать единую модель.
Результаты, полученные по этому методу, не совпадают с теми, которые были получены нами выше, в тесте Чоу. Можно предположить, что это вызвано неверной спецификацией модели, а также не слишком удачно подобранной критической точкой =40 (в этот момент происходят определенные структурные изменения: глобальное для Робинзона событие – перегон овец в новый загон), которая была взята в малом количестве. Возможно, при увеличении числа критических точек, в которых предположительно могут наблюдаться структурные изменения (другие глобальные события во время пребывания Робинзона на острове, например, до того, как он решил перевести всех коз в другой загон, ему не стало хватать молока для собственного потребления и производства из него сыра, масла и т.д.), результаты двух подходов могли бы совпасть и полученная модель (кусочная или единая) наиболее точно описывала бы исходные данные.
Попытаемся все же определиться с необходимой моделью: для этого построим графики исходных данных, а также единой и двух кусочных моделей:
Как видим по графику, до =40 первая часть кусочной модели почти сливается с единой, но все же в некоторых местах она не явно, но все-таки превосходит вторую по точности описания исходных данных, например, в таких точках, как =28, 30, 31 и т.д., вплоть до =40. Если же говорить о второй части кусочной модели, то можно сказать, что она гораздо лучше описывает исходные данные, нежели единая, особенно на участке, где меняется от 41 до 45.
Исходя из всего вышесказанного, можно сделать вывод, что для дальнейшего исследования, все же лучше будет рассматривать кусочную модель для зависимости среднемесячных удоев молока от времени с трендами вида:
( 40)
( >40)
Как говорилось выше, необходимо проверить вновь полученные модели на автокорреляцию в остатках. Для этого, как и раньше, сначала построим графики зависимости остатков обеих моделей от времени, а потом рассчитаем статистику Дарбина-Уотсона.
График остатков выглядит следующим образом:
Рассмотрим сразу обе части кусочной модели с трендами вида:
( 40)
( >40)
По графику можно предположить, что у моделей с такими видами тренда остатки расположены неслучайно (существует определенная закономерность в расположении остатков во времени).
Для того, чтобы проверить остатки в обеих моделях на наличие автокорреляции произведем расчет статистики Дарбина-Уотсона.
Выдвинем гипотезу : отсутствие автокорреляции в остатках, а также альтернативные гипотезы и : наличие положительной и отрицательной автокорреляций в остатках.
Вычислим статистику Дарбина-Уотсона по формуле:
где – коэффициент автокорреляции первого порядка и вычисляется так:
, где ,
Все полученные результаты по обеим моделям занесем в следующую таблицу, где укажем необходимые для расчета статистики и сделаем соответствующий вывод о наличии или отсутствии автокорреляции в остатках:
Модель | Автокорреляция | |||||
( 40) | 24,72 | 0,41 | 1,18 | 1,29 | 1,72 | отв. в пользу о наличии положительной автокорреляции. |
( >40) | 1,66 | 0,22 | 1,56 | 0,69 | 1,97 | Нельзя сделать никаких выводов |
Также можно отметить такие немаловажные характеристики моделей, как коэффициент детерминации и расчетное значение -статистики Фишера.
, где - число наблюдений, - число параметров в рассматриваемой модели.
Модель | Значимость | |||||
( 40) | 0,75 | 35,43 | 2,84 | Модель значима | ||
( >40) | 0,94 | 55,72 | 3,29 | Модель значима |
Из приведенных таблиц видим, что первая часть кусочной модели с трендом вида содержит автокорреляцию в остатках. Т.к. ее наличие может привести к нежелательным последствиям, а именно к увеличению стандартных ошибок (широких доверительных интервалов), снижению значений по t-критерию Стьюдента (ошибочных выводах о значимости), неэффективности оценок в смысле теоремы Гаусса-Маркова, нужно скорректировать временной ряд с целью исключения автокорреляции в остатках.
Попробуем провести корректировку модели тренда и найти для нее новые оценки параметров. Запишем исходную модель тренда для момента времени , умножим ее левую и правую части на коэффициент корреляции первого порядка между et и et-1 ( ), а затем почленно вычтем полученное уравнение из исходного.
Процедура коррекции состоит в том, что исходные данные и преобразуются в новые - и (где - преобразованные значения моментов времени, а - преобразованные значения модельного тренда по ряду «Среднемесячные удои молока»).
, для каждой экзогенной переменной, входящей в тренд модели.
Остальные параметры уравнения тренда остаются прежними.
Применим обычный МНК и найдем оценки всех параметров с учетом произведенной замены.
Далее обратным преобразованием находим: , где (коэффициент автокорреляции первого порядка).
Таким образом, в результате коррекции получаем модель тренда с новыми оценками параметров:
Обратным преобразованием получили: .
С помощью корректировки получим уравнение тренда с новыми параметрами:
Затем получим расчетные значения трендовой компоненты для каждого наблюдения соответственно и с учетом сезонных колебаний найдем модельные значения и остатки модели:
Проверим остатки полученной после коррекции модели на автокорреляцию, предварительно построив их график:
По графику можно сделать предварительный вывод о том, что остатки новой модели опять-таки являются коррелированными, т.е. нарушается предположение о независимости остатков. Следовательно, вычислим статистику Дарбина-Уотсона по формуле:
где – коэффициент автокорреляции первого порядка.
После расчетов сведем все показатели по предыдущей и скорректированной моделям в одну таблицу:
Модель | Авто кор. | |||||||
До коррекции | 24,72 | 0,41 | 1,18 | 1,29 | 1,72 | Пол. | 0,75 | 35,43 |
После коррекции | 73,2 | 0,6 | 0,62 | 1,29 | 1,72 | Пол. | 0,25 | 4,03 |
Как видим, расчетное значение статистики попадает в первый промежуток, следовательно, гипотеза отвергается в пользу гипотезы о наличии положительной автокорреляции, а значит, проведенная корректировка оказалась безрезультатной с точки зрения улучшения модели.
Кроме того, расчетное значение коэффициента детерминации после проведения корректировки значительно снизилось (= 0,25, до этого оно составляло 0,75), и полученная модель является значимой по критерию Фишера (= 4,03; = 2,84), но меньше, чем ранее (= 35,43).
Следовательно, в новой модели, которая была получена путем корректировки, усилилась положительная автокорреляция в остатках (стало еще ближе к нулю).
Поэтому обоснованным будет в дальнейшем продолжать исследование аддитивной модели ряда «Среднемесячные удои молока» с функциями тренда, которые были рассмотрены выше.
Следовательно, окончательно модель временного ряда будет выглядеть следующим образом:
для ( 40),
а также
для ( >40)
По этим моделям найдем остатки для всего ряда «Среднемесячные удои молока», которые будут использоваться в модели с распределенными лагами, а также построим прогнозы на пять лет вперед (а точнее, это будем делать по второй модели, т.к. >40).
Теперь построим модель для временного ряда «Месячный уровень осадков». Она будет иметь следующий вид:
- неслучайная, постоянная функция;
- неслучайная периодическая функция с периодом, кратным «сезону»;
- случайная составляющая.
Для начала определимся с постоянной компонентой, которая, как уже отмечалось выше, может быть рассчитана как среднее значение по ряду .
Имеем, что =30,55 мм. осадков. Следовательно, если не учитывать влияние сезона на уровень выпадения осадков на острове Робинзона, то можно отметить, что в среднем за рассматриваемый период он составил 30,55 мм. в месяц.
Далее, используя метод скользящего среднего, выровняем исходный ряд «Месячный уровень осадков». Для этого суммируем элементы ряда последовательно за каждые 12 месяцев со сдвигом на один момент времени и, разделив полученные суммы на 12, найдем скользящие средние. Для приведения в соответствие с фактическими моментами времени найдем центрированные скользящие средние. Получим:
Год | Месяц | ||||||||||||
27,5 | 31,9 | 29,8 | 31,7 | 29,6 | 24,1 | 33,1 | 31,8 | 38,7 | 34,9 | 27,3 | |||
Центр.ск.ср. | 30,46 | 30,52 | 30,60 | 30,63 | 30,64 | 30,63 | |||||||
27,7 | 33,1 | 30,6 | 31,6 | 24,3 | 23,4 | 31,8 | 38,8 | 35,6 | 27,2 | ||||
Центр.ск.ср | 30,57 | 30,54 | 30,53 | 30,54 | 30,57 | 30,60 | 30,64 | 30,67 | 30,67 | 30,69 | 30,70 | 30,76 | |
28,8 | 32,7 | 31,1 | 31,5 | 30,3 | 25,6 | 22,6 | 32,7 | 31,7 | 38,3 | 34,9 | |||
Центр.ск.ср | 30,78 | 30,74 | 30,72 | 30,70 | 30,65 | 30,53 | 30,38 | 30,33 | 30,30 | 30,28 | 30,32 | 30,33 | |
27,5 | 32,7 | 30,5 | 31,7 | 25,2 | 24,1 | 34,3 | 38,5 | 35,8 | |||||
Центр.ск.ср | 30,38 | 30,51 | 30,59 | 30,61 | 30,65 | 30,73 | 30,77 | 30,78 | 30,79 | 30,80 | 30,81 | 30,78 | |
27,3 | 33,2 | 30,3 | 32,1 | 30,8 | 24,6 | 22,5 | |||||||
Центр.ск.ср | 30,68 |
Теперь находим оценки сезонной компоненты S, которые определяются как разность между фактическими элементами ряда и центрированными скользящими средними. Получим:
Год | Месяц | ||||||||||||
- | - | - | - | - | - | -6,36 | 2,58 | 1,20 | 8,07 | 4,26 | -3,33 | ||
-2,87 | 2,56 | 0,07 | 1,06 | -0,57 | -6,30 | -7,24 | 2,33 | 1,13 | 8,11 | 4,90 | -3,56 | ||
-1,98 | 1,96 | 0,38 | 0,80 | -0,35 | -4,93 | -7,78 | 2,38 | 1,40 | 8,02 | 4,58 | -5,33 | ||
-2,88 | 2,19 | -0,09 | 1,09 | 0,35 | -5,53 | -6,67 | 3,52 | 1,21 | 7,70 | 4,99 | -4,78 | ||
-3,38 | - | - | - | - | - | - | - | - | - | - | - | ||
S среднее | -2,78 | 2,24 | 0,12 | 0,99 | -0,19 | -5,58 | -7,01 | 2,70 | 1,23 | 7,98 | 4,68 | -4,25 | |
S | -2,79 | 2,23 | 0,11 | 0,98 | -0,20 | -5,60 | -7,02 | 2,69 | 1,22 | 7,96 | 4,67 | -4,26 |
В нашей модели желательно выполнение условия взаимопогашения сезонных воздействий за период, т.е. . В нашей модели временного ряда «Месячный уровень осадков» . Следовательно, это условие не выполняется, значит, находим поправочный коэффициент и новые
Исключим влияние сезонной компоненты, вычитая ее значения из каждого элемента временного ряда. Получим :
Год | Месяц | ||||||||||||
30,29 | 29,67 | 29,69 | 30,72 | 29,80 | 30,60 | 31,12 | 30,41 | 30,58 | 30,74 | 30,23 | 31,56 | ||
30,49 | 30,87 | 30,49 | 30,62 | 30,20 | 29,90 | 30,42 | 30,31 | 30,58 | 30,84 | 30,93 | 31,46 | ||
31,59 | 30,47 | 30,99 | 30,52 | 30,50 | 31,20 | 29,62 | 30,01 | 30,48 | 30,34 | 30,23 | 29,26 | ||
30,29 | 30,47 | 30,39 | 30,72 | 31,20 | 30,80 | 31,12 | 31,61 | 30,78 | 30,54 | 31,13 | 30,26 | ||
30,09 | 30,97 | 30,19 | 31,12 | 31,00 | 30,20 | 29,52 | - | - | - | - | - |
Вычислим прогнозы и построим графики начальных данных и прогноза, а также остатков модели ( ).:
Как видно по вышеприведенному графику, модель почти идеально соответствует исходным данным, это и неудивительно, ее по подсчетам составил 0,98, что и характеризует ее как чрезвычайно подходящую для наших дальнейших действий.
Что же касается остатков, то по графику можно сделать вывод о том, что, скорее всего, они коррелированны, т.к. существует закономерность в их расположении на графике.
Для того, чтобы проверить остатки в обеих моделях на наличие автокорреляции произведем расчет статистики Дарбина-Уотсона.
Выдвинем гипотезу : отсутствие автокорреляции в остатках, а также альтернативные гипотезы и : наличие положительной и отрицательной автокорреляций в остатках.
Вычислим статистику Дарбина-Уотсона по формуле:
где – коэффициент автокорреляции первого порядка и вычисляется так:
, где ,
Все полученные результаты занесем в таблицу, где укажем необходимые для расчета статистики и сделаем соответствующий вывод о наличии или отсутствии автокорреляции в остатках:
Модель | Автокорреляция | ||||
0,25 | 1,49 | 1,29 | 1,72 | Нельзя сделать никаких выводов |
Имеем, что модель для временного ряда «Месячный уровень осадков» выглядит следующим образом:
По этой модели найдем остатки для нашего ряда, которые будут использоваться в модели с распределенными лагами, а также построим прогнозы на пять лет вперед.
Перейдем к модели с распределенными лагами. Для этого в качестве независимой переменной возьмем «месячный уровень осадков».
Оценим параметры получившегося уравнения с помощью метода Койка.
Выявим взаимосвязь между нашими временными рядами «Среднемесячные удои молока, галлоны» и «Месячный уровень осадков, мм.».
Изучение таких взаимосвязей – это самая сложная задача анализа. Как известно, если выявлено, что ряд содержит сезонную или циклическую компоненту, то перед дальнейшим анализом их нужно устранять, Задача выявления взаимосвязей временных рядов должна решаться только на остатках.
Следовательно, нам для анализа предоставлены остатки по двум временным рядам с целью дальнейшего выявления взаимосвязи между ними. Предполагается, что влияние каждого последующего элемента лаговой структуры меньше предыдущего и геометрическая структура Койка имеет вид:
, где
- значения остатков по временному ряду, который взят в зависимости за эндогенную переменную («Среднемесячные удои молока, галлоны») в момент времени ,
- значения остатков по временному ряду, который взят в зависимости за эндогенную переменную («Среднемесячные удои молока, галлоны») в момент времени ,
- значения остатков по временному ряду, который взят в зависимости за экзогенную переменную («Месячный уровень осадков, мм.») в момент времени ,
- коэффициенты в лаговой структуре,
- параметр, причем
-ошибка в момент времени .
Для того, чтобы заменить проблемную переменную в правой части модели, для которой нарушаются все предпосылки МНК, на новую переменную, удовлетворяющую 2-ум условиям: тесное коррелирование с и никакой корреляции с остатками, применим метод инструментальных переменных.
Одним из наиболее простых возможных вариантов применения этого метода является построение модели следующего вида:
-среднемесячные удои молока в момент времени ,
- месячный уровень осадков в момент времени .
Найденная потом с помощью МНК оценка может использоваться в качестве инструментальной переменной в модели.
Метод инструментальных переменных приводит к замене модели авторегрессии на модель с распределенными лагами. После применения МНК получим следующие оценки параметров: