Глава 3. временные ряды. гетероскедастичность и автокоррелированность

В качестве примера модели множественной линейной регрессии рассмотрим обобщение предыдущей задачи. Имеются следующие данные (условные) о сменной добыче угля на одного рабочего глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru (т), мощности пласта (ранее обозначалась ) и уровне механизации работ (%), характеризующие процесс добычи угля в 10 шахтах:

В предположении, что между переменными глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , и существует линейная регрессионная зависимость:

1) найти ее аналитическое выражение (уравнение регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru по и ),

2) найти 95%-ные доверительные интервалы для индивидуального и среднего значений сменной добычи угля на 1 рабочего для таких же шахт,

3) проверить значимость коэффициентов регрессии и построить для них 95%-ные доверительные интервалы,

4) найти интервальную оценку для дисперсии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

1) Модель множественной линейной регрессии можно представить в виде:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru е наблюдение зависимой переменной ( ),

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru объясняющие переменные,

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru я случайная составляющая, характеризующая отклонение от функции регрессии.

Введем обозначения: глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru матрица-столбец, или вектор, значений зависимой переменной размера ; матрица-столбец, или вектор,параметров размера глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ; матрица-столбец, или вектор, возмущений (случайных ошибок, остатков) размера ;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

- матрица-столбец, или вектор, значений объясняющих переменных размера глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ; в матрицу дополнительно введен столбец, все элементы которого равны 1, т.е. предполагается, что свободный член глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru умножается на фиктивную переменную , принимающую значение 1 для всех : .

Тогда в матричной формемодель множественной линейной регрессии примет вид:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Оценкой этой модели по выборке является уравнение

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , .

Для оценки вектора неизвестных параметров глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru применим метод наименьших квадратов, согласно которому вектор неизвестных параметров глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru выбирается таким образом, чтобы сумма квадратов отклонений эмпирических значений от значений глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , найденных по уравнению регрессии, была минимальной:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

при этом используется свойство произведения глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . С учетом свойства транспонирования произведения матриц после раскрытия скобок условие минимизации примет вид:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Можно доказать, что задача минимизации функции глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru сводится к определению вектора неизвестных параметровиз следующего матричного уравнения:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

при этом матрица глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru сумм первых степеней, квадратов и попарных произведений наблюдений и вектор произведений глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru наблюдений объясняющих и зависимой переменных имеют вид:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , .

Решением матричного уравнения глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru является вектор

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru матрица, обратная матрице коэффициентов , матрица-столбец, или вектор, ее свободных членов.

Зная вектор глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , выборочное уравнение множественной регрессии можно представить в виде:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru групповая (условная) средняя переменной при заданном векторе значений объясняющей переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Для заданного примера

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , .

Для удобства вычислений составляем вспомогательную таблицу.


										5,13	0,016
										8,79	1,464
										9,64	0,130
										5,98	1,038
										5,86	0,741
										6,23	0,052
										6,35	0,121
										5,61	0,377
										5,13	0,762
										9,28	1,631
										−	4,701

Вычислим матрицу глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru сумм первых степеней, квадратов и попарных произведений наблюдений и вектор произведений глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru наблюдений объясняющих и зависимой переменных:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , .

Матрицу глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru определим по формуле , где определитель матрицы ; матрица, присоединенная к матрице глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . В результате получим:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Умножая эту матрицу на вектор глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , получим:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

С учетом равенства глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru уравнение множественной регрессии имеет вид:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Оно показывает, что при увеличении только мощности пласта глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru (при неизменном ) на 1 м добыча угля на одного рабочего увеличивается в среднем на 0,854 т, а при увеличении только уровня механизации работ глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru (при неизменном ) – в среднем на 0б367 т.

Добавление в регрессионную модель объясняющей переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru изменило коэффициент регрессии с 1,016 для парной регрессии до 0,854 – для множественной регрессии. Это объясняется тем, что во втором случае коэффициент регрессии позволяет оценить прирост зависимой переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru при изменении на единицу объясняющей переменной в чистом виде, независимо от . В случае парной регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru учитывает воздействие на не только переменной , но и косвенно корреляционно связанной с ней переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

2) Формулы, используемые при построении доверительных интервалов для индивидуального и среднего значений, можно получить из аналогичных формул парной модели, изменив число степеней свободы глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru на . Так, 95%-ный доверительный интервал для индивидуального значения можно рассчитать по формуле:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . С учетом того, что и (т) окончательно получим:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru или (т).

Итак, с надежностью 0,95 индивидуальная сменная добыча угля на одного рабочего в шахтах с мощностью пласта 8 м и уровнем механизации 6% находится в пределах от 3,05 до 7,93 т.

3) Проверим значимость коэффициентов регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и . Коэффициент значимо отличается от нуля (иначе – гипотеза о равенстве параметра нулю, т.е. глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru : , отвергается) на уровне значимости , если

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru табличное значение критерия Стьюдента, определенное на уровне значимости при числе степеней свободы глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . Отсюда следует соотношение для построения доверительного интервала для параметра :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Итак, значимость коэффициентов регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru проверяется путем расчета средних квадратичных отклонений (стандартных ошибок) этих коэффициентов по формуле

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

(где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru диагональный элемент матрицы ) и использования табличного значения :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , ;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , .

Из неравенств глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и следует, что коэффициент значим, а коэффициент незначим.

Доверительный интервал имеет смысл построить только для значимого коэффициента глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . Подстановка числовых данных в соотношение

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

дает:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru или .

Итак, с надежностью 0,95 за счет изменения на 1 м мощности пласта глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru (при неизменном ) сменная добыча угля на одного рабочего будет изменяться в пределах от 0,322 до 1,376 (т).

4) Найдем 95%-ный доверительный интервал для дисперсии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , который в множественной регрессии строится аналогично парной модели по формуле

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

с соответствующим изменением числа степеней свободы критерия глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

С учетом соотношения глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru возьмем из таблицы распределения , и по этой формуле найдем 95%-ный интервал для параметра глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru или и .

Таким образом, с надежностью 0,95 дисперсия возмущений заключена в пределах от 0,565 до 5,349, а их стандартное отклонение – от 0,751 до 2,313 (т).

2.2. Свойства оценок, полученных методом наименьших квадратов (МНК)

Зависимая переменная глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru в теоретической модели регрессии

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

имеет две составляющие: неслучайную составляющую

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

и случайную составляющую глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . Получаемые с помощью МНК оценки коэффициентов регрессии также можно представить в виде двух составляющих – неслучайной и случайной.

Неслучайные составляющие оценок глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru равны параметрам , тогда как случайные составляющие этих оценок зависят от случайной составляющей теоретической модели регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

На практике разложить коэффициенты регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru на составляющие довольно затруднительно, так как значения и неизвестны.

Регрессионный анализ, основанный на применении метода наименьших квадратов (МНК), дает наилучшие из всех возможных результаты, если выполняются следующие условия (называемые условиями Гаусса-Маркова):

1. Математическое ожидание случайного слагаемого в любом глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru м наблюдении должно быть равно нулю – .

2. Дисперсия случайного слагаемого должна быть постоянной для всех наблюдений – глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , где теоретическое значение среднеквадратической ошибки.

3. Случайные слагаемые должны быть статистически независимы, т.е. должно выполняться свойство некоррелированности их между собой.

4. Объясняющие переменные глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru должны быть величинами неслучайными.

При выполнении условий Гаусса-Маркова модель

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

называется классической нормальной линейной регрессионной моделью. Наряду с условиями Гаусса-Маркова предполагается, что случайное слагаемое глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru имеет нормальное распределение. При этом предположении требование некоррелированности значений случайного слагаемого эквивалентно их независимости.

Первое условие означает, что нет постоянно действующего фактора, не включенного в модель, но оказывающего влияние на результативный фактор глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . Другими словами, случайное слагаемое не должно иметь систематического смещения. Если постоянное слагаемое включено в уравнение регрессии, то можно считать, что это условие выполняется автоматически, так как роль постоянного слагаемого как раз и заключается в том, чтобы учитывать постоянную тенденцию показателя глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , не учтенную в уравнении регрессии.

Если не выполнено это условие, то оценки параметров уравнения регрессии, поученное с помощью МНК, будут неэффективными и смещенными.

Второе условие означает, что дисперсия случайного слагаемого в каждом наблюдении имеет только одно значение. Другими словами, не должно быть априорной причины для того, чтобы в одних наблюдениях величина глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru была больше, чем в других, хотя на практике величина остатков уравнения регрессии в разных наблюдениях будет разной. Но ее величина заранее неизвестна, и одна из первоочередных задач регрессионного анализа состоит в ее оценке.

Если дисперсии случайного слагаемого зависят от номера наблюдения (т.е. выполняется условие гетероскедастичности), то оценки коэффициентов регрессии, полученные с помощью МНК, будут неэффективными и смещенными. Поэтому (по крайней мере, формально) можно получить более надежные оценки с использованием других методов.

Так как условия Гаусса-Маркова предполагают независимость дисперсии случайного слагаемого от номера наблюдения (т.е. предполагает выполнение условия гомоскедастичности), то разработаны специальные методы диагностирования и устранения гетероскедастичности. Характерная диаграмма рассеяния для одного из возможных вариантов гетероскедастичности показана на рис. 2.

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru

Рис. 2. Случай гетероскедастичности остатков

Третье условие указывает, что между значениями случайного слагаемого в разных наблюдениях нет систематической связи, т.е. указывает на некоррелированность (на независимость) случайных слагаемых для разных наблюдений. Если это условие нарушается (например, для временных рядов), то имеет место автокорреляция остатков, оценки коэффициентов регрессии, полученные МНК, оказываются неэффективными. Существуют методы диагностирования и устранения автокорреляции.

Если четвертое условие (о том, что объясняющие переменные должны быть неслучайными) не выполняется, то оценки коэффициентов регрессии оказываются смещенными и несостоятельными.

Теорема Гаусса-Маркова

Если перечисленные четыре условия выполняются, то оценки, сделанные с помощью МНК, являются наилучшими оценками, так как они обладают свойствами:

1) несмещенности, что означает отсутствие систематической ошибки в положении линии регрессии;

2) эффективности – имеют наименьшую дисперсию в классе всех линейных несмещенных оценок;

3) состоятельности – при достаточно большом объеме данных оценки приближаются к истинным значениям.

Если условия Гаусса-Маркова не выполнены, то можно найти другие оценки параметров уравнения регрессии, которые будут более эффективными по сравнению с оценками, найденными методом МНК.

Кроме того, если не выполнены условия Гаусса-Маркова, то становятся неприменимы t-тесты и тест Фишера на качество оценивания и адекватность уравнения регрессии.

2.3. Анализ вариации зависимой переменной. Качество оценивания в модели множественной линейной регрессии

Пусть в уравнении регрессии содержится глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru объясняющих переменных. Дисперсию зависимой переменной можно представить в виде суммы объясненной и необъясненной составляющих:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru остаток в м варианте реализации событий;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru значение зависимой переменной в м варианте реализации событий;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru среднее значение зависимой переменной;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru расчетное значение зависимой переменной в м варианте реализации событий, определяемое уравнением регрессии;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru число реализации событий, в каждом из которых при сочетании значений независимых переменных было получено значение зависимой переменной.

Каждая сумма в этом разложении имеет собственное название:

· глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ― общий разброс зависимой переменной (обозначается );

· глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ― разброс, объясненный регрессией (обозначается );

· глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ― разброс, не объясненный регрессией (обозначается ).

Используя введенные обозначения, разложение дисперсии зависимой переменной можно записать в виде суммы:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Мерой объясняющего качества уравнения регрессии по сравнению с оценкой в виде среднего значения глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru является коэффициент детерминации , который измеряет долю дисперсии, совместно объясненной всеми независимыми переменными:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

В случае коррелированности независимых переменных объясняющие способности этих переменных могут перекрываться. Для компенсации такого увеличения глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru вводится приведенный (скорректированный) коэффициент детерминации с поправкой на число независимых переменных, которым можно варьировать (называемое иначе числом степеней свободы):

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Если при добавлении новой переменной (при этом уменьшается на 1 число степеней свободы) увеличение доли объясненной регрессии мало, то скорректированный коэффициент детерминации глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru может уменьшаться, следовательно, добавлять новую переменную не следует.

Качество оценок для модели множественной линейной регрессии предполагает определение статистической значимости полученных коэффициентов уравнения регрессии и коэффициента детерминации глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Значимость коэффициентов уравнения регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru оценивается с помощью критерия :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru стандартные ошибки коэффициентов регрессии.

Величина глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru имеет распределение Стьюдента с степенями свободы, где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru число пар данных в выборке, использованных для получения уравнения регрессии;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru количество коэффициентов в уравнении регрессии.

Алгоритм оценки значимости для коэффициентов уравнения регрессии состоит в следующем:

1) вычисляется наблюдаемое значение критерия глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ;

2) по таблице распределения Стьюдента по заданному уровню значимости и числу степеней свободы глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru находится критическое значение ;

3) вычисленные критерии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и сравниваются с критическим значением .

Если глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , то соответствующий коэффициент уравнения регрессии значим и принимается. Если , то соответствующий коэффициент уравнения регрессии незначим, не отличается от нуля и не принимается.

В эконометрике проверку гипотез осуществляют при 5%-м, реже на 10%-м уровне значимости. В первом случае стандартная ошибка оценки коэффициента регрессии составляет примерно до половины его величины. Последовательное исключение несущественных факторов (переменных), коэффициенты при которых оказались незначимы, составляют основу пошагового регрессионного анализа.

Для определения статистической значимости коэффициента детерминации глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru используется статистика:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

Величина глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru имеет распределение Фишера с степенями свободы. Вычисленный критерий сравнивается с критической величиной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru следующим образом:

если глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , то считается незначимым, он не отличим от нуля;

если глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , то считается значимым, и уравнение регрессии может использоваться для объяснения изменения переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru под влиянием изменения переменных .

Величины критических значений критериев оценки значимости принимаются при 5%-м, реже при 10%-м уровне значимости. Указанные уровни значимости соответствуют 95%-му и 90%-му доверительным интервалам соответственно.

2.4. Дополнительные аспекты использования метода наименьших квадратов (МНК)

2.4.1. Влияние мультиколлинеарности

Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении множественной линейной регрессии. При наличии мультиколлинеарности оценки, формально полученные методом наименьших квадратов (МНК), обладают рядом недостатков:

1) небольшое изменение исходных данных приводит к существенному изменению оценок регрессии;

2) оценки имеют большие стандартные ошибки, малую значимость, в то время как модель в целом является значимой (при больших коэффициентах детерминации глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ).

Если при оценке уравнения регрессии несколько факторов оказались незначимыми, то нужно выяснить наличие среди них факторов, сильно коррелированных между собой. При наличии корреляции один из пары связанных между собой факторов исключается. Если статистически незначим лишь один фактор, то он должен быть исключен или заменен другим показателем. В модель регрессии включаются те факторы, которые более сильно связаны с зависимой переменной, но слабо связаны с другими факторами.

2.4.2. Спецификация переменных в уравнениях множественной линейной регрессии

Построение эконометрической модели включает в себя обоснование решения о том, какие объясняющие переменные необходимо включить в уравнение множественной линейной регрессии, т.е. как правильно составить спецификацию модели, от которой в значительной степени зависят свойства оценок коэффициентов регрессии. Здесь возможны две ситуации.

1) В модели отсутствует переменная, которая должна быть включена.

Предположим, что переменная глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru зависит от двух переменных. Однако в модель включена только одна независимая переменная глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

В этом случае оценка глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и ее дисперсия являются смещенными. Смещенность оценки связана с тем, что при отсутствии второй переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru в регрессии переменная играет двойную роль: отражает свое прямое влияние и заменяет переменную глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru в описании ее влияния. Для данной регрессии коэффициент детерминации , отражающий общую объясняющую способность переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru в обеих ролях, завышен.

2) В модели включена переменная, которая не должна быть включена.

В этом случае оценки коэффициентов регрессии и их дисперсии являются несмещенными, но не эффективными. Если обнаруживается, что коэффициенты при излишних переменных статистически незначимы, то эти переменные исключаются из модели.

2.4.3. Фиктивные переменные

При исследовании влияния качественных признаков на объясняемую (зависимую) переменную глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru в модель множественной линейной регрессии следует вводить фиктивные переменные, принимающие, как правило, два значения: 1, если данный признак присутствует в наблюдении; 0 – при его отсутствии.

Если включаемый в рассмотрение качественный признак имеет не два, а несколько значений, то используют несколько фиктивных переменных, число которых должно быть на единицу меньше числа значений признака. При назначении фиктивных переменных исследуемая совокупность по числу значений качественного признака разбивается на группы. Одну из групп выбирают как эталонную и определяют фиктивные переменные для остальных.

Если качественный признак имеет два значения, то достаточно ввести одну фиктивную переменную. Например, строится модель, характеризующая показатели предприятий двух отраслей промышленности: электроэнергетики и газовой промышленности. Вводится фиктивная переменная, которой присваивается значение 0, если данные относятся к предприятиям электроэнергетики, и значение 1, если данные относятся к предприятиям газовой промышленности.

При трех значениях качественного признака следует вводить две фиктивные переменные. Например, строится модель, характеризующая показатели предприятий трех регионов. Вводится одна фиктивная переменная, которой присваивается значение 0, если данные относятся к предприятиям первого региона, и значение 1, если данные относятся к предприятиям двух других регионов. Второй фиктивной переменной присваивается значение 0, если данные относятся ко второму региону, и значение 1, если данные относятся к первому и третьему регионам.

Введение в регрессию фиктивных переменных существенно улучшает качество оценивания.

2.4.4. Сведение нелинейных регрессий к линейным моделям

Нелинейность регрессии может иметь место в части как переменных, так и параметров. Нелинейность по переменной можно устранить заменой переменных. Например, нелинейные уравнения

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и

заменами переменных глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и соответственно сводятся к линейным уравнениям:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и .

Нелинейность по параметру может устраняться различными способами. Наиболее часто нелинейность этого типа устраняется путем логарифмического преобразования уравнения. Например, нелинейные уравнения

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и

после логарифмирования сводится к линейным уравнениям относительно новых переменных и параметров глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и .

В общем случае параметры нелинейных уравнений регрессии оцениваются с использованием алгоритмов и программ, реализующих численные методы. Современные статистические пакеты программ для ПЭВМ позволяют оценивать параметры нелинейных уравнений регрессии любого типа.

2.5. Прогнозирование с помощью регрессионных уравнений

Прогнозирование – это получение оценок зависимой переменной для некоторого набора независимых переменных, отсутствующего в исходных данных. Различают точечное прогнозирование (с получением точечной оценки) и интервальное прогнозирование. В первом случае оценкой является некоторое число, во втором – интервал, в котором находится истинное значение зависимой переменной с заданным уровнем вероятности (значимости).

Точечная оценка может быть наиболее просто представлена в случае линейной модели парной регрессии:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и коэффициенты уравнения регрессии;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru значение зависимой переменной , предсказанное с использованием уравнения регрессии;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru значение независимой переменной , для которого необходимо предсказать величину зависимой переменной.

Ошибка предсказания представляет собой разность между предсказанным и действительным значениями. Для оценки этой ошибки определяется стандартная ошибка предсказания, которая для случая линейной регрессии определяется выражением:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru стандартная ошибка предсказания;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru стандартная ошибка регрессии;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru число пар данных, используемых для регрессионного анализа;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru значение независимой переменной, для которого дается прогноз;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru выборочное среднее переменной ;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru вариация переменной в выборке.

Чем больше значение глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru отклоняется от выборочного среднего , тем больше дисперсия ошибки предсказания; чем больше объем выборки глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , тем меньше дисперсия этой ошибки.

Доверительный интервал для прогнозируемого значения зависимой переменной глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru определяется по формуле:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru критическое значение статистики Стьюдента при заданном уровне значимости и числе степеней свободы (для парной линейной регрессии глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru );

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru число пар данных в выборке, использованных для получения уравнения регрессии.

ГЛАВА 3. ВРЕМЕННЫЕ РЯДЫ. ГЕТЕРОСКЕДАСТИЧНОСТЬ И АВТОКОРРЕЛИРОВАННОСТЬ

3.1. Временные ряды и их моделирование с применением фиктивных переменных

Временной ряд – это совокупность значений какого-либо показателя за несколько последовательных моментов времени. Значение глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru временного ряда формируется под влиянием сочетания длительных, кратковременных и случайных факторов. Факторы, действующие в течение длительного времени, оказывают определяющее влияние на изучаемое явление и формируют основную тенденцию ряда – тренд глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . Периодические факторы формируют сезонные колебания ряда . Случайные факторы отражаются случайными изменениями уровней ряда глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Аддитивнаямодель, в которой ряд представлен как сумма перечисленных компонент, имеет вид:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Модель, в которой ряд представлен как произведение перечисленных компонент, называется мультипликативной:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

Из двух моделей указанного типа на основе анализа сезонных колебаний выбирается та, которая наиболее соответствует исходным статистическим данным.

Основная задача экономического исследования временного ряда состоит в том, чтобы выявить каждую из перечисленных компонент ряда. Так, при постоянной (или близкой к ней) амплитуде сезонных колебаний используется аддитивную модель; при существенно меняющейся (возрастающей или убывающей) амплитуде сезонных колебаний используется мультипликативную модель.

Для моделирования временных рядов используют модели парной линейной и нелинейной регрессии, множественной линейной и нелинейной регрессии и другие, специально разработанные модели.

3.2. Моделирование временных рядов с применением фиктивных переменных

Методические особенности построения модели временного ряда рассмотрим на примере ряда, учитывающую основную его тенденцию – тренд – и сезонные колебания с использованием фиктивных переменных.

Предположим, что сезонность можно учесть колебаниями моделируемой переменной по кварталам. Первый квартал каждого года будем считать эталонным кварталом, а для оценки различия между ним и другими кварталами будем использовать три фиктивные переменные. Тогда модель временного ряда представима в виде уравнения множественной линейной регрессии:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru зависимая – объясняемая переменная;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru время;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и фиктивные переменные;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и параметры уравнения регрессии;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru случайное слагаемое.

Фиктивные переменные, введенные в уравнение, определяются следующим образом:

Переменная	1 квартал	2 квартал	3 квартал	4 квартал
z₁
z₂
z₃

3.3. Автокорреляция уровней временного ряда

Между значениями временного ряда на отдельных его участках может иметь место корреляционная связь. Корреляционная зависимость между последовательными уровнями коэффициента автокорреляции временного ряда называется автокорреляцией уровней ряда.

Коэффициент автокорреляциипорядка глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru определяется как коэффициент корреляции между рядом и рядом его смещенных значений глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru :

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ковариация переменных и ;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и вариации переменных и .

Число периодов глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru , для которого рассчитывается коэффициент автокорреляции, называется лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается или остается постоянным в зависимости от используемой методики оценки.

Последовательность коэффициентов автокорреляции первого, второго и более высоких порядков (называемая автокорреляционной функциейвременного ряда) обычно используется для того, чтобы выявить во временном ряде наличие трендовой и сезонных компонент или обосновать отсутствие этих компонент. При явном преобладании коэффициента автокорреляции первого порядка в исследуемом ряде главную роль играет основная тенденция – тренд. При явном преобладании коэффициентов автокорреляции порядка глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ряд содержит также сезонные колебания с периодом .

3.4. Обнаружение гетероскедастичности. Метод Голдфельда-Квандта

Важнейшей предпосылкой регрессионного анализа является предположение о постоянстве дисперсии случайного слагаемого для всех наблюдений, т.е. гомоскедастичность. Это значит, что для каждого значения объясняющей переменной случайные слагаемые имеют одинаковые дисперсии. Если это условие не соблюдается, то имеет место гетероскедастичность.

Разработаны различные методы обнаружения гетероскедастичности, в которых делаются различные предположения о зависимости между дисперсией случайного слагаемого и величиной объясняющих переменных (например, тест Голдфельда-Квандта).

Метод Голдфельда-Квандта

Обнаружение гетероскедастичности с использованием этого метода основывается на предположении о том, что стандартное отклонение случайного слагаемого глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru пропорционально значению независимой переменной .

Этапы проверки:

1. Все глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru наблюдений в выборке упорядочиваются по возрастанию переменной .

2. Оцениваются отдельно регрессия для глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru первых и регрессия для последних наблюдений. Средние наблюдений отбрасываются.

3. Составляется статистика:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru и суммы квадратов остатков для первых и последних наблюдений соответственно.

Если верна гипотеза об отсутствии гетероскедастичности, то глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru имеет распределение Фишера с степенями свободы, где число объясняющих переменных в уравнении регрессии.

По таблице распределения Фишера определяется критическое значение критерия глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru . Если , то гипотеза об отсутствии гетероскедастичности отклоняется.

Метод Голдфельда-Квандта можно также использовать для обнаружения гетероскедастичности и в том случае, если стандартное отклонение случайного слагаемого обратно пропорционально значениям независимой переменной. В этом случае тестовой статистикой является величина

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru .

3.5. Обобщенный метод наименьших квадратов (ОМНК)

Из-за неэффективности оценок, полученных методом наименьших квадратов (МНК) при наличии гетероскедастичности, используется обобщенный (взвешенный) метод наименьших квадратов (ОМНК). В этом методе вклад данных наблюдений, имеющих большую дисперсию, уменьшается.

В качестве примера рассмотрим теоретическую линейную регрессионную модель с двумя переменными:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru ,

где:

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru – объясняющая (независимая) переменная – неслучайная величина;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru - объясняемая (зависимая) переменная;

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru – случайное слагаемое (ошибка регрессии);

глава 3. временные ряды. гетероскедастичность и автокоррелированность - student2.ru порядковый номер наблюдения за реализацией событий;

α и β – параметры уравнения.

Наши рекомендации

Временные ряды и прогнозирование

Стационарные и нестационарные временные ряды

Временные ряды и прогнозирование

Временные ряды в эконометрических исследованиях

Нестационарные временные ряды

Раздел 4. Временные ряды

Временные ряды. Авторегрессия

Временные ряды в эконометрических исследованиях

Временные ряды в эконометрических

← Предыдущая страница | Следующая страница →