Тема 4. эконометрический анализ в условиях нарушений классических предположений: проблемы мультиколлинеарности, автокорреляции и гетероскедастичности
В условиях статистических данных, получаемых в практической экономике, часто классические предположения регрессионной модели не выполняются.
1) Если имеется линейная связь экзогенных переменных, например , то МНК-оценки не будут существовать, т.к. не существует обратная к матрице , которая будет вырожденной. Такая ситуация в эконометрике носит название проблемы мультиколлинеарности.
2) Если нарушается гипотеза о взаимной независимости случайной переменной:
то возникает проблема автокорреляции, в рамках которой МНК-оценки не обладают несмещенностью.
3) Если нарушается гипотеза об равноточности измерения эндогенной переменной в различные моменты наблюдения, то возникает проблемагетероскедастичности, при которой
Для исследования и устранения этих проблем эконометрики необходимо проанализировать следующие вопросы:
а) каковы источники возникновения проблемы?
б) каковы последствия наличия проблемы?
в) как провести диагностику проблемы?
г) какие методы применить для устранения проблемы?
I. Начнем такой анализ с изучения проблемы мультиколли-нeaрности.
Данная проблема возникает как следствие двух основных причин: неправильной спецификации модели и небрежного проведения сбора статистических данных (использование повторных наблюдений).
Различают явнуюи неявную мультиколлинеарность.
Явная – предполагает известной точную линейную зависимость между переменными модели.
Например, если в модель инвестиционного процесса включить номинальную и реальную процентные ставки, т.е.
где известна зависимость реальной и номинальной ставок и темпа инфляции
то имеет место явная мультиколлинеарность.
Неявная возникает, когда существует стохастическая линейная зависимость между экзогенными переменными.
На практике преобладает неявная форма, наличие которой характеризуют шесть признаков:
1. МНК-оценки параметров модели теряют свойства несмещенности.
2. Дисперсия МНК-оценок действительно возрастает:
Вследствие того, что , коэффициент корреляции , тогда , что влечет
3. Происходит уменьшение t-статистик, являющихся индикаторами значимости параметров:
4. Коэффициент детерминации уже не является мерой адекватности модели, так как низкие значения t-статистик влекут недоверие к подобранной модели зависимости.
5. Оценки параметров при неколлинеарных экзогенных переменных становятся очень чувствительными к изменению данных.
6. Оценки параметров при неколлинеарных экзогенных переменных становятся незначимыми.
Приведем пример возникновения мультиколлинеарности по причине ошибочной спецификации модели.
Пример. Рассмотрим зависимость потребительских расходов студентов от располагаемого дохода и ликвидных активов:
МНК-оценка исследуемой модели получена в виде:
Вычислим t-статистики оценок параметров модели:
Исключив из модели переменную, отражающую объем ликвидных активов, получим:
.
Резкое увеличение значимости оставшейся переменной, наряду с ростом меры адекватности, позволяет сделать вывод об устранении коллинеарности и
В настоящее время наиболее распространены три метода диагноза мультиколлинеарности:
1. Визуальный метод, который основан на факте, что уровень значимости всего уравнения значительно меньше указывает на наличие мультиколлинеарности, чем уровни значимости индивидуальных экзогенных переменных .
2. Высокое значение коэффициента парной корреляции входящих в модель экзогенных переменных (в примере ).
3. Метод инфляционных факторов, который по трудоемкости доступен реализации только с помощью компьютерных прикладных программ.
Шаг 1. В модели (исходной) множественной линейной регрессии переберем все подмодели, в которых какая-либо экзогенная переменная становится эндогенной, т.е.
.
Шаг 2.Вычисляем коэффициенты детерминации всех полученных моделей , на основе которых рассчитаем так называемые инфляционные факторы:
Если , то делают вывод о существовании мультиколлинеарности.
В эконометрике применяют следующие рекомендации, уменьшающие влияние мультиколлинеарности:
а) в модели не изменяют никакую структуру, а, применяя компьютерный МНК, анализируют наличие проблемы мультиколлинеарности по визуальным методам.
б) улучшают спецификацию модели, устраняя из исходной модели коллинеарные экзогенные переменные.
в) увеличивают объем статистических данных.
г) объединяют коллинеарные переменные и включают в модель общую экзогенную переменную.
II. Аналогично первой проблеме различают явную и неявную автокорреляцию.
Явная наблюдается в случае, когда известна точная зависимость между уровнями шоковой переменной, полученными в различные моменты времени.
Неявная – когда такая зависимость стохастическая:
(4.1)
Зависимость вида (4.1) достаточно часто встречается при анализе временных рядов и носит название модели авторегрессии первого порядка AP (1).
Примером наличия именно такой модели автокорреляции является описание технологического процесса (в виде AP (1)) в модели макроэкономического роста:
,
где
Здесь – долговременный темп технологического прогресса;
– уровень автономного технологического прогресса;
– «шоки» роста технологии.
К последствиям наличия в модели автокорреляции относятся:
а) увеличение дисперсий оценок параметров модели;
б) смещение оценок, полученных по МНК;
в) снижение значимости оценок параметров.
К методам, исключающим автокорреляцию, относят процедуру, которую опишем для модели AP (1):
Пусть причем , где последовательность случайных компонентов – не коррелированна.
Если применим преобразование модели:
тогда в новых переменных модель примет вид:
в котором шоковая переменная уже не искажена автокорреляцией. Преобразование (4.2) относится к классу операторов декорреляции [2].
Наиболее популярным критерием диагностики эконометрической модели на наличие автокорреляции AР(1) является тест Дарбина-Вотсона.
Критерий оценки основан на решающей функции:
где
На основании статистики d можно сделать следующие выводы:
а) Если , то справедливо равенство , что влечет
б) Если , то справедлива оценка коэффициента автокорреляции
в) Промежуточное значение функции позволяет судить об отсутствии автокорреляции, действительно:
если
Простой оценкой параметра р является
Кроме точечной проверки наличия автокорреляции шоковой переменной на практике проверяют статистические гипотезы вида:
Критерии проверки гипотез 1) и 2) основаны на специальных таблицах Дарбина-Вотсона, в которых по уровню надежности содержаться доверительные границы статистики .
Решающие правила выглядят следующим образом:
Для проверки гипотезы 1):
а) если , то гипотеза – неверна;
б) если , то нет оснований, отбросить гипотезу при заданном уровне ;
в) если , то недостаточен объем выборки для принятия определенного решения.
Для проверки гипотезы 2):
а) если , то – неверна;
б) если , то – неверна;
в) если , то нет оснований, отбросить гипотезу .
Приведем графическую иллюстрацию описанным критериям:
Рис. 7
Отметим ограничения при использовании теста Дарбина-Вотсона.
1) Модель должна содержать свободный член ;
2) Модель не содержит лаговых (запаздывающих) переменных.
III. Проблема гетероскедастичностивозникает, когда наблюдения за эконометрическими переменными, включенными в модель, таковы, что точность наблюдений, проведенных в различные моменты времени, неодинакова, другими словами:
Приведем пример существования этой проблемы.
Пример. Пусть построена эконометрическая модель зависимости прибыли фирмы от двух факторов: величины затрат на рекламную деятельность и степени расширения производства EXt:
(4.3)
Очевидно, что степень вариации, мерой которой чаще всего служит дисперсия прибыли для крупных фирм, превышает дисперсию малых фирм, поскольку крупные фирмы, располагая большими активами, находятся в обстановке постоянного риска, что влечет немалую вариацию реализованной прибыли относительно ожидаемой (средней) прибыли. Поэтому, полагая постоянными расходы на рекламу, можно предположить, что дисперсия ошибок модели (4.3) монотонно возрастает при увеличении степени расширения производства. Изобразим эту ситуацию графически.
Рис. 8
Различают явную и неявную гетероскедастичность. Явная гетероскедастичность возникает, когда шоковая переменная модели имеет различные дисперсии в различные моменты наблюдения правильно специфицированной модели.
В общем виде перепишем модель для случая двух экзогенных переменных:
где
Здесь – так называемый фактор пропорциональности, на практике выбирается как некоторая экзогенная переменная.
Изобразим вид кривых распределения шоковой переменной в рамках предположения о гауссовской форме вероятностного распределения.
Рис. 9
Рис. 10
Неявнаягетероскедастичность возникает вследствие неправильной спецификации модели. Приведем пример этого явления.
Пример. Пусть построена модель зависимости объема импорта страны IM от уровня ВНП и реального обменного курса ее валюты , вида:
Если в данную модель не включен ВНП, тогда
где
Поэтому эффект, связанный с пропущенной переменной, влечет неявную гетероскедастичность:
Перечислим последствия, к которым может привести наличие гетероскедастичности:
1. Неявный тип гетероскедастичности является причиной смещения оценок параметров модели.
2. Дисперсия оценок параметров возрастает, что означает меньшую их значимость.
3. Возникает эффект недооценки величины дисперсии МНК-оценок параметров, поскольку средствами t и F-критерия не удается распознать эту проблему.
Приведем четыре самых распространенных метода диагностики наличия гетероскедастичности: