Трудности МНК в спецификации модели и пути их преодоления
Лекция 9
Регрессионный анализ при нарушении предпосылок классических методов
Учебные цели:
1. Совершенствовать навыки эконометрического моделирования.
2. Сформировать теоретическую базу для практических занятий.
Учебные вопросы:
1. Трудности МНК в спецификации модели и пути их преодоления.
2. Инструментальные переменные.
3. Тест Хаусмана.
4. Процедура получения оценок максимального правдоподобия.
Трудности МНК в спецификации модели и пути их преодоления
Метод наименьших квадратов (МНК) в силу требований теоремы Гаусса-Маркова при оценивании множественной линейной регрессии предполагает:
· проверку правильности выбора экзогенных переменных;
· корректность формы связи между эндогенной и экзогенными переменными.
Первую проблему создают пропущенные и избыточные экзогенные переменные.
Под пропущенными переменными понимают существенные факторы, которые по ошибке не были включены в эконометрическую модель.
Пропущенные переменные смещают оценки коэффициентов при уже включенных переменных.
Действительно, пусть «истинная» модель имеет вид
но выбрана модель с пропуском переменной x2:
Применив МНК для оценки «усеченной» модели, получим смещение для оценки :
,
определяемое корреляцией x1 и x2.
В общем случае признаком, по которому определяют пропущенную переменную, служит положительная величина произведения оценки коэффициента при переменной, полагаемой пропущенной, на коэффициент корреляции этой переменной со всеми уже включенными в модель переменными.
Пример
Оценивается связь потребления птицы с располагаемым доходом и ценами на говядину и птицу в обозначениях:
Если не учитывать в модели цену на говядину PBt, то получим следующую оценку потребления птицы:
Но из факта, что следует ожидать положительную корреляцию цен на птицу с ценами на говядину и величиной располагаемого дохода, имеем:
Введя пропущенную переменную – цену говядины PBt, получим:
Цену на говядину целесообразно вводить в модель, поскольку возрос коэффициент детерминации.
Экзогенную переменную относят к избыточным, если она по ошибке включена в эконометрическую модель.
Включение избыточной переменной оказывает влияние на уменьшение точности (увеличение дисперсии) оценок параметров модели, что, в свою очередь вызывает уменьшение t-статистик и коэффициента детерминации.
Основные правила спецификации линейной модели по числу переменных:
1. Опираясь на экономическую теорию, ответить на вопрос: «Является ли анализируемая экзогенная переменная существенной в определении поведения эндогенной?».
2. Осуществить проверку значимости коэффициентов модели с помощью t-статистик.
3. Оценить насколько значимо изменяются коэффициент детерминации и оценки коэффициентов при других переменных после добавления (исключения) новой переменной. (См. тесты Рамсея и Лагранжа в предыдущих лекциях.)
Итак, основные пути исправления ошибок спецификации – коррекция набора переменных либо отказ от линейной формы регрессии.
Однако при нелинейности моделей в применении МНК также возникают существенные трудности.
Предпосылки МНК требуют, чтобы отклонения являлись нормально распределенными случайными величинами и не коррелировали друг с другом, т.е. при . В противном случае оценки, полученные по МНК, не будут обладать свойствами BLUE-оценок.
Для описания возможных проблем со случайным отклонением рассмотрим три возможных случая степенной модели:
, (1)
, (2)
. (3)
Прологарифмировав каждое из этих соотношений, соответственно получим:
,(4)
,(5)
,где . (6)
Таким образом, использование (4) для оценки параметров в модели (1) не вызовет осложнений, связанных со случайным отклонением.
Преобразование же (2) в (5) приводит к преобразованию случайных отклонений в . Использование МНК потребует, чтобы отклонения удовлетворяли предпосылкам МНК: . Но это возможно только в очень специфическом случае логарифмически нормального распределения случайной величины с матожиданием и дисперсией .
Логарифмирование соотношения (3) вообще не приводит к его линеаризации относительно параметров регрессии. В этом случае для нахождения оценок параметров МНК неприменим, и необходимы численные итерационные процедуры.
Что делать если требования к поведению остатков не выполняются?