Тема 3. спецификация эконометрической модели. методы отбора экзогенных переменных и выбора формы зависимости эндогенной переменной от экзогенных
Спецификация модели множественной линейной регрессии включает решение двух следующих задач:
1. Проверка правильного выбора экзогенных переменных.
2. Проверка корректного выбора формы зависимости между эндогенной и экзогенной переменными.
Для решения первой задачи различают пропущенные и избыточные экзогенные переменные.
Определение 1. Под пропущенными переменными понимают существенные факторы, которые по ошибке не были включены в эконометрическую модель.
Опасность наличия пропущенных переменных заключается в смещении оценок параметров при включенных переменных.
Действительно, пусть «истинная» модель имеет вид:
но выбранная модель с пропуском переменной
Тогда, применяя МНК для оценки усеченной модели, получим формулу для смещения оценки
.
Признаком, по которому определяют пропущенную переменную, служит положительный знак у произведения оценки параметра при подозреваемой переменной на роль пропущенной с коэффициентом корреляции этой переменной со всеми включенными в модель переменными.
Рассмотрим пример диагностики по этому признаку.
Пример: Пусть принимается модель зависимости потребления птицы от располагаемого дохода и цен на говядину и птицу:
где – оценка потребления птицы в период t;
– цена на птицу;
– цена на говядину;
– располагаемый доход.
Если не учитывать в модели цену на говядину , то получим следующую оценку потребления птицы:
.
Из факта, что следует ожидать положительную корреляцию между переменными (РС, PВ) и (УD, РВ), имеем:
где символ sign обозначает знак величины С.
Следовательно, можно сделать вывод, что цена на говядину является пропущенной переменной, которую следует включить в модель.
Определение 2.Экзогенную переменную относят к избыточным, если она по ошибке включена в эконометрическую модель.
Включение избыточной переменной оказывает влияние на уменьшение точности (увеличение дисперсии) оценок параметров модели, что, в свою очередь, вызывает уменьшение t-статистик и коэффициента детерминации.
Приведем обоснование эффекта увеличения дисперсии для модели с двумя экзогенными переменными, тогда:
(3.1)
Если – избыточная, то коэффициент корреляции , тогда будет уменьшаться, а в соответствии с формулой (3.1) будет возрастать.
Сформулируем 4 основных качественных правила спецификации экономической модели:
1. Опираясь на эконометрическую теорию, следует ответить на вопрос: «Является ли переменная существенной в модели зависимости с эндогенной переменной?».
2. Осуществить проверку значимого отличия от нуля t-статистик.
3. Осуществить проверку, насколько значимо изменяется коэффициент детерминации при добавлении некоторой переменной в модель.
4. Существенно ли изменяются оценки других переменных после добавления новой переменной в модель.
Кроме отмеченных правил спецификации модели, наиболее известны два следующих количественных критерия спецификации:
¨ Критерий Рамсея (Ramsey):
1. Оценивают зависимость в соответствии с выбранной моделью по МНК:
(3.2)
2. Анализируют вид функциональной зависимости остатков и её номинальное приближение включают в модель.
3. Например, с учетом 2) вычисляют величины , конструируют новую модель:
(3.3)
и применяют для ее оценивания по МНК.
4).Сравнивают качество модели (3.2) по отношению к модели (3.3) с помощью F-критерия:
Если где M – число дополнительных переменных, включенных в модель (M=3), k – число экзогенных переменных в (3.3) то модель (3.2) плохо специфицирована.
¨ Критерий Амемья (Amemiya):
Решающей функцией F-критерия служит:
Модель, для которой значение AF меньше, является лучше специфицированной.
Выбор формы зависимости переменных в эконометрической модели оформим в виде таблицы:
Вид зависимости | Модель | Коэффициент наклона | Эластичность |
Линейная I | |||
Двойная логарифми-ческая II | |||
Полулогарифми-ческая III | |||
Полулогарифмическая IV | |||
Полиноминальная V | |||
Обратная VI |
Приведем примеры эконометрических моделей, в которых используют зависимости I – IV.
I.Линейная модель применяется, например, в зависимости потребления от национального дохода:
II. Двойная логарифмическая модель применяется при линеаризации производственной функции Кобба-Дугласа:
.
III. Отражении зависимости спроса на товар от располагаемого дохода (кривые Энгела):
IV. Модель зависимости уровня заработной платы от стажа и образования занятых:
V. При оценке взаимосвязи уровня безработицы (U) и уровня заработной платы (W) (кривая Филипса):
Пример 3.1.
(3.1)
(3.2)
Заметим, что .
Пример 3.2. Оценивание параметров производственной функции Кобба-Дугласа.
По наблюдениям за переменными обрабатывающей промышленности США за период 1899 – 1923 гг. были собраны данные темпов роста переменных ПФ:
– индекс производства, – индекс основного капитала, – индекс трудовых ресурсов (в процентах).
1899(0) | |||||||||
104,8 | 121,9 | 115,6 | 134,2 | 139,9 |
123,2 | 142,7 | 148,1 | 156,2 | 152,2 | 155,8 |
197,5 | 195,9 | 194,4 | 146,4 | 160,5 |
1) Линеаризация модели вида , оцененная по МНК, приняла вид:
,
(0,43) (0,06) (0,144)
.
2) Модификация модели в терминах факторов, рассчитанных на одного занятого , где – производительность труда, – фондовооруженность, при МНК-оценивании дала результат:
, , , .
По признаку адекватности (близость к единице коэффициента детерминации ) предпочтительнее является модель 1).
Задача 3.1. Укажите смысл следующих понятий, относящихся к спецификации эконометрической модели: а) пропущенная переменная; б) избыточная переменная; в) ошибка спецификации; г) смещение, обусловленное ошибкой спецификации.
Задача 3.2. Для каждой из следующих зависимостей определите знак смещения, обусловленного ошибкой спецификации:
а) в уравнении спроса на масло укажите знак смещения коэффициента при располагаемом доходе в случае пропуска переменной – цены на масло;
б) в уравнении заработной платы рабочих укажите знак смещения коэффициента при переменной стажа в случае пропуска переменной – возраста рабочего;
в) в уравнении производственной функции, отражающей стоимость за услуги от авиаперевозок, укажите знак смещения при переменной фактора – «рабочая сила» в случае пропуска фактора производства – «капитальные затраты».
Задача 3.3. Рассмотрим следующую модель годового уровня смертности по причине сердечной недостаточности ( ).
,
,
где – удельное потребление сигарет в течениe t-го года;
– удельное потребление холестерина в период t;
– удельное потребление мясопродуктов в период t.
а) проверьте значимость параметров модели на уровне значимости
б) незначимость коэффициентов может быть обусловлена наличием пропущенных переменных. Укажите какие, на Ваш взгляд, следующие переменные могут быть квалифицированы как пропущенные в данной модели:
– удельное потребление алкоголя в период t;
– средняя жирность мясопродуктов, потребляемых в период t;
– удельное число пробегаемых километров в период t.
в) какое последствие окажет включение какой-либо переменной в модель?
Задача 3.4. Руководство фирмы желает выяснить, где наиболее выгодно построить магазин. Для принятия решения рассматривается модель регрессионной зависимости объемов продаж 30 действующих магазинов фирмы от ряда факторов:
,
(0,02) (0,01) (1,0) (1,0)
где – средний объем продаж в день i-ого магазина фирмы;
– число автомобилей, проезжающих мимо i-ого магазина в день;
– среднедушевой доход жителей района, где расположен i-й магазин;
– число кассовых аппаратов i-ого магазина;
– число магазинов конкурирующих фирм, расположенных в данном районе.
а) проанализируйте знаки коэффициентов на уровне .
б) какие проблемы спецификации возникают при отрицательных выводах предыдущего пункта? Опишите Ваши предложения, направленные на улучшение модели.
Задача 3.5. Предположим, что пункт быстрого питания для анализа прибыли применяет модель зависимости объема продаж ( ) в период t от четырех экзогенных переменных: цены товара в данном пункте; средней цены данного товара в других пунктах питания, расположенных в студенческом городке; состояния погоды в течение t-ого дня и численности студентов института:
,
.
а) на основе знаков и проверки значимости параметров модели укажите смысл экзогенных переменных на уровне значимости ;
б) каковы Ваши предложения по улучшению спецификации восстановленной модели?
Задача 3.6. Для проектирования организации сборки легкового автомобиля решено воспользоваться эконометрической моделью вида (А):
,
,
построенной при обработке параметров модификации моделей легкового автомобиля среднего класса, выпускаемых фирмой-производителем.
Здесь: – цена i-й модификации;
– вес i-й модификации;
– качественная переменная, указывающая на наличие автоматической трансмиссии у автомобиля i-й модификации ( );
– качественная переменная, указывающая на наличие системы выбора оптимального маршрута ( );
– объем двигателя i-й модификации.
а) проверьте значимость параметров модели с коэффициентом надежности ;
б) вы приняли решение об избыточности переменной L, исключив которую, вы получили модель (B):
,
.
Какую модель (A) или (B) Вы бы предпочли?
Задача 3.7. Примените критерий Рамсея, если получены две модели зависимости спроса на птицу ( ) от цены на нее ( ) и располагаемого дохода потребителя ( ).
Шаг 1: ,
.
Шаг 2:
для проверки правильности спецификации модели, полученной на шаге 1, на уровне значимости .
Задача 3.8. Какое из двух следующих эконометрических уравнений может быть оценено с помощью МНК и почему?
а) ;
б) .
Задача 3.9. Рассмотрим следующую полулогарифмическую модель
,
где – логарифм заработной платы i-ого служащего;
– длительность (в годах) образования i-ого служащего;
– стаж (в годах) i-ого служащего.
а) проверьте значимость параметров модели с надежностью ;
б) какой эконометрический смысл имеет свободный член в правой части модели?
в) укажите эластичность зарплаты по отношению к образованию и стажу;
г) предположим, что Вы преобразовали модель к линейному виду и после оценки ее получили, что . Можно ли сравнивать адекватность этих моделей?
Задача 3.10. Рассмотрим модель производственной функции Кобба-Дугласа
,
которую применили к анализу отраслей, по двум из которых МНК-оценки параметров и коэффициентов детерминации представлены в таблице:
Отрасль | ||||
Легкая | 0,97 | 0,92 (0,03) | 0,12 (0,04) | 0,98 |
Пищевая | 2,70 | 0,59 (0,14) | 0,33 (0,17) | 0,80 |
а) проверьте значимость параметров, если ;
б) каковa эластичность выпуска ( ) относительно факторов труда и капитала для каждой отрасли? Какой экономический смысл суммы ?
Задача 3.11. Изучение эффективности процесса инвестирования в расширении гостиничных услуг осуществляется с помощью модели:
,
где A – автономный параметр;
R – годовой чистый доход от гостиничных услуг;
L – аренда земли;
K – строительные издержки;
– случайный фактор.
а) каковы Ваши предложения о величине параметров и ? Укажите также их экономический смысл;
б) проверьте значимость оценок следующей уточненной модели по данным за 10 периодов времени ( ):
;
в) если Вы решили начать строительство гостиницы, то какой фактор Вы предпочтете для первостепенного вложения инвестиций?
Задача 3.12. Рассмотрим следующую модель зависимости различных факторов на рост прибыли потребительской фирмы:
где – темп роста прибыли i-й фирмы;
– рекламные расходы i-й фирмы;
– общий объем продаж i-й фирмы;
– уровень желаемого капитала для вхождения в рынок в выгодном масштабе;
– уровень экономии от расширения масштаба производства i-й фирмы;
– темп роста в покупках i-й фирмы за последние 10 лет.
а) проверьте знаки коэффициентов при экзогенных переменных.
б) известно, что парные коэффициенты корреляции между и каждой из других экзогенных переменных – положительны. Если одна из этих (остальных) переменных пропущена, то в каком направлении будет смещение ?
Задача 3.13. Пусть рассматривается темп роста дохода страны как функция от темпа роста капитала и удельного дохода в этой стране. Вы располагаете данными, охватывающими как развитые, так и развивающиеся страны. Предполагается, что в соответствии с теорией экономического роста его темп будет увеличиваться, если удельный доход возрастает, а затем начинает падать. Можно ли описать этот эффект с помощью:
а) кусочно-линейной регрессионной модели (если падение роста наблюдается в точке насыщения удельного дохода, равного 2000 USD);
б) квадратической модели;
в) полулогарифмической модели.
Если да, то выпишите вид этой модели.
Задача 3.14. Известны следующие данные личного потребления и дохода подгруппы студентов:
Номер студента | ||||||||
Потребление (месяц) | ||||||||
Доход (месяц) |
а) примените линейную и двойную логарифмическую модель для описания зависимости месячного потребления от месячного дохода.
б) сравните адекватность обеих моделей, рассчитав для них коэффициенты детерминации .
в) рассчитайте уточненный для двойной логарифмической модели и произведите его сравнение линейной модели.