Тест Чоу (G. Chow) диагностики включения фиктивных переменных в эконометрическую модель
Чтобы проверить следует ли разбивать выборку наблюдений на части и строить для каждой из них свою модель (т.е. привлекать фиктивные переменные), либо ограничиться построением общей модели по всем полученным наблюдениям используют критерий Чоу (об однородности выборки).
Приведем алгоритм его описания для двух специальных случаев:
Случай 1. Пусть объемы подвыборок и сравнимы по величине .
Шаг 1. По общей выборке объема оценивают модель по МНК и находят сумму квадратов остатков .
Шаг 2. По подвыборке оценивают модель по МНК и находят соответствующую ей .
Шаг 3. По подвыборке оценивают модель по МНК и находят .
Шаг 4. Рассчитывают решающую функцию критерия:
.
Шаг 5. Если статистика превысит пороговое значение , равное квантилю распределения Фишера на уровне значимости со степенями свободы и , то необходимо привлекать фиктивные переменные для построения двух моделей.
Случай 2. Если объем , причем сравним по величине с числом параметров модели , тогда алгоритм теста Чоу имеет вид:
Шаг 1. По выборке объема оценивают параметры модели по МНК и вычисляют .
Шаг 2. По общей выборке находят .
Шаг 3. Вычисляют статистику .
Шаг 4. Если > , где – квантиль распределения Фишера на уровне значимости со степенями свободы и , то следует привлекать фиктивные переменные для описания модели.
Приведем пример применения биноминальной модели.
Пример 6.1. Индивидуум относится к рабочей силе, если он работает или активно ищет работу (зарегистрирован на бирже труда). Для изучения мотивации участия женщин в общественном производстве выбрана биноминальная модель вида [10]:
где
– число лет, затраченных на образование t-й женщины.
Данные по такой выборке (из Т=30) представлены в таблице.
В результате применения трех моделей:
(а) линейной вероятностной модели; б) логит-модели и в) пробит-модели) были получены следующие оценки зависимости эндогенной от двух экзогенных переменных:
а)
(6.7)
б)
(6.8)
в)
(6.9)
Таблица 6.1. Данные об участии женщин в общественно полезном труде
t | |||||
1.0 | 0.0 | 31.0 | 16.0 | 1.20 | |
1.0 | 1.0 | 34.0 | 14.0 | 0.63 | |
1.0 | 1.0 | 41.0 | 16.0 | 0.82 | |
0.0 | 0.0 | 67.0 | 9.0 | 0.55 | |
1.0 | 0.0 | 25.0 | 12.0 | 0.83 | |
0.0 | 1.0 | 58.0 | 12.0 | 0.45 | |
1.0 | 0.0 | 45.0 | 14.0 | 1.01 | |
1.0 | 0.0 | 55.0 | 10.0 | 0.64 | |
0.0 | 0.0 | 43.0 | 12.0 | 0.83 | |
1.0 | 0.0 | 55.0 | 8.0 | 0.45 | |
1.0 | 0.0 | 25.0 | 11.0 | 0.73 | |
1.0 | 0.0 | 41.0 | 14.0 | 1.01 | |
0.0 | 1.0 | 62.0 | 12.0 | 0.45 | |
1.0 | 1.0 | 51.0 | 13.0 | 0.54 | |
0.0 | 1.0 | 39.0 | 9.0 | 0.17 | |
1.0 | 0.0 | 35.0 | 10.0 | 0.64 | |
1.0 | 1.0 | 40.0 | 14.0 | 0.63 | |
0.0 | 1.0 | 43.0 | 10.0 | 0.26 | |
0.0 | 1.0 | 37.0 | 12.0 | 0.45 | |
1.0 | 0.0 | 27.0 | 13.0 | 0.92 | |
1.0 | 0.0 | 28.0 | 14.0 | 1.01 | |
1.0 | 1.0 | 48.0 | 12.0 | 0.45 | |
0.0 | 1.0 | 66.0 | 7.0 | -0.01 | |
0.0 | 1.0 | 44.0 | 11.0 | 0.35 | |
0.0 | 1.0 | 21.0 | 12.0 | 0.45 | |
1.0 | 1.0 | 40.0 | 10.0 | 0.26 | |
1.0 | 0.0 | 41.0 | 15.0 | 1.11 | |
0.0 | 1.0 | 23.0 | 10.0 | 0.26 | |
0.0 | 1.0 | 31.0 | 11.0 | 0.35 | |
1.0 | 1.0 | 44.0 | 12.0 | 0.45 |
Результаты позволяют выделить лишь одно преимущество логит- и пробит-модели, состоящее в том, что значение эндогенной переменной не выйдет за допустимые границы [0;1].
Задача 6.1. Пусть модель приобретения акций, построенная на анализе Т=200 компаний, имеет вид:
где { – приобретение акции i-й компании}=
– доходность i-й компании, эмитирующей акции;
– стандартное отклонение от доходности за последние
5 лет;
– отношение долга к объему основного капитала i-й фирмы.
1) обсудите уровень адекватности модели и значимость оценок параметров при .
2) каковы Ваши предложения по улучшению спецификации данной модели?
Задача 6.2. Покажите, что логистическая функция распределения эквивалентна биноминальной логит-модели .
Задача 6.3. Найдите области определения экзогенной переменной , для которой дихотомическая эндогенная переменная (y>1 и y<0), если модели имеют вид:
а)
б)
в)
Задача 6.4. Пусть в модели зависимости включения женщин в рабочую силу (см. пример 6.1) добавляется дополнительная экзогенная переменная
После обработки данных таблицы примера 6.1 получена логит-модель вида:
(6.10)
.
Какую модель (6.8) или (6.10) Вы предпочли бы? Почему?
Задача 6.5. Пусть результаты использования множественной логит-модели по предпочтению личного транспорта перед тремя видами общественного для поездки от дома до работы, в которой эндогенная переменная представляла собой отношение вероятностей выбора каждого из трех видов общественного транспорта к вероятности выбора автомобиля, представлены в виде таблицы:
Независимая переменная | Коэффициент в модели |
Доход домашнего хозяйства | -0,12 |
Число членов семьи | -1,09 |
Цена билета (в общ. транспорте) | -3,16 |
Время ожидания | 0,18 |
Время в пути к остановке общественного транспорта | -0,03 |
Время поездки | -0,01 |
Последние четыре переменные определяются как разность между значением переменной при использовании общественного транспорта и соответствующей переменной при применении автомобиля.
1. Соответствуют ли Вашим предположениям знаки оценок коэффициентов модели?
2. Соответствуют ли количественные значения оценок коэффициентов Вашим сравнительным ожиданиям? Если нет, сделайте предположения, улучшающие спецификацию модели.
Задача 6.6. Предположим, что применяется модель множественного логит-анализа для выбора вуза. Пусть имеются следующие типы вузов: а) высший колледж; б) государственный университет; в) коммерческий институт. Предположим, что значимыми являются следующие экзогенные переменные: 1) среднедушевой доход семьи абитуриента; 2) средний проходной балл при поступлении в вуз; 3) уровень профессорско-преподавательского состава вуза.
1. Выбирая вероятность выбора конкретного колледжа за базисную переменную, запишите эконометрические модели для каждого уравнения (определяющего отношения вероятностей).
2. Объясните экономический смысл коэффициентов в каждом уравнении.
ТЕМА 7. СОВМЕСТНЫЕ ЭКОНОМЕТРИЧЕСКИЕ
УРАВНЕНИЯ (СЭУ)
Экономические явления и процессы по своей природе не могут быть всеобъемлюще описаны единственным эконометрическим уравнением. Равновесные модели макроэкономики Кейнса, Вальраса, Леонтьева, как правило, описываются системой эконометрических уравнений. Поэтому без владения эконометрическим анализом таких комплексных уравнений невозможно адекватно исследовать поведение эконометрических объектов, чье приближенное описание производится на базе системы уравнений. Введем определение такой сложной модели.
Определение. Систему взаимосвязанных тождеств и регрессионных уравнений, в которой переменные могут одновременно выступать как эндогенные (результирующие) в одних уравнениях и как экзогенные (объясняющие) в других, принято называть системой совместных эконометрических уравнений (СЭУ).
При этом в уравнения могут входить переменные, относящиеся к предшествующим моментам времени, которые называются лаговыми (запаздывающими). Тождества описывают функциональные связи переменных и вытекают из их содержательного экономического смысла.
Классический МНК не применим к оцениванию параметров СЭУ, поскольку нарушается предположение о независимости экзогенных и шоковых переменных.
В эконометрике результирующие переменные, измеренные в текущий период времени, относят к эндогенным (они, как правило, содержатся в левых частях СЭУ). Экзогенные переменные объединяют объясняющие и лаговые результирующие переменные.
Экономический мир развивается в условиях эффектов прямой и обратной взаимозависимости и взаимной причинности. Например, численность населения и предложение продуктов питания – переменные, связанные взаимной причинностью. Приведем алгебраическое описание такого эффекта:
CЭУ вида (7.1), (7.2) может описывать, например, зависи- мость – спроса на птицу, – цены на птицу от – дохода потребителей, – цены на товар заменитель (говядину) и – цены на корм птицы. Тогда первое уравнение системы (7.1) отражает поведение потребителей, а второе (7.2) – поставщиков птицы.
Система (7.1), (7.2) относится к структурным СЭУ, поскольку результирующая переменная первого уравнения является объясняющей второго и наоборот.
Приведем простой пример структурной СЭУ, содержащей и тождества:
Пример (равновесная модель спроса и предложения)
Заметим, что число уравнений и тождеств СЭУ должно совпадать с числом эндогенных переменных, которыми является спрос ( ), предложение ( ) и цена ( ) некоторого товара. Следует отметить, что эндогенные переменные не всегда обязаны присутствовать в левых частях уравнений СЭУ (например, в модели (7.3)). Искомые параметры (а, b) имеют знаки, соответствующие экономическому смыслу взаимосвязей переменных моделей (7.3) (a1 < 0, b1 > 0). Тогда первые два уравнения СЭУ имеют графики, традиционно встречающиеся в литературе по экономической теории:
Рис. 14
Чтобы показать, что для СЭУ нарушается традиционное предположение о независимости между объясняющими переменным и шоковой составляющей модели, вернемся к системе (7.1 – 7.2), в которой сделаем предложение о возрастании влияния случайной переменной в уравнении спроса на мясо птицы (т.е. возрастает), тогда в соответствии с уравнением (7.1) также возрастает. В свою очередь из уравнения (7.2) (так как b1 > 0) также будет расти, но эта переменная входит во множество объясняющих переменных уравнений (7.1). Следовательно, рост шоковой переменной влечет возрастание объясняющей переменной , что и означает нарушение предположения об их независимости.
Удобными графическими изображениями СЭУ являются причинные диаграммы (см. разд.7.2), в которых экзогенные переменные помещаются в квадратах, а эндогенные – в кругах; взаимосвязи отмечаются стрелками с указанием коэффициентов при объясняющих переменных. Например, приведем диаграмму, соответствующую СЭУ (7.1):
Рис. 15
Структурная форма СЭУ непосредственно не применима для решения задач оценивания и прогнозирования, так как уравнения системы не разрешены относительно эндогенных переменных. Поэтому осуществляют преобразование структурной формы СЭУ в так называемую приведенную форму, в которой правые части уравнений не содержат эндогенных переменных. Приведем такое преобразование на примере системы (7.1).
Вначале, подставив вместо его выражение из уравнения (7.2), получим:
Тогда, разрешив уравнение относительно , получим:
Выполним аналогичные преобразования для уравнения (7.2) и, разрешая его относительно , будем иметь:
Коэффициенты (параметры) приведенной формы называют мультипликаторами, которые измеряют эффект воздействия стоящего при них сомножителя-экзогенной переменной на эндогенную, причем различают:
• импульсные (безынерционные) мультипликаторы, измеряющие эффект воздействия экзогенной переменной на эндогенную в тот же период времени (t);
• автономные, которые соответствуют свободному члену;
• динамические, которые соответствуют коэффициенту при лаговой переменной.
В общепринятом в литературе виде приведенная форма СЭУ
в системе (7.1) записывается:
Здесь уже справедлива гипотеза о независимости шоковой и экзогенных переменных и для оценивания мультипликаторов можно применить МНК, который носит название косвенного МНК, так как строит оценки для π, по которым надо еще пересчитать оценки и.
Например, для рассмотренного примера:
и так далее.
Однако оценки, полученные по косвенному МНК, не являются несмещенными, поэтому разработан специальный двухшаговый МНК, алгоритм которого приведем для простой СЭУ вида:
Шаг 1. Преобразуем структурную форму СЭУ к приведенной, к которой применим классический МНК:
Шаг 2. Подставим в исходную структурную форму СЭУ оценки эндогенных переменных и , полученные на предыдущем шаге алгоритма:
К полученной СЭУ снова применим классический МНК, оценки параметров которой будут обладать свойствами несмещенности и асимптотической состоятельности.
Приведем пример применения МНК к простейшей модели потребления Дж. Кейнса:
где и – эндогенные переменные, обозначающие валовое потребление и национальный доход в период t;
– экзогенная переменная, отражающая валовые инвестиции (объем основных фондов) в период t;
– автономное потребление, – предельная склонность к потреблению ( ).
Причинную диаграмму структурной формы модели потребления Дж.Кейнса изобразим в виде:
Рис. 16
Преобразуем исходную структурную форму СЭУ к приведенной форме:
где соответствует мультипликатору Дж.Кейнса, указывающему на эффект влияния инвестиций на национальный доход.
Причинная диаграмма полученной приведенной формы модели потребления Дж.Кейнса имеет вид:
Рис. 17
Применив МНК для уравнений приведенной формы для второго соотношения, получим:
.
Далее подставим полученную оценку Y в уравнение потребления структурной формы:
.
После повторного применения МНК окончательно получим , где полученные оценки и имеют ясную экономическую интерпретацию.
При анализе приведенной формы СЭУ возникает проблема потенциальной возможности применения двухшагового МНК для оценивания ее параметров – проблема идентификации.
Система эконометрических уравнений – не идентифицирована, если все ее уравнения выглядят статистически одинаково, т.е. все эндогенные и экзогенные переменные будут содержаться в каждом уравнении. Если из экономического смысла некоторые экзогенные переменные могут быть исключены из уравнения, то проблема идентификации СЭУ не возникает.
Рассмотрим простой пример СЭУ, объединяющий уравнения спроса и предложения:
(S – D)
которые с точностью до коэффициентов полностью идентичны, и инструментальные методы оценивания не могут их различить. Для внесения отличия в форму уравнений добавим, например, во второе уравнение дополнительную переменную , получим:
.
С геометрической точки зрения, изменение Zt приводит к сдвигу кривой предложения, не изменяя кривой спроса. Придавая ряд значений Zt, можно восстановить (идентифицировать) кривую спроса. На рис. 18 проиллюстрируем описанный эффект графически:
Рис. 18
По полученным точкам равновесия E1, E2, E3… несложно восстановить форму кривой спроса (D – D).
Аналогично добавляя переменную только в уравнение спроса, можно, придавая ей ряд значений, восстановить кривую предложения (S – S). Изобразим графически описанную ситуацию:
Рис. 19
На практике для более сложных СЭУ применяют порядковый критерий проверки каждого уравнения СЭУ на идентифицируемость.
Порядковый критерий (ПК) является необходимым, но недостаточным условием идентификации СЭУ, для его формулировки необходимо ввести:
mi – предетерминированных переменных в i - м уравнении;
m – общее число предетерминированных переменных в СЭУ
(экзогенных и лаговых эндогенных);
– число эндогенных переменных СЭУ в её i-м уравнении.
ПК: Если число предетерминируемых переменных СЭУ, не включенных в i-е уравнение не меньше, чем число эндогенных переменных в СЭУ, содержащихся в анализируемом уравнении, уменьшенное на единицу, данное уравнение считают идентифицируемым.
Различают:
а) точную идентификацию, если ;
б) сверхидентификацию, если ;
в) неидентифицируемость, .
Например, в СЭУ спрос – предложение (S – D).
Для первого уравнения .
Для второго уравнения , что согласно порядковому критерию указывает на их неидентифицируемость.
В случае добавления по одной экзогенной переменной и в уравнения СЭУ имеем: , что указывает на точную идентифицируемость. Заметим, что проверке на идентифицируемость подвергаются только уравнения СЭУ, для тождественных соотношений такая проверка лишена смысла, так как для последних не ставится задача оценивания параметров.
7.1. В практических исследованиях эконометрические модели должны содержать целую систему взаимосвязанных уравнений, чтобы адекватно описывать экономические процессы.
Напомним матричное выражение системы одновременных эконометрических моделей, состоящих из n уравнений с n+m переменными [2]:
(7.6)
где X = (X1¦…¦Xm)'– вектор предопределенных (экзогенных и лаговых эндогенных) переменных;
Y = (Y1¦…¦Yn)'– вектор эндогенных переменных;
– матрица коэффициентов, в которой – коэффициент при переменной в i-м уравнении;
– матрица коэффициентов при переменной , в которой – коэффициент при переменной в i-м уравнении;
O = (0¦…¦0)' – нулевой вектор;
Т – оператор транспонирования.
Пусть известны Т-наблюдений за переменными модели (7.6), которые подвержены случайным отклонениям , тогда:
(7.7)
где
В большинстве случаев нет необходимости оценивать коэффициенты всех уравнений, а только некоторых из уравнений. Укажем общепринятые подходы к идентификации СЭУ:
1) для оценивания коэффициентов отдельного уравнения, например, первого:
(здесь )
можно применять МНК, однако, МНК-оценки являются смещенными в силу корреляции между и .
2) для устранения данной корреляции необходимо преобразовать исходную систему (7.6) и (7.7), именуемую структурной формой, к приведенной форме, в которой каждая эндогенная переменная зависит только от неопределенных переменных.
Если предположить, что матрица В имеет обратную, то
(7.8)
Теперь по МНК можно определить оценки элементов матрицы П приведенной формы модели (7.8). Однако по оценкам элементов матрицы П далеко не всегда можно восстановить искомые оценки и . Поэтому МНК для оценивания параметров модели (7.8) носит название косвенного МНК по отношению к оцениванию параметров модели (7.7).
Заметим также, что матрицы В и С могут быть определены по матрице П с точностью до невырожденной матрицы D. Действительно, пусть:
(7.7')
Тогда
Откуда следует, что модели (7.7) и (7.7') имеют одинаковую приведенную форму (7.8).
Напомним общепринятые определения.
Если все неизвестные коэффициенты уравнения структурной формы (7.7) однозначно восстанавливаются по коэффициентам приведенной формы (7.8), то такое уравнение называется точно идентифицируемым; если хотя бы один коэффициент уравнения не может быть восстановлен, то такое уравнение является неидентифицируемым; если одному коэффициенту приведенной формы соответствует более одного значения коэффициента структурного уравнения, то его считают сверхидентифицируемым. Система (7.7), состоящая из точно идентифицируемых уравнений, является точно идентифицируемой. Если хотя бы одно уравнение системы (7.7) неидентифицируемо, то и система в целом является неидентифицируемой.
Для формулировки условий идентифицируемости некоторого (без потери общности первого) уравнения системы воспользуемся соотношением:
или (7.9)
Предположим, без ограничения общности, что участвующие в первом уравнении эндогенные переменные и предопределенные переменные расположены по порядку в общих списках переменных системы.
Тогда соотношение (7.9) для первых строк В и С имеет вид:
Переписывая предыдущие равенства в блочном виде, получим:
Для того чтобы параметры были найдены по элементам матрицы , необходимо, чтобы число уравнений системы (7.10'') было бы не меньше числа неизвестных элементов вектора , т.е.
(т.к. ). (7.11)
Теперь, распространяя условие (7.11) на все уравнения системы, получим:
А) Порядковое условие идентифицируемости (необходимое условие):
А1) если число эндогенных переменных уравнения, уменьшенное на единицу , равно числу предопределенных переменных системы, не включенных в данное уравнение , то i-е уравнение точно идентифицируемо;
А2) если – сверхидентифицируемо;
А3) если – неидентифицируемо.
Б) Ранговый критерий (необходимое и достаточное условие) идентифицируемости:
(7.12)
Для преобразования уравнения к идентифицируемому виду на практике используют два способа изменения спецификации:
1) не изменяя другие уравнения модели, можно в неидентифицируемом уравнении некоторые коэффициенты положить равными нулю, предположив тем самым незначимость влияния на эндогенную переменную соответствующих им экзогенных переменных;
2) не имея спецификации неидентифицируемого уравнения, включить в другие структурные уравнения модели дополнительные предопределенные переменные (этот способ будет реализован на примере 7.7.).
Для оценивания параметров каждого отдельного уравнения структурной формы (в случае наличия сверхидентифицируемых уравнений) разработан специальный двухшаговый МНК (2МНК).
Шаг 1.Рассмотрим, например, первое уравнение системы:
(7.13)
Шаг 2. Строим регрессию эндогенных переменных , входящих в правую часть уравнения (7.13), и находим МНК-оценки:
Шаг 3. Заменяем на в уравнении (7.13):
(7.13')
где
Шаг 4. Применяем «классический» МНК для оценивания параметров . Полученные 2-МНК оценки будут обладать свойствами асимптотической несмещенности в состоятельности [2].
Двухэтапное применение процедуры оценивания удобно представить в виде одной матричной формулы, для записи которой выберем (без потери общности) первое уравнение:
(7.13'')
где – вектор наблюдений за эндогенной переменной, подлежащей определению в данном уравнении: ';
– матрица наблюдений над эндогенными переменными, объясняющими поведение :
– матрица наблюдений за экзогенными переменными первого уравнения.
Предполагается, что избранное уравнение для обеспечения состоятельности оценок идентифицируемо по порядковому критерию.
Далее для замены на оценку проведем следующие преобразования:
' '
где Х – матрица наблюдений за экзогенными переменными системы.
Тогда окончательно
(7.13''')
Тогда МНК-оценки для уравнения (7.13''') имеют вид:
(7.14)