Стохастические объясняющие переменные

ЛЕКЦИЯ 9. Инструментальные переменные

До сих пор мы считали, что объясняющие переменные в регрессионной модели являются нестохастическими. Это означает, что если бы нам пришлось повторить регрессионный анализ с новой выборкой, то значения объясняющих переменных остались бы неизменными. При этом значения зависимой перемен­ной изменились бы, потому что новая выборка содержала бы новую совокуп­ность значений случайного члена.

Такое допущение может показаться странным. На практике в эконометрике мы оцениваем параметры модели регрессии только один раз. Редко бывает воз­можность повторить расчет с теми же или с другими значениями объясняющих переменных. Единственным общим исключением являются эксперименты ла­бораторного типа, основанные на использовании метода Монте-Карло.

Причина выдвижения данного предположения была технической и заклю­чалась в упрощении анализа свойств оценок регрессии. Например, мы видели, что в модели парной регрессии Стохастические объясняющие переменные - student2.ru (1)

оценка МНК коэффициента наклона может быть представлена в виде разло­жения:

Стохастические объясняющие переменные - student2.ru (2)

Теперь если х — нестохастическая переменная, то Var(х) также является не­ стохастической величиной, и математическое ожидание ошибки может быть записано как Е[Соv (х, u)]/Vаr (х). Кроме того, если переменная х неслучайна, то Е [Cov (х, u)] = 0. Поэтому доказательство того, что b — несмещенная оцен­ка β, не вызвало затруднений. Хотя доказательство не было представлено, пред­ положение о нестохастичности использовалось и при получении выражения для стандартной ошибки коэффициента. Кроме того, оно используется в те­ореме Гаусса—Маркова, доказывающей, что если удовлетворены условия Гаусса—Маркова, то оценки МНК эффективны.

В экономической практике предположение о нестохастичности часто ока­зывается весьма нереалистичным. Обычно обнаруживается, что объясняющие переменные модели сами были определены из других экономических зависи­мостей. Часто желательно рассматривать не одну зависимость изолированно, а целую систему зависимостей, действующих од­новременно.

Мы изучим три типа моделей со стохастическими объясняющими перемен­ными, классифицируемых в соответствии с тем, какова связь между распре­делениями этих переменных и распределением случайного члена. Все они имеют важное практическое значение.

1. В моделях первого типа объясняющие переменные распределены независимо от случайного члена.

2. В моделях второго типа объясняющие переменные и случайный член не являются независимыми, но их значения в каждый момент време­ни некоррелированы (т. е. текущие значения объясняющих переменных не коррелируют с текущим значением случайного члена).

3. В моделях третьего типа значения объясняющих переменных и случайного члена коррелируют в каждый момент времени.

Прежде чем начать рассмотрение указанных типов моделей, необходимо прояснить вопрос, о котором нередко забывают, — о дисперсиях и ковариациях объясняющих переменных в больших выборках. Обычно предполагается, что они стремятся к конечным пределам. Для упрощения мы примем здесь сильную форму этого допущения, заключающуюся в том, что объясняющие перемен­ные могут рассматриваться как особый вид случайных переменных, для кото­рых выборочные значения извлекаются (не обязательно независимо) из гене­ральных совокупностей с конечными средними, дисперсиями и ковариациями.

Справедливости ради следует отметить, что, по-видимому, мотивация для этого предположения — прежде всего практическая, так как это делает неслож­ным определение поведения оценки в больших выборках. Действительно, это предположение является целесообразным, если вы имеете дело со статистичес­кими данными, относящимися к различным отраслям экономики, и наблюде­ния берутся (случайно или в рамках схемы расслоенной выборки) из данной генеральной совокупности. Это предположение может быть также обоснован­ным в том случае, когда вы имеете дело с данными временного ряда, сформи­рованными стационарным процессом, т. е. таким, в котором распределение х не зависит от времени.

Тем не менее во многих моделях, особенно в тех, где используются данные временных рядов, это предположение не является целесообразным. Весьма оче­видно, что когда модель включает переменные с трендом, имеет смысл счи­тать, что Var (x) неограниченно увеличивается по мере расширения периода выборки. Примером являются функции спроса. Поэтому мы будем рассматривать также и эту альтерна­тиву. Анализ ограничим рассмотрением модели парной регрессии (1), но ре­зультаты легко распространяются и на случай множественной регрессии.

Случай, когда распределение х имеет конечное математическое ожидание и

Конечную дисперсию

Сначала рассмотрим случай, когда х извлекается из генеральной совокупно­сти с конечными математическим ожиданием и дисперсией, обозначаемой Стохастические объясняющие переменные - student2.ru .

а) х и u независимо распределены

Если х и u распределяются независимо друг от друга, то обычный МНК со­храняет все свои важные свойства. Сюда относятся несмещенность, эффектив­ность и состоятельность. Кроме того, критическая статистика может использо­ваться, как обычно, при условии, что распределение х не зависит от парамет­ров α, β или Стохастические объясняющие переменные - student2.ru . Мы покажем, что выполняются условия несмещенности и со­стоятельности, а соблюдение требования эффективности примем на веру.

Несмещенность

Если x — стохастическая переменная, то Var (x) не может рассматриваться как скаляр, поэтому мы не можем переписать Е [Cov (x, u)/Var (х)] как E[Cov (x, u)]/Var(x). Следовательно, обычное доказательство несмещенности здесь не проходит. Однако мы можем найти другой способ разложения ошиб­ки:

Стохастические объясняющие переменные - student2.ru , (3)

где Стохастические объясняющие переменные - student2.ru .

Далее, если х и u распределены независимо, то также независимо будут распределены f(x) и u. Следовательно, используя одно из свойств независимости, получаем:

Стохастические объясняющие переменные - student2.ru (4)

так как Е(ui) согласно предположению, равно нулю в каждом наблюдении. Следовательно, если мы берем математическое ожидание обеих частей урав­нения (3), то правая часть приводится к виду: (1/n), умноженное на сумму n членов, каждый из которых равен нулю. Следовательно, математическое ожидание ошибки равно нулю.

Состоятельность

Показать состоятельность также легко, если х имеет конечную теоретичес­кую дисперсию Стохастические объясняющие переменные - student2.ru . Мы знаем, что в общем случае plim (А/В) равен plim (A)/ plim (В), где А и В — произвольные случайные величины, у которых plim (А) и plim (В) существуют и plim (В) не равен нулю (plim означает пре­дельное значение при увеличении объема выборки). Мы также знаем, что plim Cov (х, u) равен pop. cov (x, u), которая равна нулю, если х и u независимо рас­пределены. Следовательно,

Стохастические объясняющие переменные - student2.ru (5)

б) х и u одномоментно некоррелированы

Классический пример, когда объясняющая переменная и случайный член одномоментно некоррелирова­ны, заключается в использовании лаговой зависимой переменной в качестве одной из объясняющих переменных. Если мы имеем модель

Стохастические объясняющие переменные - student2.ru , (6) то Стохастические объясняющие переменные - student2.ru находится непосредственно под воздействием Стохастические объясняющие переменные - student2.ru , и косвенно — под вли­янием всех предшествующих значений случайного члена. Следовательно, одна из объясняющих переменных в этой модели не имеет независимого от случай­ного члена распределения, и МНК не дает несмещенных оценок. Тем не менее несмотря на то, что приведенное выше доказательство несмещенности стано­вится некорректным, доказательство состоятельности остается справедливым; если Стохастические объясняющие переменные - student2.ru и ut некоррелированы, то можно показать, что plim Cov ( Стохастические объясняющие переменные - student2.ru ) ра­ вен нулю. Таким образом, МНК сохраняет желательные свойства в больших вы­борках, хотя в малых это не обязательно так.

в) х и u одномоментно коррелированы

Если х и u одномоментно коррелированы, то Cov (x, u) не будет стремить­ся к нулю даже в больших выборках, и оценка, полученная обычным МНК, является как смещенной, так и несостоятельной. Смещение в большой выборке равно пределу по вероятности Cov (x, u)/ Стохастические объясняющие переменные - student2.ru .

Наши рекомендации