Стохастические объясняющие переменные
ЛЕКЦИЯ 9. Инструментальные переменные
До сих пор мы считали, что объясняющие переменные в регрессионной модели являются нестохастическими. Это означает, что если бы нам пришлось повторить регрессионный анализ с новой выборкой, то значения объясняющих переменных остались бы неизменными. При этом значения зависимой переменной изменились бы, потому что новая выборка содержала бы новую совокупность значений случайного члена.
Такое допущение может показаться странным. На практике в эконометрике мы оцениваем параметры модели регрессии только один раз. Редко бывает возможность повторить расчет с теми же или с другими значениями объясняющих переменных. Единственным общим исключением являются эксперименты лабораторного типа, основанные на использовании метода Монте-Карло.
Причина выдвижения данного предположения была технической и заключалась в упрощении анализа свойств оценок регрессии. Например, мы видели, что в модели парной регрессии (1)
оценка МНК коэффициента наклона может быть представлена в виде разложения:
(2)
Теперь если х — нестохастическая переменная, то Var(х) также является не стохастической величиной, и математическое ожидание ошибки может быть записано как Е[Соv (х, u)]/Vаr (х). Кроме того, если переменная х неслучайна, то Е [Cov (х, u)] = 0. Поэтому доказательство того, что b — несмещенная оценка β, не вызвало затруднений. Хотя доказательство не было представлено, пред положение о нестохастичности использовалось и при получении выражения для стандартной ошибки коэффициента. Кроме того, оно используется в теореме Гаусса—Маркова, доказывающей, что если удовлетворены условия Гаусса—Маркова, то оценки МНК эффективны.
В экономической практике предположение о нестохастичности часто оказывается весьма нереалистичным. Обычно обнаруживается, что объясняющие переменные модели сами были определены из других экономических зависимостей. Часто желательно рассматривать не одну зависимость изолированно, а целую систему зависимостей, действующих одновременно.
Мы изучим три типа моделей со стохастическими объясняющими переменными, классифицируемых в соответствии с тем, какова связь между распределениями этих переменных и распределением случайного члена. Все они имеют важное практическое значение.
1. В моделях первого типа объясняющие переменные распределены независимо от случайного члена.
2. В моделях второго типа объясняющие переменные и случайный член не являются независимыми, но их значения в каждый момент времени некоррелированы (т. е. текущие значения объясняющих переменных не коррелируют с текущим значением случайного члена).
3. В моделях третьего типа значения объясняющих переменных и случайного члена коррелируют в каждый момент времени.
Прежде чем начать рассмотрение указанных типов моделей, необходимо прояснить вопрос, о котором нередко забывают, — о дисперсиях и ковариациях объясняющих переменных в больших выборках. Обычно предполагается, что они стремятся к конечным пределам. Для упрощения мы примем здесь сильную форму этого допущения, заключающуюся в том, что объясняющие переменные могут рассматриваться как особый вид случайных переменных, для которых выборочные значения извлекаются (не обязательно независимо) из генеральных совокупностей с конечными средними, дисперсиями и ковариациями.
Справедливости ради следует отметить, что, по-видимому, мотивация для этого предположения — прежде всего практическая, так как это делает несложным определение поведения оценки в больших выборках. Действительно, это предположение является целесообразным, если вы имеете дело со статистическими данными, относящимися к различным отраслям экономики, и наблюдения берутся (случайно или в рамках схемы расслоенной выборки) из данной генеральной совокупности. Это предположение может быть также обоснованным в том случае, когда вы имеете дело с данными временного ряда, сформированными стационарным процессом, т. е. таким, в котором распределение х не зависит от времени.
Тем не менее во многих моделях, особенно в тех, где используются данные временных рядов, это предположение не является целесообразным. Весьма очевидно, что когда модель включает переменные с трендом, имеет смысл считать, что Var (x) неограниченно увеличивается по мере расширения периода выборки. Примером являются функции спроса. Поэтому мы будем рассматривать также и эту альтернативу. Анализ ограничим рассмотрением модели парной регрессии (1), но результаты легко распространяются и на случай множественной регрессии.
Случай, когда распределение х имеет конечное математическое ожидание и
Конечную дисперсию
Сначала рассмотрим случай, когда х извлекается из генеральной совокупности с конечными математическим ожиданием и дисперсией, обозначаемой .
а) х и u независимо распределены
Если х и u распределяются независимо друг от друга, то обычный МНК сохраняет все свои важные свойства. Сюда относятся несмещенность, эффективность и состоятельность. Кроме того, критическая статистика может использоваться, как обычно, при условии, что распределение х не зависит от параметров α, β или . Мы покажем, что выполняются условия несмещенности и состоятельности, а соблюдение требования эффективности примем на веру.
Несмещенность
Если x — стохастическая переменная, то Var (x) не может рассматриваться как скаляр, поэтому мы не можем переписать Е [Cov (x, u)/Var (х)] как E[Cov (x, u)]/Var(x). Следовательно, обычное доказательство несмещенности здесь не проходит. Однако мы можем найти другой способ разложения ошибки:
, (3)
где .
Далее, если х и u распределены независимо, то также независимо будут распределены f(x) и u. Следовательно, используя одно из свойств независимости, получаем:
(4)
так как Е(ui) согласно предположению, равно нулю в каждом наблюдении. Следовательно, если мы берем математическое ожидание обеих частей уравнения (3), то правая часть приводится к виду: (1/n), умноженное на сумму n членов, каждый из которых равен нулю. Следовательно, математическое ожидание ошибки равно нулю.
Состоятельность
Показать состоятельность также легко, если х имеет конечную теоретическую дисперсию . Мы знаем, что в общем случае plim (А/В) равен plim (A)/ plim (В), где А и В — произвольные случайные величины, у которых plim (А) и plim (В) существуют и plim (В) не равен нулю (plim означает предельное значение при увеличении объема выборки). Мы также знаем, что plim Cov (х, u) равен pop. cov (x, u), которая равна нулю, если х и u независимо распределены. Следовательно,
(5)
б) х и u одномоментно некоррелированы
Классический пример, когда объясняющая переменная и случайный член одномоментно некоррелированы, заключается в использовании лаговой зависимой переменной в качестве одной из объясняющих переменных. Если мы имеем модель
, (6) то находится непосредственно под воздействием , и косвенно — под влиянием всех предшествующих значений случайного члена. Следовательно, одна из объясняющих переменных в этой модели не имеет независимого от случайного члена распределения, и МНК не дает несмещенных оценок. Тем не менее несмотря на то, что приведенное выше доказательство несмещенности становится некорректным, доказательство состоятельности остается справедливым; если и ut некоррелированы, то можно показать, что plim Cov ( ) ра вен нулю. Таким образом, МНК сохраняет желательные свойства в больших выборках, хотя в малых это не обязательно так.
в) х и u одномоментно коррелированы
Если х и u одномоментно коррелированы, то Cov (x, u) не будет стремиться к нулю даже в больших выборках, и оценка, полученная обычным МНК, является как смещенной, так и несостоятельной. Смещение в большой выборке равно пределу по вероятности Cov (x, u)/ .