Стохастические объясняющие переменные. Последствия ошибок измерения
Основные идеи экономики — взаимосвязь между экономическими переменными. Спрос на товар на рынке рассматривается как функция его вены. Затраты на изготовление какого-либо продукта — функция от объема производства. Потребительские расходы — функция дохода и т.п. Это примеры взаимосвязей между двумя переменными, одна из которых (спрос на товар, производственные затраты, потребительские расходы) является объясняемой переменной (результирующим показателем),а другие — объясняющими переменными (факторы-аргументами).
Как правило, в каждое такое соотношение приходится вводить несколько объясняющих переменных и остаточную случайную составляющую, отражающую влияние на результирующий показатель всех неучтенных факторов. Например, спрос на товар можно рассматривать как функцию его цены, потребительского дохода и цен на конкурирующие и дополняющие товары. Производственные затраты зависят от объема производства, его динамики, цен на основные производственные ресурсы. Потребительские расходы — функция дохода, ликвидных активов и предыдущего уровня потребления.
Участвующая в каждом из этих соотношений случайная составляющая, отражающая влияние на результирующий показатель всех неучтенных факторов, обусловливает стохастический характерзависимости: даже зафиксировав значения объясняющих переменных (например, цена на сам товар и на конкурирующие с ним или дополняющие товары, а также потребительский доход), мы не можем ожидать однозначно,каким будет спрос на данный товар. Иначе говоря, переходя в своих наблюдениях спроса от одного временного (илипространственного) промежутка к другому, мы увидим случайное варьированиеспроса около некоторого определенного уровня даже при фиксировании всех объясняющих переменных.
Ошибки
Допустим, переменная у зависит от переменной z, что задано следующим соотношением:
где v — случайный член с нулевым средним и дисперсией σv2.
Предположим, что z невозможно измерить абсолютно точно, и мы будем использовать х для обозначения его измеренного значения. В i-м наблюдении xi равно истинному значению zi, плюс ошибка измерения wi:
xi = zi + wi
Допустим, что w имеет нулевое среднее и дисперсию σ i2, что D (z) в 6oльших выборках стремится к конечному пределу σz2 и что z и v распределены независимо.
Тогда получим:
Это уравнение имеет две случайные составляющие — первоначальный случайный член v и ошибку измерения w (умноженную на —β). Вместе они образуют составную случайную переменную, которую мы назовем e:
Соотношение можно теперь записать как
Имея значения переменных у (временно будем предполагать, что они измерены точно) и х, мы, несомненно, можем оценить регрессионную зависимость у от х.
Анализируя ошибку, можно заметить, что она, вероятно, поведет себя не так, как требуется. Переменная х зависит от w, от этой величины зависит также и e. Когда ошибка измерения в наблюдении оказывается положительной, происходят две вещи: х, имеет положительную составляющую wi, a ej имеет отрицательную составляющую —βwi.. Аналогично, если ошибка измерения отрицательна, она вносит отрицательный вклад в величину хi и положительный вклад в величину eг Следовательно, корреляция между х и e отрицательна. Величина cov (х, и) не равна нулю, а b является несостоятельной оценкой β.
Даже если бы у нас была очень большая выборка, оценка оказалась бы неточной. Она бы занижала β на величину
.
Таким образом, оценки МНК будут смещенными и несосстоятельными.
В то же время при ощибках измерения зависимой переменной лишь возрастает дисперся регрессии, а оценки параметров остаются несмещенными и состоятельными.