Ошибки измерения объясняющих переменных

Допустим, переменная у зависит от переменной z, что задано следующим соотношением: Ошибки измерения объясняющих переменных - student2.ru , (7)

где ν — случайный член с нулевым средним и дисперсией Ошибки измерения объясняющих переменных - student2.ru . Предположим, что z невозможно измерить абсолютно точно, и мы будем использовать x для обозначения его измеренного значения. В i-м наблюдении xi равно истинному значению zi, плюс ошибка измерения wi:

Ошибки измерения объясняющих переменных - student2.ru (8) Допустим, что w имеет нулевое среднее и дисперсию Ошибки измерения объясняющих переменных - student2.ru , что Var (z) в боль­ших выборках стремится к конечному пределу Ошибки измерения объясняющих переменных - student2.ru и что z и v распределены независимо. Подставляя формулу (8) в уравнение (7), получим:

Ошибки измерения объясняющих переменных - student2.ru . (9) Это уравнение имеет две случайные составляющие — первоначальный случай­ный член v и ошибку измерения w (умноженную на Ошибки измерения объясняющих переменных - student2.ru ). Вместе они образуют составную случайную переменную, которую мы назовем u:

Ошибки измерения объясняющих переменных - student2.ru . (10) Соотношение (9) можно теперь записать как

Ошибки измерения объясняющих переменных - student2.ru . (11) Имея значения переменных у (временно будем предполагать, что они измерены точно) и х, мы, несомненно, можем оценить регрессионную зависи­мость у от х.

Коэффициент регрессии b, как обычно, представляется выражением (2). Анализируя ошибку, можно заметить, что она, вероятно, поведет себя не так, как требуется. Переменная х зависит от w (8), от этой величины зависит также и u (10). Когда ошибка измерения в наблюдении оказывается положительной, происходят две вещи: xi имеет положительную составляющую wi, а ui имеет отрицательную составляющую Ошибки измерения объясняющих переменных - student2.ru Аналогично, если ошибка измерения отри­цательна, она вносит отрицательный вклад в величину хi и положительный вклад в величину ui. Следовательно, корреляция между x и u отрицательна. Величина pop. cov (x, u) не равна нулю, а из соотношения (2) следует, что b является несостоятельной оценкой β.

Даже если бы у нас была очень большая выборка, оценка оказалась бы не­ точной. Она бы занижала β на величину

Ошибки измерения объясняющих переменных - student2.ru (12)

Доказательство этого дается ниже. Сначала мы отметим его очевидные следствия. Чем больше теоретическая дисперсия ошибки измерения по отношению к те­оретической дисперсии z, тем больше будет отрицательное смещение. Например, если бы Ошибки измерения объясняющих переменных - student2.ru было равно 0,25 Ошибки измерения объясняющих переменных - student2.ru , то отрицательное смещение составило бы:

Ошибки измерения объясняющих переменных - student2.ru

что равняется 0,2β. Даже если бы выборка была очень большой, оценка ока­залась бы на 20% ниже истинного значения при положительном β и на 20% выше его при отрицательном β.

Рисунок 1 показывает, как ошибка измерения приводит к появлению сме­щенных коэффициентов регрессии, если использовать модель, представленную выражениями (7) и (8). На рис. 1 А мы предполагаем, что ошибка изме­рения отсутствует и что отклонения от линии регрессии вызываются только случайным членом v. На рис. 1 Б предполагается, что переменная х подверже­на воздействию существенной ошибки измерения, которая сдвигает наблю­дения вправо при их положительном значении и влево — при отрицательном. По причине горизонтального рассеяния множество точек наблюдений здесь кажется более пологим, чем на рис. 1 А, и оцененная линия регрессии будет иметь тенденцию к занижению угла наклона истинной линии зависимости. Чем больше дисперсия ошибки измерения по отношению к дисперсии х, тем больше окажется эффект уменьшения угла наклона и тем сильнее будет сме­щение.

Наши рекомендации