Доверительные интервалы для коэффициентов: реальные статистические данные

Практическому построению доверительных интервалов для коэффициентов aj нормальной модели линейной множественной регрессии

у=a0+a1х1 +a2х2 +…+amхm+e.

где e нормально распределенная случайная величина с параметрами Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , препятствует вхождение в выражения для дисперсий

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

неизвестного значения s2.

Единственный выход из этого положения –заменить неизвестное значение s2какой-нибудь подходящей его оценкой (estimate), которую можно было бы вычислить на основании имеющихся статистических данных. Такого рода оценки принято называть статистиками (statistics).

В данной ситуации такой подходящей оценкой для неизвестного значения Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru является статистика

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru (см. (2.8)).

Поскольку сумма Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru является квадратичной функцией от случайных величинe=( Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ), то она является случайной величиной, а следовательно, случайной величиной является и статистика `S2.

Математическое ожидание этой случайной величины равно Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru :

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

т. е. Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru –несмещенная оценка для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Замечание.В частном случае (при отсутствии факторов) модель наблюдений принимает вид

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

(случайная выборка из распределения N (a0,s2)). Несмещенной оценкой для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru служит

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Оценкой наименьших квадратов для параметра a0 Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru является Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , так что

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Таким образом, выборочная дисперсия Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru переменной Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , получаемая делением Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru именно на Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru (а не на Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ), является несмещенной оценкой для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru в модели случайной выборки из нормального распределения, имеющего дисперсию Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Этим и объясняется сделанный нами выбор нормировки при определении выборочных дисперсий и ковариаций.

При выполнении стандартных предположений отношение

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

имеет стандартное распределение, называемое распределением хи-квадрат с (n-m-1) степенями свободы. Такое же распределение имеет сумма квадратов Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru случайных величин, независимых в совокупности и имеющих одинаковое стандартное нормальное распределение. При Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru график функции плотности этого распределения имеет вид

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Для обозначения распределения хи-квадрат сKстепенями свободы используют символ c2(K).

Итак, мы не знаем истинного значения Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru и поэтому в попытке построить доверительный интервал для aj вынуждены заменить неизвестное нам значение Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru на его несмещенную оценку

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Соответственно, вместо отношения

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

приходится использовать отношение

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Однако последнее отношение как случайная величина уже не имеет стандартного нормального распределения, поскольку в знаменателе теперь стоит не постоянная, а случайная величина.

Тем не менее, распределение последнего отношения также относят к стандартным, и оно известно под названием t-распределения Стьюдента с (n-m-1) степенями свободы.

Для распределения Стьюдента с Kстепенями свободы принято обозначение t (K). Квантиль уровня ртакого распределения будем обозначать символом tp(K). График функции плотности распределения Стьюдента симметричен относительно нуля и похож на график функции плотности нормального распределения.

Например, приK=10 он имеет следующий вид (левый график).

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Для сравнения, справа приведен график функции стандартного нормального распределения. Отличие графиков столь невелико, что визуально они почти неразличимы. Квантили этих двух распределений различаются более ощутимо:

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Распределение Стьюдента имеет более тяжелые хвосты. Из приведенных значений квантилей следует, например, что случайная величина, имеющая стандартное нормальное распределение, может превысить значение 1.645 лишь с вероятностью 0.05. В то же самое время, с такой же вероятностью 0.05 случайная величина, имеющая распределение Стьюдента с 10 степенями свободы, принимает значения, большие, чем 1.812.

Впрочем, для значений Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru квантили распределения Стьюдента Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru практически совпадают с соответствующими квантилями стандартного нормального распределения Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Итак,

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ~ Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Поэтому для этой случайной величины выполняется соотношение

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

так что с вероятностью, равной Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , выполняется двойное неравенство

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

т. е.

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Иными словами, с вероятностью, равной 1-g,случайный интервал

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

накрывает истинное значение коэффициента αj, т. е. является 95%- доверительным интервалом для αjв случае, когда не известно истинное значение s2дисперсии случайных ошибок Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . В среднем, длина такого интервала больше, чем длина доверительного интервала с тем же уровнем доверия, построенного при известном значении Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Замечание.Выбор конкретного значения Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru определяет компромисс между желанием получить более короткий доверительный интервал и желанием обеспечить более высокий уровень доверия.

Попытка повысить уровень доверия Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , выраженная в выборе меньшего значения Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , приводит к квантили Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru с более высоким значением Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , т. е. к большему значению Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Но длина доверительного интервала пропорциональна Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Следовательно, увеличение уровня доверия сопровождается увеличением ширины доверительного интервала(при тех же статистических данных).

Так, для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru можно приближенно считать, что

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ,

где Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru – квантиль уровня Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru стандартного нормального распределения.

Соответственно, выбирая уровень доверия Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru равным Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru или Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , мы получаем для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru значения, приблизительно равные Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Это означает, что переход от уровня доверия Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru к уровню доверия Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru сопровождается увеличением длины доверительного интервала приблизительно в Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru раза, а дополнительное повышение уровня доверия до Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru увеличивает длину доверительного интервала еще примерно в Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru раза.

Теперь мы в состоянии перейти к построению интервальных оценок параметров моделей линейной регрессии для различного рода социально-экономических факторов на основании соответствующих статистических данных.

Пример.Пусть при построении модели зависимости уровня безработицы среди белого населения США от уровня безработицы среди цветного населения в виде

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

получены следующие значения:

Š=0.161231; Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Получаем: Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru = Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Для построения Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru — доверительного интервала для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru остается найти квантиль уровня Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru распределения Стьюдента с Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru степенями свободы. Используя, например, приложение 1, находим: Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Соответственно, получаем Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru -доверительный интервал для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru в виде

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

т. е.

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru имеем Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ; Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru -доверительный интервал для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru имеет вид

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

т. е.

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

В связи с этим примером, отметим два обстоятельства.

(а) Доверительный интервал для коэффициента Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru допускает как положительные, так и отрицательные значения этого коэффициента.

(б) Каждый из двух построенных интервалов имеет уровень доверия Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ; однако это не означает, что с той же вероятностью Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru сразу оба интервала накрывают истинные значения параметров Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Справиться с первым затруднением в данном примере можно, понизив уровень доверия до Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . В этом случае в выражении для доверительного интервала квантиль Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru заменяется на квантиль Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , так что левая граница доверительного интервала для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru становится положительной и равной Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Однако это достигается ценой того, что новый доверительный интервал будет накрывать истинное значение параметра Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru в среднем только в 90 случаев из 100, а не в 95 из 100 случаев.

Что касается второго затруднения, то наиболее простой путь взятия под контроль вероятности одновременного накрытия доверительными интервалами для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru истинных значений этих параметров связан с тем, что

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru оба интервала накрывают Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru и Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , соответственно Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru =

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru хотя бы один из них не накрывает соответствующее Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru =

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru доверительный интервал для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru не накрывает Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru +

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru доверительный интервал для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru не накрывает Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru -

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru оба интервала не накрывают свои Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru =

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru оба интервала не накрывают свои Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ³

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Следовательно, если построить доверительный интервал для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru и доверительный интервал для Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru с уровнями доверия каждого, равными Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , то тогда правая часть полученной цепочки соотношений будет равна Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

Это означает, что в нашем примере мы можем гарантировать, что вероятность одновременного накрытия истинных значений Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru соответствующими доверительными интервалами будет не менее Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , если возьмем Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru . Но тогда при построении этих интервалов придется использовать вместо значения

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru

значение

Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru ,

так что каждый из исходных интервалов увеличится в Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru раза. Это, конечно, приводит к еще более неопределенным выводам относительно истинных значений параметров Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru , Доверительные интервалы для коэффициентов: реальные статистические данные - student2.ru .

Наши рекомендации