Точность коэффициентов регрессии. Доверительные интервалы
Оценки коэффициентов регрессии зависят от используемой выборки зна-чений переменных x и y и являются случайными величинами. Для характери-стики точности полученных оценок можно использовать стандартные ошибки коэффициентов регрессии.
Под стандартной ошибкой коэффициента регрессии понимается оценка стан-дартного отклонения функции плотности вероятности данного коэффициента.
Стандартные ошибки коэффициентов регрессии sbi определяются соотно-шениями
sbi | ii | , | (3.29) | ||||||||||||||||||
sост(X X ) | |||||||||||||||||||||
где s2ост представляет собой несмещенную оценку остаточной дисперсии | |||||||||||||||||||||
n | |||||||||||||||||||||
sост2 | ( yˆiyi ) | ; | |||||||||||||||||||
i 1 | |||||||||||||||||||||
n p 1 | |||||||||||||||||||||
. | |||||||||||||||||||||
( X X ) | диагональный элемент матрицы (X X) | ||||||||||||||||||||
ii | |||||||||||||||||||||
можно вычислить как | |||||||||||||||||||||
Величину (X X) | |||||||||||||||||||||
ii | |||||||||||||||||||||
Aii | |||||||||||||||||||||
( X X ) | , | ||||||||||||||||||||
ii | |||||||||||||||||||||
det(X X ) |
где Aii алгебраическое дополнение к элементу ii матрицы (X X) .
Сопоставляя оценки параметров и их стандартные ошибки, можно сделать вывод о надежности (точности) полученных оценок.
Для оценки статистической значимости коэффициентов регрессии приме-няется t-критерий Стьюдента, основанный на том факте, что отношения
~ | ||||
tb | bi bi | (i 1, 2,..., p) | (3.30) | |
sbi | ||||
i | ||||
являются t-статистиками, т. е. случайными величинами, распределенными по
~
закону Стьюдента с числом степеней свободы n p1. Через bi обозначены точ-
ные значения коэффициентов регрессии.
Согласно t-критерию Стьюдента, выдвигается «нулевая» гипотеза H0 о ста-тистической незначимости коэффициента уравнения регрессии (т. е. о стати-стически незначимом отличии величины а или bi от нуля). Эта гипотеза отвер-гается при выполнении условия t>tкрит, где tкрит определяется по таблицам
t-критерия Стьюдента(П2)по числу степеней свободы k1= n p 1 (p числонезависимых переменных в уравнении регрессии) и заданному уровню значи-мости α.
t-критерий Стьюдента применяется в процедуре принятия решения о целе-сообразности включения фактора в модель. Если коэффициент при факторе в уравнении регрессии оказывается незначимым, то включать данный фактор в модель не рекомендуется. Отметим, что это правило не является абсолютным и бывают ситуации, когда включение в модель статистически незначимого фак-тора определяется экономической целесообразностью.
yˆxi p |
Доверительные интервалы для параметров bi уравнения линейной регрессии определяются соотношениями:
bi t1α, np1· sbi | ~ | bi | + t1α, np1 · sbi. | (3.31) | |
bi |
Величина t1α,n-2 представляет собой табличное значение t-критерия Стью-дента на уровне значимости α при степени свободы n–2.
Если в границы доверительного интервала попадает ноль, т. е. нижняя гра-ница отрицательна, а верхняя положительна, то оцениваемый параметр прини-мается равным нулю, так как он не может одновременно принимать и положи-тельное, и отрицательное значения.
Точность полученного уравнения регрессии можно оценить, анализируя доверительный интервал для функции регрессии, т. е. для среднего значения ỹ0, зависимой переменной y при заданных значениях объясняющих переменных
x1= x10, x2= x20, ..., xp= xp0.,
Доверительный интервал для функции регрессии определяется соотноше-ниями
ŷ0t1α, np1·sŷ ỹ0 ŷ0+t1α, np1sŷ, | (3.32) |
где ŷ0– групповая средняя, определяемая по уравнению регрессии (3.4) при за-
данных значениях объясняющих переменных | x1= x10, x2= x20, ..., xp= xp0; | |||||||||
(3.33) | ||||||||||
syˆsîñòX 0 | (X X ) X0 – ее стандартная ошибка; | |||||||||
ỹ0–точное значение групповой средней;X0 | – вектор, составленный из задан- | |||||||||
ных значений независимых переменных X0 | = (1, x10, | x20, ..., xp0). | ||||||||
Доверительный интервал для индивидуальных значений зависимой пере- | ||||||||||
менной y*0 определяется соотношениями | ||||||||||
ŷ0t1α, np1·sŷ0 | y*0ŷ0+ | t1α, np1 sŷ0, | (3.34) | |||||||
где | ||||||||||
syˆ | sîñò | (3.35) | ||||||||
X 0 | (X X )X0 | |||||||||
есть стандартная ошибка индивидуальных значений зависимой переменной y*0.