Точность коэффициентов регрессии. Проверка значимости
Полученные согласно формулам (2.13) оценки коэффициентов регрессии зависят от используемой выборки значений переменных x и y и являются слу-чайными величинами. Представление о точности полученных оценок, о том на-сколько далеко они могут отклониться от истинных значений коэффициентов можно получить используя, так называемые «стандартные ошибки» коэффици-ентов регрессии.
Под стандартной ошибкой коэффициента регрессии понимается оценка стандартного отклонения функции плотности вероятности коэффициента.
Стандартные ошибки коэффициентов регрессии (sa,sb) определяются со-отношениями
n | ||||||||||||||||||||||
sb | ( yˆiyi )2 /(n 2) | s | s | |||||||||||||||||||
i 1 | ост | ост | , | (2.33) | ||||||||||||||||||
n | ||||||||||||||||||||||
(xi | x | x n | ||||||||||||||||||||
i 1 | ||||||||||||||||||||||
n | n | n | n | |||||||||||||||||||
( yˆiyi )2 | xi2 | xi2 | xi2 | |||||||||||||||||||
i 1 | i 1 | i 1 | i 1 | |||||||||||||||||||
sa | sост | sост | , (2.34) | |||||||||||||||||||
n | n | n x | ||||||||||||||||||||
n (xi | n x | |||||||||||||||||||||
i 1 |
где s2ост представляет собой несмещенную оценку остаточной дисперсии
n | ||||||||||
sост2 | ( yˆi | yi)2 | . | (2.35) | ||||||
i 1 | ||||||||||
n 2 | ||||||||||
Сопоставляя оценки параметров и их стандартные ошибки можно сделать | ||||||||||
вывод о надежности (точности) полученных оценок. | ||||||||||
Отношения | a | ~ | ~ | |||||||
ta | a | и | tb | b b | (2.36) | |||||
sb | sb | |||||||||
в случае нормально распределенной ошибки εi являются t-статистиками, т. е. случайными величинами, распределенными по закону Стьюдента с числом сте-
пеней свободы 2. Через ~ и ~ обозначены точные значения коэффициентов n a b
регрессии.
Для оценки статистической значимости коэффициентов регрессии приме-няется t-критерий Стьюдента, согласно которому выдвигается «нулевая» гипо-теза H0 о статистической незначимости коэффициента уравнения регрессии (т. е. о статистически незначимом отличии величиныаилиbот нуля). Эта ги-потеза отвергается при выполнении условия t>tкрит, где tкрит определяется по таблицам t-критерия Стьюдента ( П2) по числу степеней свободы k1=n k1 (k число независимых переменных в уравнении регрессии) и заданному уровню значимости α.
t-критерий Стьюдента может использоваться и для оценки статистическойзначимости выборочного коэффициента корреляции rxy, так как величина
txy | rxy | , | (2.37) | ||||||
sr | |||||||||
xy | |||||||||
где | |||||||||
1 r2 | |||||||||
srxy | xy | (2.38) | |||||||
n 2 | |||||||||
свободы n2. Через | |||||||||
распределена по закону Стьюдента с | числом степеней |
srxyобозначена стандартная ошибка коэффициента корреляцииrxy.
Проверка значимости оценок параметров ничего не говорит о том, на-сколько эти оценки могут отличаться от точных значений. Ответ на этот во-прос дает построение доверительных интервалов.
Под доверительным интервалом понимаются пределы, в которых лежит точное значение определяемого показателя с заданной вероятностью (P= 1 α).
Доверительные интервалы для параметров a и b уравнения линейной рег-рессии определяются соотношениями:
a t1α,n-2· sa; b t1α,n-2· sb. | (2.39) |
Величина t1α,n-2 представляет собой табличное значение t-критерия Стью-дента на уровне значимости α при числе степеней свободы n–2.
Если в границы доверительного интервала попадает ноль, т. е. нижняя гра-ница отрицательна, а верхняя положительна, то оцениваемый параметр прини-мается равным нулю, так как он не может одновременно принимать и положи-тельное, и отрицательное значения.
Для статистически значимого коэффициента корреляции rxy интервальные
оценки (доверительный интервал) получают с использованием Z-преобразования Фишера:
Z Z(r | ) | 1 | ln | 1 rxy | . | (2.40) | |||
xy | 1 rxy | ||||||||
Первоначально определяется интервальная оценка для z | |||||||||
z z | 't1 / 2 | , | (2.41) | ||||||
n 3 | |||||||||
где t1α/2– квантиль стандартного нормального распределения порядка 1–α/2,z' = Z (rxy) –значение Z-преобразования Фишера,соответствующее полученно-му значению коэффициента корреляции rxy.
Граничные значения доверительного интервала (r–,r+) для rxy получаются из граничных значений доверительного интервала (z–,z+) для z с помощью об-
ратного Z-преобразования Фишера rxyZ1(z)
r Z 1(z ); r Z 1(z ). | (2.42) |