Доверительные интервалы для зависимой переменной
Решение
Линейное уравнение регрессии имеет вид y = bx + a + ε
Здесь ε - случайная ошибка (отклонение, возмущение).
Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров α и β
2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Для расчета параметров регрессии и для оценки качества параметров регрессии построим таблицу
x | y | y(x) | x2 | y2 | x • y | (yi-ycp)2 | (y-y(x))2 | (xi-xcp)2 | |y - yx|:y |
74.4 | 17.49 | 6.76 | 4.37 | 0.0338 | |||||
69.86 | 0.67 | 4.57 | 15.28 | 0.0297 | |||||
66.84 | 23.21 | 1.36 | 62.55 | 0.0171 | |||||
64.57 | 96.4 | 2.45 | 119.01 | 0.0249 | |||||
69.1 | 33.85 | 4.43 | 24.1 | 0.0314 | |||||
73.64 | 7.94 | 13.27 | 1.19 | 0.052 | |||||
78.18 | 17.49 | 1.4 | 50.28 | 0.0153 | |||||
82.72 | 84.31 | 0.52 | 171.37 | 0.00878 | |||||
77.43 | 38.21 | 2.48 | 37.1 | 0.0199 | |||||
72.89 | 0.0331 | 0.0128 | 0.00826 | 0.00155 | |||||
71.37 | 0.0331 | 2.64 | 3.64 | 0.0223 | |||||
319.64 | 39.9 | 488.91 | 0.26 |
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции
Ковариация.
Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:
Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 0.76 x -1.24
Индекс корреляции.
Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.94.
Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:
Коэффициент детерминации.
Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.
R2= 0.942 = 0.88
Значимость коэффициента корреляции.
Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия
и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.
По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=9 находим tкрит:
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
где m = 1 - количество объясняющих переменных.
Интервальная оценка для коэффициента корреляции (доверительный интервал).
r(0.85;1.02)
Анализ точности определения оценок коэффициентов регрессии.
Несмещенной оценкой дисперсии возмущений является величина:
S2y = 4.43 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).
Sy = 2.11 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
Проверка гипотез относительно коэффициентов линейного уравнения регрессии
1) t-статистика. Критерий Стьюдента.
tкрит (n-m-1;α/2) = (9;0.025) = 2.262
Доверительный интервал для коэффициентов уравнения регрессии.
(b - tкрит Sb; b + tкрит Sb)
(a - tкрит Sa; a + tкрит Sa)
2) F-статистика. Критерий Фишера.
Табличное значение критерия со степенями свободы k1=1 и k2=9, Fтабл = 5.12
Ошибка аппроксимации.
Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.
Доверительные интервалы для зависимой переменной.
(a + bxp ± ε)
где
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 120