Доверительные интервалы для зависимой переменной

Решение

Линейное уравнение регрессии имеет вид y = bx + a + ε

Здесь ε - случайная ошибка (отклонение, возмущение).

Так как отклонения εi для каждого конкретного наблюдения i – случайны и их значения в выборке неизвестны, то:

1) по наблюдениям xi и yi можно получить только оценки параметров α и β

2) Оценками параметров α и β регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;

Для расчета параметров регрессии и для оценки качества параметров регрессии построим таблицу

x y y(x) x2 y2 x • y (yi-ycp)2 (y-y(x))2 (xi-xcp)2 |y - yx|:y
74.4 17.49 6.76 4.37 0.0338
69.86 0.67 4.57 15.28 0.0297
66.84 23.21 1.36 62.55 0.0171
64.57 96.4 2.45 119.01 0.0249
69.1 33.85 4.43 24.1 0.0314
73.64 7.94 13.27 1.19 0.052
78.18 17.49 1.4 50.28 0.0153
82.72 84.31 0.52 171.37 0.00878
77.43 38.21 2.48 37.1 0.0199
72.89 0.0331 0.0128 0.00826 0.00155
71.37 0.0331 2.64 3.64 0.0223
319.64 39.9 488.91 0.26

Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Коэффициент корреляции

Ковариация.

Рассчитываем показатель тесноты связи. Таким показателем является выборочный линейный коэффициент корреляции, который рассчитывается по формуле:

Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 0.76 x -1.24

Индекс корреляции.

Для линейной регрессии индекс корреляции равен коэфииценту корреляции rxy = 0.94.

Для любой формы зависимости теснота связи определяется с помощью множественного коэффициента корреляции:

Коэффициент детерминации.

Чаще всего, давая интерпретацию коэффициента детерминации, его выражают в процентах.

R2= 0.942 = 0.88

Значимость коэффициента корреляции.

Для того чтобы при уровне значимости α проверить нулевую гипотезу о равенстве нулю генерального коэффициента корреляции нормальной двумерной случайной величины при конкурирующей гипотезе H1 ≠ 0, надо вычислить наблюдаемое значение критерия

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости α и числу степеней свободы k = n - 2 найти критическую точку tкрит двусторонней критической области. Если tнабл < tкрит оснований отвергнуть нулевую гипотезу. Если |tнабл| > tкрит — нулевую гипотезу отвергают.

По таблице Стьюдента с уровнем значимости α=0.05 и степенями свободы k=9 находим tкрит:

tкрит (n-m-1;α/2) = (9;0.025) = 2.262

где m = 1 - количество объясняющих переменных.

Интервальная оценка для коэффициента корреляции (доверительный интервал).

r(0.85;1.02)

Анализ точности определения оценок коэффициентов регрессии.

Несмещенной оценкой дисперсии возмущений является величина:

S2y = 4.43 - необъясненная дисперсия (мера разброса зависимой переменной вокруг линии регрессии).

Sy = 2.11 - стандартная ошибка оценки (стандартная ошибка регрессии).

Sa - стандартное отклонение случайной величины a.

Sb - стандартное отклонение случайной величины b.

Проверка гипотез относительно коэффициентов линейного уравнения регрессии

1) t-статистика. Критерий Стьюдента.

tкрит (n-m-1;α/2) = (9;0.025) = 2.262

Доверительный интервал для коэффициентов уравнения регрессии.

(b - tкрит Sb; b + tкрит Sb)

(a - tкрит Sa; a + tкрит Sa)

2) F-статистика. Критерий Фишера.

Табличное значение критерия со степенями свободы k1=1 и k2=9, Fтабл = 5.12

Ошибка аппроксимации.

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем подборе уравнения регрессии к исходным данным.

Доверительные интервалы для зависимой переменной.

(a + bxp ± ε)

где

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 120

Доверительные интервалы для зависимой переменной - student2.ru

Наши рекомендации