Доверительный интервал для индивидуальных
значений
Выше мы построили доверительный интервал для СВ - условного среднего (х). Случайной эта средняя величина является в силу того, что параметры регрессии b0 и b1 сами являются случайными величинами. Однако в каждой реализации (х) отклоняется от своего среднего, являясь, таким образом, как бы дважды случайной величиной. Ясно, что для индивидуальных значений (х) доверительный интервал будет еще больше, чем для средних значений (х).
На рис. 2.2 этот доверительный интервал, также зависящий от х, представлен двумя тонкими плавно изогнутыми линиями. Именно этот интервал и определяет точность (конус) прогноза.
При определении доверительного интервала для индивидуальных значений зависимой переменной нужно учесть ее рассеяние вокруг линии регрессии, т.е. в суммарную дисперсию нужно включить еще s2. Тогда получим оценку дисперсии индивидуальных значений для данного х:
. | (2.27) |
Искомый доверительный интервал для индивидуальных значений :
- t1-a, n-2 £ £ + t1-a, n-2 . | (2.28) |
2.7. Доверительный интервал для параметров регрессии
Иногда задача эконометрического исследования требует интервального оценивания параметров регрессии, в частности, для коэффициента регрессии b1 и дисперсии ошибки s2. Доказано, что при выполнении предпосылки-5 статистика t = (b1 -b1)/ /sb1 имеет стандартный НЗР, а статистика
. | (2.29) |
имеет t-распределение Стьюдента с k=n-2 степенями свободы. Поэтому доверительный интервал для b1 с доверительной вероятностью 1-a имеет вид:
. | (2.30) |
Построим доверительный интервал для s2. Статистика ns2 / s2 имеет распределение c2 с k=n-2 степенями свободы. Поэтому интервальная оценка с уровнем значимости a имеет вид:
. | (2.31) |
Доверительный интервал выбирается так, что:
Р(c2 < ) = Р(c2 > ).
Оценка значимости уравнения регрессии
Оценить значимость регрессии - значит подтвердить или опровергнуть суждение о том, что математическая модель, выражающая связь между переменными, соответствует наблюденным данным и что для описания зависимой переменной достаточно объясняющих переменных.
Для решения задачи используются элементы дисперсионного анализа, согласно которому:
Q = QR + Qe, | (2.32) |
где Q = å (yi - )2 - общая сумма квадратов отклонений зависимой переменной от ее средней; QR = å ( - -)2 - сумма квадратов отклонений, обусловленная регрессией; Qe = å (yi - )2 - остаточная сумма квадратов отклонений, обусловленная влиянием неучтенных факторов. Схема дисперсионного анализа отражена в табл. 2.4.
Таблица 2.4