Прогноз ожидаемого значения результативного признака по линейному уравнению регрессии
Пусть требуется оценить прогнозное значение признака-результата для заданного набора значений факторов (хрТ={1,х1р,х2p,…,xmp}). Прогнозируемое значение признака-результата c доверительной вероятностью γ равной (1-a) принадлежит интервалу прогноза:
(yp-t·mp; yp+t·mp),
где yp- точечный прогноз;
t – коэффициент доверия, определяемый по таблицам распределения Стьюдента в зависимости от уровня значимости a и числа степеней свободы (n-h), h – число оцениваемых параметров;
mp- средняя ошибка прогноза.
Точечный прогноз рассчитывается по линейному уравнению регрессии, как: yp= 0+ 1·x1p+ 2·x2p …+ m·xmp.
Имеется два источника неопределенности в точечном прогнозе по уравнению регрессии: 1) отклонение точек от выборочной прямой регрессии; 2) отклонение выборочной регрессии от «истинной» (генеральной) регрессии. Неопределенность точечного прогноза учитывается в ошибке прогноза.
Средняя ошибка прогноза представляет собой квадратный корень из дисперсии прогнозируемого значения результата – σ2[yp]. Действительно от выборки к выборке параметры уравнения регрессии меняются, следовательно, меняется прогнозируемое значение результата при одном и том же наборе значений факторов. Поэтому yр можно рассматривать как случайную величину и рассчитать для нее дисперсию:
т.к. cov(bi,bj)=cov(bj,bi).
В матричной форме записи ,
где хрТ={1,х1р,х2p,…,xmp} – вектор прогнозных значений факторов.
Так как дисперсия случайной составляющей нам неизвестна, то воспользуемся ее оценкой – su2 . Тогда Оценка дисперсии прогноза или квадрат средней ошибки прогноза будет рассчитываться так:
.
А доверительный интервал прогноза будет определяться как:
В случае парной (с одним фактором - х) линейной регрессии средняя ошибка прогноза определяется по формуле:
,
где su – средняя квадратическая ошибка регрессии.
1-е слагаемое под корнем - мера отклонения точек от выборочной регрессии; 2- слагаемое – мера отклонения выборочной регрессии от генеральной.
Для больших выборок:
По мере удаления хр от среднего значения ( ) ширина доверительного интервала будет увеличиваться.
Для нашего примера: спрогнозируем объем продаж магазина розничной торговли, если численность населения в торговой зоне равна 2 тыс. чел., а расстояние до магазина от центра 7 км, т.е. ХрТ={1, 2,7}.
Точечный прогноз объема продаж (по уравнению регрессии) будет:
y’x1,x2= 29,4 +4,2· 2 - 0,92· 7=31,36 (усл.ден.ед.)
Рассчитаем доверительные границы прогноза:
Коэффициент доверия t(α=0,05; 12-3=9)=2,26.
Средняя ошибка прогноза будет равна:
su2=1,65; .
Предельная ошибка прогноза будет равна 2,26·0,682=1,54.
Тогда доверительные границы прогноза будут следующими:
Нижняя граница: 31,36-1,54=29,82.
Верхняя граница: 31,36+1,54=32,9.
С вероятностью 0,95 можно утверждать, что объем продаж магазина при численности населения 2 тыс.чел. и расстоянии до центра 7 км будет в пределах от 29,8 до 32,9 усл.ден.ед.