Прогноз ожидаемого значения результативного признака по линейному уравнению регрессии

Пусть требуется оценить прогнозное значение признака-результата для заданного набора значений факторов (хрТ={1,х1р,х2p,…,xmp}). Прогнозируемое значение признака-результата c доверительной вероятностью γ равной (1-a) принадлежит интервалу прогноза:

(yp-t·mp; yp+t·mp),

где yp- точечный прогноз;

t – коэффициент доверия, определяемый по таблицам распределения Стьюдента в зависимости от уровня значимости a и числа степеней свободы (n-h), h – число оцениваемых параметров;

mp- средняя ошибка прогноза.

Точечный прогноз рассчитывается по линейному уравнению регрессии, как: yp= прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru 0+ прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru 1·x1p+ прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru 2·x2p …+ прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru m·xmp.

Имеется два источника неопределенности в точечном прогнозе по уравнению регрессии: 1) отклонение точек от выборочной прямой регрессии; 2) отклонение выборочной регрессии от «истинной» (генеральной) регрессии. Неопределенность точечного прогноза учитывается в ошибке прогноза.

Средняя ошибка прогноза представляет собой квадратный корень из дисперсии прогнозируемого значения результата – σ2[yp]. Действительно от выборки к выборке параметры уравнения регрессии меняются, следовательно, меняется прогнозируемое значение результата при одном и том же наборе значений факторов. Поэтому yр можно рассматривать как случайную величину и рассчитать для нее дисперсию:

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru

т.к. cov(bi,bj)=cov(bj,bi).

В матричной форме записи прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru ,

где хрТ={1,х1р,х2p,…,xmp} – вектор прогнозных значений факторов.

Так как дисперсия случайной составляющей нам неизвестна, то воспользуемся ее оценкой – su2 . Тогда Оценка дисперсии прогноза или квадрат средней ошибки прогноза будет рассчитываться так:

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru .

А доверительный интервал прогноза будет определяться как:

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru

В случае парной (с одним фактором - х) линейной регрессии средняя ошибка прогноза определяется по формуле:

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru ,

где su – средняя квадратическая ошибка регрессии.

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru

1-е слагаемое под корнем - мера отклонения точек от выборочной регрессии; 2- слагаемое – мера отклонения выборочной регрессии от генеральной.

Для больших выборок: прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru

По мере удаления хр от среднего значения ( прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru ) ширина доверительного интервала будет увеличиваться.

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru

Для нашего примера: спрогнозируем объем продаж магазина розничной торговли, если численность населения в торговой зоне равна 2 тыс. чел., а расстояние до магазина от центра 7 км, т.е. ХрТ={1, 2,7}.

Точечный прогноз объема продаж (по уравнению регрессии) будет:

y’x1,x2= 29,4 +4,2· 2 - 0,92· 7=31,36 (усл.ден.ед.)

Рассчитаем доверительные границы прогноза:

Коэффициент доверия t(α=0,05; 12-3=9)=2,26.

Средняя ошибка прогноза будет равна:

прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru

su2=1,65; прогноз ожидаемого значения результативного признака по линейному уравнению регрессии - student2.ru .

Предельная ошибка прогноза будет равна 2,26·0,682=1,54.

Тогда доверительные границы прогноза будут следующими:

Нижняя граница: 31,36-1,54=29,82.

Верхняя граница: 31,36+1,54=32,9.

С вероятностью 0,95 можно утверждать, что объем продаж магазина при численности населения 2 тыс.чел. и расстоянии до центра 7 км будет в пределах от 29,8 до 32,9 усл.ден.ед.

Наши рекомендации