Прогнозирование с применением парного уравнения регрессии
Регрессионные модели могут использоваться для прогнозирования возможных ожидаемых значений исследуемой переменной при заданных (или определённых за рамками модели) значениях факторной переменной. При этом различают точечный и интервальный прогнозы.
Рассмотрим прогнозирование на основе парной линейной модели регрессии
,
Точечный прогноз вычисляем путём подстановки в уравнение прогнозного значения факторной переменной:
. (2.21)
Вероятность реализации точечного прогноза практически равна нулю. Поэтому в дополнение к точечному прогнозу рассчитывается средняя ошибка прогноза или доверительный интервал прогноза с достаточно большой надёжностью. Размах прогнозного интервала L зависит от стандартной ошибки (3.8), удаления xпрогн от своего среднего значения в ряде наблюдений xср, количества наблюдений n и уровня значимости прогноза α :
. (2.22)
Тогда фактические значения исследуемого признака с вероятностью (1-α) попадут в интервал
(2.23)
Чем больше количество наблюдений n и чем ближе прогнозное значение факторной переменной xпрогн к среднему в ряду наблюдений значению xср, тем меньше прогнозный интервал, то есть лучше качество прогнозирования. Качество самой эконометрической модели влияет на величину прогнозного интервала через стандартную ошибку, которая зависит от величин элементов ряда остатков εi. Чем хуже качество модели, тем больше величины остатков ε, тем больше размах доверительного интервала. Наконец, на величину прогнозного интервала влияет задаваемый уровень значимости (вероятность ошибки). Чем меньше мы задаём уровень значимости, тем больше будет надёжность прогноза. Однако размах доверительного интервала при этом будет расти, поскольку величина t-статистики будет увеличиваться.
При определённых значениях размаха доверительного интервала прогноз теряет актуальность. Например, прогноз температуры воздуха на завтра с размером прогнозного интервала в 20-30 градусов никого не интересует.
Рассчитаем точечный и интервальный прогноз для объёма продаж в Примере 1 с использованием построенной нами в п. 2.4 линейной модели парной регрессии. Прогнозное значение факторной переменной x1прогн мы можем взять по данным Гидрометеоцентра, который, в свою очередь, делает прогноз на основе соответствующих математических моделей. Допустим прогнозное значение температуры воздуха x1прогн = 28 градусов. Тогда точечный прогноз по линейной модели:
.
Для построения доверительного интервала используем стандартную ошибку, вычисленную нами в п. 2.5 и данные Таблицы 2. С учётом получим размах доверительного интервала:
.
Следовательно, ожидаемое значение объёма продаж с вероятностью 90% будет находиться в интервале:
.
Прогнозный интервал получился достаточно большой, что и следовало ожидать исходя из неудовлетворительной точности линейной модели в данной задаче.
Прогнозирование на основе парных нелинейных моделей, которые заменой переменных сводятся к линейной модели, можно произвести, применив формулы (2.21)-(2.23) к линеаризованному виду нелинейной модели. Если исследуемая переменная не участвовала в заменах переменных, то полученный прогнозный интервал является конечным результатом прогнозирования. Если же мы произвели замену исследуемой переменной, то с помощью обратной замены мы должны будем вычислить прогнозный интервал для исходной исследуемой переменной.
Построим прогноз по данным нашего Примера 1 на основе построенной в п.2.7 парной показательной модели, у которой характеристики точности были выше, чем у линейной. В линеаризованном виде показательную модель можно записать в виде:
.
Построим дополнительную вспомогательную таблицу:
Таблица 5
x1 | 5,0 | 10,0 | 15,0 | 20,0 | 25,0 | 30,0 | 35,0 |
z | 0,69 | 1,25 | 1,61 | 2,48 | 3,09 | 3,69 | 3,74 |
zр | 0,71 | 1,26 | 1,81 | 2,37 | 2,92 | 3,47 | 4,02 |
ε | -0,013 | -0,006 | -1,203 | 0,120 | 0,173 | 0,217 | -0,287 |
Значение точечного прогноза для переменной z = ln y будет равно:
.
Для построения прогнозного интервала вычислим стандартную ошибку линеаризованной модели:
,
а с её использованием размах прогнозного интервала для z:
.
Таким образом, мы получаем прогнозный интервал:
.
Для определения прогнозного интервала исходной исследуемой переменной применим обратную замену:
.
В итоге получим прогнозный интервал для исходной исследуемой переменной с использованием показательной модели:
.
Длина интервала получилась меньше, чем длина прогнозного интервала, построенного с использованием линейной модели, чего и следовало ожидать, учитывая лучшие характеристики качества показательной модели по сравнению с линейной.
Однако, величина прогнозного интервала осталась достаточно большой, то есть прогноз остался достаточно грубым. Одним из способов улучшения качества модели, а значит, качества прогнозирования является введение в рассмотрение дополнительных факторных переменных, влияющих на исследуемый признак.