Доверительные интервалы прогноза
При определении прогнозных значений того или иного явления с помощью экстраполяции наибольший интерес представляет, по-видимому, не сама экстраполяция – это более или менее механический прием, а определение доверительных интервалов прогноза.
Доверительные интервалы могут быть определены двояко: формально и неформально. Что касается последнего, то это дело экспертного суждения, которое выносится при качественном осмыслении результатов прогноза, сопоставлении их с другими имеющимися у эксперта данными. При этом, естественно, эксперт должен учитывать не только степень колеблемости фактических уровней вокруг тренда в прошлом, но и возможность деформации тренда в будущем (соответственно могут быть получены различные варианты прогноза).
Формальный доверительный интервал учитывает лишь ту неопределенность, которая связана с ограниченностью числа наблюдений и соответствующей неточностью найденных оценок параметров кривой. Основной вопрос, – в какой мере в будущем сохранится найденная тенденция, – естественно, не может быть решен с помощью таких доверительных интервалов. Это дело содержательного экономического анализа и экспертной оценки.
Основное внимание в данном учебном пособии уделим оценке формальных доверительных интервалов, базирующихся на статистическом анализе.
Соответствующая погрешность имеет следующие источники:
1) выбор формы кривой, характеризующей тренд, содержит элемент субъективизма. Во всяком случае, часто нет твердой основы для того, чтобы утверждать, что выбранная форма кривой является единственно возможной, а тем более лучшей для экстраполяции в данных конкретных условиях;
2) оценивание параметров кривых (иначе говоря, оценивание тренда) производится на основе ограниченной совокупности наблюдений, каждое из которых содержит случайную компоненту. В силу этого параметрам кривой, а, следовательно, и ее положению в пространстве свойственна некоторая неопределенность;
3) тренд характеризует средний уровень ряда на каждый момент времени. Отдельные наблюдения, как правило, отклонялись от него в прошлом. Естественно ожидать, что подобного рода отклонения будут происходить и в будущем.
Вполне возможны случаи, когда форма кривой, описывающей тенденцию, выбрана неправильно или когда тенденция развития в будущем может существенно измениться и не следовать тому типу кривой, который был принят при выравнивании. В последнем случае основное допущение экстраполяции не соответствует фактическому положению вещей. Найденная кривая лишь выравнивает динамический ряд и характеризует тенденцию только в пределах периода, охваченного наблюдением. Экстраполяция такого тренда неизбежно приведет к ошибочному результату, причем ошибку такого рода нельзя оценить заранее. В связи с этим можно лишь отметить то, что, по-видимому, следует ожидать рост такой погрешности (или вероятности ее возникновения) при увеличении периода упреждения.
Погрешность, связанная со вторым и третьим источниками, может быть отражена в виде доверительного интервала прогноза при принятии некоторых допущений о свойстве ряда. С помощью такого интервала точечный прогноз преобразуется в интервальный.
Интуитивно понятно, что в основу расчета доверительного интервала прогноза должен быть положен измеритель колеблемости ряда наблюдаемых значений признака. Чем выше эта колеблемость, тем менее определенно положение тренда в пространстве “уровень — время” и тем шире должен быть интервал для вариантов прогноза при одной и той же степени доверия. Традиционно в качестве такого измерителя колеблемости используется среднее квадратическое (стандартное) отклонение (3.11).
Полученные в ходе статистического оценивания параметры не свободны от погрешности, связанной с тем, что объем информации, на основе которой производилось оценивание, ограничен, и в некотором смысле эту информацию можно рассматривать как выборку. Во всяком случае, смещение периода наблюдения только на один шаг или добавление, или устранение членов ряда в силу того, что каждый член ряда содержит случайную компоненту, приводит к изменению численных оценок параметров. Отсюда расчетные значения несут на себе груз неопределенности, связанной с ошибками в значении параметров.
В общем виде доверительный интервал для тренда определяется как:
, (4.1)
где – средняя квадратическая ошибка тренда; –расчетное значение уровня ряда; –значение t-статистики Стьюдента.
В STATISTICA при расчете доверительных интервалов прогноза величину среднего квадратического отклонения Sy можно определить, воспользовавшись таблицей дисперсионного анализа (см. рис. 3.17). Рассчитанное в ячейке Residual Mean Squares значение соответствует подкоренному выражению в формуле (3.11) для Sy, то есть остаточной дисперсии.Остается только извлечь из него квадратный корень ( тыс.чел.).
Значение коэффициента доверия t=2,306 нам известно при оценке статистической значимости параметров линейной модели тренда.
Таким образом, доверительный интервал прогноза на 2011 год определяется как:
.
На 2012 год:
.
Этот прогноз можно интерпретировать следующим образом: число выездов россиян за границу с целью туризма в 2011 году с вероятностью 95% будет составлять от 12137,31 тыс.чел. до 13289,88 тыс. чел.