Сглаживание временного ряда и прогнозирование

Одна из важнейших задач исследования временного ряда - выявление в нем основной тенденции, которая выражается неслучайной составляющей f(t). Последняя может быть трендом, либо трендом с циклической составляющей, либо трендом с циклической и сезонной составляющими - это зависит от цели исследования.

Выбор конкретной сглаживающей функции f(t) - сложная неформальная процедура. Для выбора используются по меньшей мере три типа информации.

Использование содержательной информации – семантический подход. Здесь строится качественная теория изучаемого процесса. Выдвигается гипотеза о причинах именно такого поведения процесса в прошлом и настоящем и о поведении в будущем. Например, при прогнозировании численности населения Калининградской области на период до 2020 г. мы имеем: устойчивый рост примерно до 1990 г., резкое сокращение примерно до 1998 г., постепенное уменьшение скорости сокращения до настоящего времени. Гипотеза: начавшийся подъем экономики, политическая стабилизация в течение нескольких лет остановят падение и начнется рост населения с постепенной стабилизацией на определенном уровне (по образцу западных стран).

Использование графической информации. Здесь временной ряд представляется в виде графика. Результаты наблюдения и содержательной теории о прошлом, настоящем и будущем процесса наносятся на этот график. Соответственно ему подбирается функция f(t) – линейная, или квадратичная, или степенная и т.п.

Использование аналитической информации. На основе содержательной и графической информации выбираются несколько функций, для каждой из которых строится регрессионное уравнение и рассчитываются показатели качества сглаживания (обычно с использованием компьютера), например, остаточная дисперсия, коэффициент детерминации, скорректированный коэффициент детерминации и др. На основе такой аналитической информации решается - обычно экспертным путем - задача многокритериального выбора наилучшей сглаживающей функции f(t).

При прочих равных условиях рекомендуется отдавать предпочтение более простым функциям, например, линейным. Заметим также, что задача сглаживания часто решается в комплексе с задачей прогнозирования.

Наиболее часто используются такие функции:

- линейная f(t)=bo+b1t
- полиномиальная n-го порядка f(t)=bo+b1t+ ... + bntn
- логиcтическая f(t)= a / (1+be-ct)
- Гомперца logcf(t)=a-brt, где 0<r<1

Для сглаживания и прогнозирования чаще всего используется метод наименьших квадратов. Значения временного ряда yt рассматриваются как зависимая переменная, а время t - как объясняющая:

yt=F(t) + et, (5.7)

где - et - возмущения, удовлетворяющие основным предпосылкам регрессионного анализа: независимые и одинаково распределенные случайные величины с нормальным законом распределения.

Другим методом сглаживания временного ряда (и в некоторой степени - прогнозирования) является метод скользящих средних.

Пример: дан временной ряд 5, 7, 11, 12, 13, 16. Выполнить сглаживание методом скользящих средних, используя среднюю арифметическую с интервалом сглаживания m=3.

Решение.

Вычисляем значения сглаженного ряда: z2=(5+7+11)/3=7,7; z3=(7+11+12)/3=10,0; z4=(11+12+13)/3=12,0; z5=(12+13+16)/3=13,7. Рекомендуем самим построить графики исходного и сглаженного временных рядов.

Для сглаживания методом скользящих средних помимо простой среднеарифметической используется также средневзвешенная арифметическая, например: z2 = (0,25×5+ 0,50×7 + + 0,25×11) = 7,5 и т.д.

Прогнозирование на основе временных рядов обычно основано на принципе экстраполяции: тенденцию развития, установленную на основании прошлого, можно без большой погрешности распространить и на будущее - эволюционное развитие процесса. Такой прогноз эффективен на краткосрочную и - реже - среднесрочную перспективу.

Прогноз может быть точечным и интервальным. Величина интервала прогноза для t=tn+k может быть задана, тогда исчисляется вероятность попадания истинного значения уt в этот интервал. Чаще поступают наоборот: задаются доверительной вероятностью попадания в интервал, а затем исчисляют величину интервала. Ясно, что величина интервала тем больше, чем больше задана вероятность попадания и чем больше период экстраполяции (значение k) - прогностический конус.

Для прогнозирования на основе некоторых временных рядов естественно в качестве объясняющих переменных вводить лаговые переменные (от слова лаг - временной сдвиг): yt-1, yt-2, ..., yt-р. Например, если вы, как финансовый менеджер предприятия, хотите прогнозировать курс валюты, то самое эффективное - использовать лаговые переменные, поскольку вам практически недоступны текущие значения макроэкономических показателей ведущих валютных площадок мира. Авторегрессионная модель р-го порядка имеет вид:

yt=bо+ b1 yt-1+ b2 yt-2 +...+ bр yt-р + et ; (t=1, 2, ... , n). (5.8)

Вопросы для самоконтроля

1. В чем отличие временного ряда от пространственной выборки?

2. Назовите и охарактеризуйте компоненты временного ряда.

3. Назовите типы задач анализа временного ряда.

4. В чем отличие и сходство стационарных рядов в узком и широком смысле?

5. Охарактеризуйте как можно полнее временной ряд типа белого шума, каким образом он присутствует в теории регрессионного анализа, почему он так называется, как он может быть изображен графически.

6. Почему çr(t)ç убывает при увеличении t?

7. Какой вид должна иметь коррелограмма случайного процесса типа "белый шум"?

8. В чем суть содержательного подхода к выбору сглаживающей функции f(t)?

9. В чем суть графического подхода к выбору сглаживающей функции f(t)?

10. Может ли метод скользящих средних конкурировать с МНК?

11. В каких случаях эффективно применение авторегрессионных моделей?

Наши рекомендации