Основные теоретические сведения. 5.1.1. Основные понятия и определения
5.1.1. Основные понятия и определения
Информационной базой для анализа экономических процессов, во многих случаях, являются динамические ряды и временные ряды.
Динамический ряд – это совокупность наблюдений некоторого явления, упорядоченная в зависимости от последовательности значений другого явления. Здесь под последовательностью понимаются значения, ранжированные по времени их происхождения: y(t) = f(x(t)).
Временной ряд – это динамический ряд, у которого в качестве признака упорядочения используется время: y(t) = f(t).
Модели, полученные по временным рядам, называются моделями временного ряда.
Числа, составляющие временной ряд и полученные в результате наблюдения за ходом некоторого процесса, называются уровнями временного ряда.
Длина временного ряда определяется количеством уровней (n), входящих в него. Обозначается временной ряд Y(t) или yt , t = 1, 2, …n.
В общем случае каждый уровень временного ряда можно представить в виде функции четырех компонент: f(t), S(t), U(t), ,
где f(t) – тренд (долговременная тенденция) развития; S(t) – сезонная компонента; S(t) – циклическая компонента; - остаточная компонента (ошибка).
Тренд – устойчивая закономерность, наблюдаемая в течение длительного времени, описывается с помощью неслучайной функции f(t), аргументом которой является время.
Сезонная компонента S(t) – отражает повторяемость экономических процессов с заранее известной периодичностью. Это регулярные колебания, которые носят периодический характер и заканчиваются в течение года.
Циклическая компонента U(t) – описывает длительные периоды (более одного года) относительного подъема и спада и состоящая из циклов переменной длительности и амплитуды. Циклическую компоненту крайне трудно идентифицировать, поэтому здесь она рассматриваться не будет.
Случайная компонента - отражает влияние не поддающихся учету и регистрации случайных факторов.
В зависимости от вида связи между перечисленными компонентами может быть построена либо аддитивная модель временного ряда:
y(t) = f(t) + S(t) + , (5.1)
либо мультипликативную модель:
y(t) = f(t) S(t) . (5.2)
Выбор модели осуществляется на основе анализа структуры сезонных колебаний. Если амплитуда колебаний приблизительно постоянна, то выбирают аддитивную модель (5.1). Если амплитуда сезонных колебаний возрастает или уменьшается, строят мультипликативную модель временного ряда (5.2).
Обычно временные ряды используются для вычисления значения переменной y(t) на некоторый интервал .
5.1.2. Этапы построения прогноза по временным рядам
Основные этапы:
- предварительный анализ данных;
- построение моделей временных рядов;
- оценка качества моделей;
- построение точечного и интервального прогнозов.
Кратко рассмотрим основные особенности выполнения этих этапов.
Предварительный анализ данных.
К процедурам предварительного анализа данных относятся:
- выявление аномальных наблюдений;
- проверка наличия тренда;
- сглаживание временных рядов;
- расчет показателей динамики экономических процессов.
1. Выявление аномальных наблюдений.
Так как наличие аномальных наблюдений приводит к искажению результатов моделирования, то необходимо убедиться в отсутствии аномальных данных. Для выявления аномальных уровней можно использовать метод Ирвина.
Для всех или только для подозреваемых в аномальности наблюдений вычисляется величина :
, (5.3)
где .
Если расчетная величина превышает табличное значение (см. Приложение 3), то уровень yt считается аномальным. После выявления аномальных уровней необходимо определить причины их возникновения. Если они вызваны ошибками технического порядка, то они заменяются расчетными значениями (самый простой способ: среднее значение двух соседних уровней).
Ошибки, возникающие из-за воздействия факторов, имеющих объективный характер, например скачек курса доллара, падение курса ценных бумаг на фондовом рынке или значительные изменения сезонной составляющей и др., устранению не подлежат.
2. Проверка наличия тренда.
Тенденцию среднего визуально можно определить из графика исходных данных. Но это не всегда очевидно.
Для выявления наличия тенденции разработано множество достаточно простых критериев, основанных на корреляции рангов, поворотных точках и т.д., однако наиболее надежные результаты получаются в результате проверки разности средних уровней ряда.
Сравнение средних уровней ряда.
Алгоритм метода разности средних уровней имеет следующую последовательность:
1) Временной ряд разбивается на две примерно равные по числу уровней части n1 и n2 , каждая из которых рассматривается как самостоятельная выборка: , , где n = n1 + n2 .
2) По каждой из частных выборок выполняется оценка средних:
, . (5.4)
3) Проверяется гипотеза о равенстве средних:
Н0 : = ,
Н1 : .
В рамках гипотезы нормального распределения разности - проверка ее статистической значимости для малого объема выборки выполняется при помощи t-статистики Стьюдента:
(5.5)
где , (5.6)
. (5.7)
Если , то нулевая гипотеза отвергается в пользу альтернативной гипотезы, т.е. тренд присутствует. Здесь tкр– критическое значение, полученное по распределению Стьюдента при количестве степеней свободы = n – 2 и заданной вероятности /2.
Следует заметить, что соотношение (5.5) справедливо, если выполняется предположение о несущественном различии дисперсий частных выборок, т.е. . Поэтому предварительно необходимо проверить это предположение с помощью F-критерия Фишера. Для вычисления F-критерия большую дисперсию делим на меньшую (пусть, например, ):
, (5.8)
и сравниваем с Fкр( . Если Fнабл > Fкр, то гипотеза о несущественном различии значений дисперсий уровней ряда в частных выборках отвергается, и метод разности средних уровней не может быть применен. В этом случае можно воспользоваться автокорреляционной функцией, которая будет описана ниже.
3. Сглаживание временных рядов.
Сглаживание – замена фактических уровней расчетными значениями, что способствует более четкому проявлению тенденции ряда. Методы сглаживания позволяют устранить аномальные явления и выявить тенденцию развития (тренд).
Методы сглаживания (фильтрации) делятся на две группы:
- аналитические методы;
- методы механического сглаживания.
Аналитические методы.
Сглаживание (выравнивание) уровней временного ряда выполняется при помощи специально подобранных функций (тренда), описывающих закономерности развития во времени исследуемых экономических явлений. Выбор той или иной функции в качестве тренда является наиболее важным этапом анализа временного ряда, так как ошибка на данном этапе приводит к очень серьезным последствиям, особенно при прогнозировании уровней ряда.
Для построения трендов чаще всего применяются следующие функции:
- линейный тренд ;
- гипербола ;
- экспоненциальный тренд ;
- тренд в форме степенной функции ;
- парабола второго и более высоких порядков .
Параметры каждого тренда определяются с помощью обычного МНК. Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.
Выбор наилучшего уравнения тренда можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и отбора уравнения с его максимальным значением.
Методы механического сглаживания.
Сглаживается каждый отдельный уровень ряда с использованием фактических значений соседних с ним уровней. Для сглаживания часто используют методы простой и взвешенной скользящей средней.
Метод простой скользящей средней. Для каждого текущего значения yt можно рассчитать среднее значение по некоторому интервалу (интервал сглаживания), включающему m < n последовательных членов ряда:
, (5.9)
где m – количество наблюдений, входящих в интервал сглаживания; р - количество наблюдений, стоящих по разные стороны от сглаживаемого.
При нечетном m значение параметра р вычисляется следующим образом:
.
Первым сглаженным будет наблюдение t , где t = p+1.
Интервал сглаживания сдвигается на один член вправо, и по формуле (5.9) находится сглаженное значение для (t + 1)-го наблюдения. Затем снова производится сдвиг и т.д.
Обычно при практических расчетах длина интервала сглаживания принимается равной 3, 5, 7. При наличии сезонной компоненты во временном ряду длина интервала должна быть согласована с периодом колебаний, который, как правило, является четным (4, 12). В этом случае добавляется один ряд, но крайние уровни используются с коэффициентами 1/2, т.е. весовые коэффициенты при этом будут:
· (1/2, 1, 1, 1, 1/2) для квартальных данных;
· (1/2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1/2) для месячных данных.
Метод взвешенной скользящей средней. Метод простой скользящей средней можно использовать, если тенденция напоминает прямую линию. Однако когда тренд выравниваемого ряда имеет изгибы и к тому же желательно сохранить мелкие волны предпочтительнее использовать метод взвешенной скользящей средней. В этом методе каждому уровню ряда в пределах интервала сглаживания приписывается вес, зависящий от расстояний от члена ряда до середины интервала сглаживания.
Если сглаживания осуществляется полиномами второго или третьего порядка, то их весовые коэффициенты будут следующими:
Таблица 5.1
Длина интервала сглаживания (m) | Весовые коэффициенты |
m=5 | 1/35(-3, 12, 17, 12, -3) |
m=7 | 1/21(-2, 3, 6, 7, 6, 3, -2) |
m=9 | 1/231(-21, 14, 39, 54, 59, 54, 39, 14, -21) |
4. Расчет показателей динамики экономических процессов.
Для характеристики динамики изменения экономических показателей используется автокорреляционная функция.
Степень тесноты статистической связи между уровнями временного ряда, сдвинутыми на единиц времени, определяется величиной коэффициента автокорреляции . При этом - длину временного смещения называют обычно лагом. Коэффициент автокорреляции вычисляется по формуле:
, (5.10)
где yt – исходный временной ряд; - исходный ряд, сдвинутый на шагов по времени; - стандартные ошибки этих рядов.
Пример. Имеются условные данные о средних расходах на конечное потребление yt (д.е.) за 8 лет. Необходимо определить коэффициент автокорреляции . Исходный и сдвинутый на 2 лага ряды представлены в таблице 5.2.
Таблица 5.2
t | ||||||||
yt | ||||||||
yt-2 | - | - |
Коэффициент вычисляется по формуле (5.10) для рядов, выделенных в таблице: = 0,973.
Следует заметить, что с увеличением лага число пар уровней уменьшается. Для обеспечения статистической достоверности коэффициентов автокорреляции рекомендуется максимальный лаг не больше n/4.
Последовательность коэффициентов автокорреляции уровней первого, второго и т.д. порядков называется автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага, называется коррелограммой.
Если наиболее высоким оказался коэффициент первого порядка, то исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов не является значимым, то можно сделать предположение относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой необходимо провести дополнительный анализ.
Построение моделей временных рядов.
Если временной ряд не содержит сезонной компоненты, то модель тренда практически уже сформирована на предварительном этапе анализа исходной информации. Аналитическая модель процесса выбирается путем выбора наилучшей формы тренда, в смысле ее статистических характеристик. Параметры модели определяются с помощью МНК.
Здесь рассмотрим моделирование экономических процессов, подверженных сезонным колебаниям.
1 Подход. Расчет значений сезонной компоненты методом скользящей средней.
Как было отмечено ранее, эти модели могут быть представлены в аддитивной форме:
Y = F + S + E (5.11)
и мультипликативной форме:
(5.12)
Процесс построения модели включает следующие шаги:
Шаг 1. Выравнивание исходного ряда методом скользящей средней.
Шаг 2. Расчет значений сезонной компоненты S.
Шаг 3. Устранение сезонной компоненты из исходных уровней ряда и получение выровненных значений (F + E) – в аддитивной модели, или ( ) - в мультипликативной модели.
Шаг 4. Аналитическое выравнивание уровней (F + E) или ( ) и расчет значений F с использованием полученного уравнения тренда.
Шаг 5. Расчет полученных по модели значений (F + S) или ( ).
Шаг 6. Расчет ошибок.
2 Подход. Применение фиктивных переменных для моделирования сезонных колебаний.
Для моделирования сезонных колебаний могут быть использованы фиктивные переменные. Количество фиктивных переменных должно быть на единицу меньше, чем число моментов времени внутри одного цикла колебаний. Например число кварталов внутри одного года k = 4, значит фиктивных переменных должно быть три: х1, х2, х3, и модель будет:
, (5.13)
где тренд – линейный: .
Если тренд нелинейный, например парабола, то уравнение модели будет следующим:
(5.14)
Следует напомнить, что фиктивные переменные могут принимать значения 0 или 1.
Оценка качества моделей.
Основным критерием, характеризующим адекватность модели, является коэффициент детерминации R2. Кроме того, в статистическом анализе известно большое число характеристик точности. Наиболее часто, кроме среднеквадратического отклонения, используются:
· максимальная по абсолютной величине ошибка
;
· относительная максимальная ошибка
;
· средняя по модулю ошибка
;
· средняя по модулю относительная ошибка
.
Эти показатели дают представление об абсолютной величине ошибки модели и о доле ошибки в процентном отношении к среднему значению результативного признака. Лучшей по точности считается та модель, у которой все перечисленные характеристики имеют меньшую величину.