Методы выделения сезонной компоненты

При рассмотрении квартальных или месячных данных многих социально-экономических явлений часто обнаруживаются определенные, постоянно повторяющиеся колебания, которые существенно не изменяются за длительный период времени. Они являются результатом влияния природно-климатических условий, общих экономических факторов, а также ряда многочисленных разнообразных факторов, которые частично являются регулируемыми. В статистике периодические колебания, которые имеют определенный и постоянный период, равный годовому промежутку, носят название "сезонных колебаний" или "сезонных волн".

Если эти колебания повторяются в течение небольшого промежутка времени, то они называются сезонной вариацией. Колебания, повторяющиеся в течение более длительного промежутка времени, называются циклической вариацией. Этот фактор можно выделить только по данным за длительные промежутки времени порядка десятков лет, которые здесь не рассматриваются.

Сезонные колебания характеризуются специальным показателями, которые называются индексами сезонности ( IS ). Совокупность этих показателей отражает сезонную волну. Индексами сезонности являются процентные отношения фактических внутригодовых уровней к постоянной или переменной средней.

Для выявления сезонных колебаний обычно берут данные за несколько лет, распределенные по месяцам. Данные за несколько лет (обычно не менее трех) берутся для того, чтобы выявить устойчивую сезонную волну, на которой не отражались бы случайные условия одного года.

Если ряд динамики не содержит ярко выраженной тенденции в развитии, то индексы сезонности вычисляются непосредственно по эмпирическим данным без их предварительного выравнивания. Для каждого месяца рассчитывается средняя величина уровня, например, за три года Методы выделения сезонной компоненты - student2.ru , затем из них рассчитывается среднемесячный уровень для всего ряда Методы выделения сезонной компоненты - student2.ru и в заключение определяется процентное отношение средних для каждого месяца к общему среднемесячному уровню ряда, то есть:

IS = ( Методы выделения сезонной компоненты - student2.ru : Методы выделения сезонной компоненты - student2.ru )100% (18)

Если же ряд динамики содержит определенную тенденцию в развитии, то прежде чем вычислить сезонную волну, фактические данные должны быть обработаны так, чтобы была выявлена общая тенденция. Обычно для этого прибегают к аналитическому выравниванию ряда динамики.

При использовании способа аналитического выравнивания ход вычислений индексов сезонности следующий:

- по соответствующей функции времени вычисляются для каждого месяца (квартала) выровненные уровни Методы выделения сезонной компоненты - student2.ru ;

- вычисляются отношения фактических месячных ( квартальных ) данных Yi к соответствующим выровненным данным Методы выделения сезонной компоненты - student2.ru в процентах

I = (Yi: Методы выделения сезонной компоненты - student2.ru ) 100;

- находятся средние арифметические из процентных соотношений, рассчитанных по одноименным периодам в процентах

Ii = ( I1 +I2 +I3 +...+In)/n,

где n - число одноименных периодов.

В общем виде формулу расчета индекса сезонности данным способом можно записать так:

IS = Методы выделения сезонной компоненты - student2.ru . (2.19)

Расчет заканчивается проверкой правильности вычислений индексов, так как средний индекс сезонности для всех месяцев (кварталов) должен быть 100 процентов, то сумма полученных индексов по месячным данным равна 1200, а сумма по четырем кварталам - 400.

Пример. Представленные ниже данные - это количество продукции, проданной магазином в течение последних 13 кварталов. Необходимо проанализировать указанное множество данных и установить, можно ли обнаружить тенденцию. Если устойчивая тенденция действительно существует, данная модель будет использоваться нами для прогнозирования количества проданной продукции в следующие кварталы.

Решение. На рисунке нанесены соответствующие значения. При построении диаграммы временного ряда полезно последовательно соединить точки отрезками, чтобы более четко увидеть любую тенденцию.

Таблица 7

Количество продукции, проданной в течение последних 13 кварталов

Дата Количество проданной продукции,
  тыс. шт.
Январь-март 1996
Апрель-июнь
Июль-сентябрь
Октябрь-декабрь
Январь-март 1997
Апрель-июнь
Июль-сентябрь
Октябрь-декабрь
Январь-март 1998
Апрель-июнь
Июль-сентябрь
Октябрь-декабрь
Январь-март 1999

Как следует из диаграммы, возможен возрастающий тренд, содержащий сезонные колебания. Объемы продаж в зимний период (1 и 4) значительно выше, чем в летний (2 и 3). Сезонная компонента практически не изменится в течение трех лет. Тренд показывает, что а целом объем продаж возрос примерно с 230 тыс. шт. в 1996 г. до 390 тыс. шт. в 1998 г., однако увеличения сезонных колебаний не произошло. Этот факт свидетельствует в пользу модели с аддитивной компонентой.

Анализ модели с аддитивной компонентой: Y=Т+S+Е

Моделью с аддитивной компонентой называется такая модель, в которой вариация значений переменной во времени наилучшим образом описывается через сложение отдельных компонент. Предположив, что циклическая вариация не учитывается, модель фактических значений переменной Y можно представить следующим образом:

Y = T + S + E, (20)

где T - трендовые значения, S - сезонная вариация, E - ошибка модели.

Моделью с мультипликативной компонентой имеет следующий вид:

Y = T ´ S ´ E, (21)

В моделях как с аддитивной, так и с мультипликативной компонентой общая процедура анализа примерно одинакова:

Шаг 1. Расчет значений сезонной компоненты.

Шаг 2. Вычитание сезонной компоненты из фактических значений. Этот процесс называется десезонализацией данных. Расчет тренда на основе полученных десезонализированных данных.

Шаг 3. Расчет ошибок как разности между фактическими и трендовыми значениями.

Шаг 4. Расчет среднего линейного отклонения dt или среднеквадратической ошибки Методы выделения сезонной компоненты - student2.ru для обоснования соответствия модели исходным данным или для выбора из множества моделей наилучшей.

Для того чтобы исключить (элиминировать) влияние сезонной компоненты, воспользуемся методом скользящей средней. Просуммировав первые четыре значения, получим общий объем продаж в 1996 г. Если поделить эту сумму на четыре, можно найти средний объем продаж в каждом квартале 1996 года, т. е.

(239 +201+182+ 297)/4 = 229,75.

Полученное значение уже не содержит сезонной компоненты, поскольку представляет собой среднюю величину за год. У нас появилась оценка значения тренда для середины года, т.е. для точки, лежащей в середине между кварталами II и III. Если последовательно передвигаться вперед с интервалом в три месяца, можно рассчитать средние квартальные значения на промежутке: апрель 1996 - март 1997 (251), июль 1996 - июнь 1997 (270,25) и т.д. Данная процедура позволяет генерировать скользящие средние по четырем точкам для исходного множества данных. Получаемое таким образом множество скользящих средних представляет наилучшую оценку искомого тренда.

Теперь полученные значения тренда можно использовать для нахождения оценок сезонной компоненты. Мы рассчитываем:

Y - T = S + E.

К сожалению, оценки значений тренда, полученные в результате расчета скользящих средних по четырем точкам, относятся к несколько иным моментам времени, чем фактические данные. Первая оценка, равная 229,75, представляет собой точку, совпадающую с серединой 1996 г., т.е. лежит в центре промежутка фактических значений объемов продаж во II и III кварталах. Вторая оценка, равная 251, лежит между фактическими значениями в III и IV кварталах. Нам же требуются десезонализированные средние значения, соответствующие тем же интервалам времени, что и фактические значения за квартал. Положение десезонализированных средних во времени сдвигается путем дальнейшего расчета средних для каждой пары значений. Найдем среднюю из первой и второй оценок, центрируя их на июль-сентябрь 1996 г., т. е. (229,75 + 251)/2 = 240,4.

Это и есть десезонализированная средняя за июль-сентябрь 1996 г. Эту десезонализированную величину, которая называется центрированной скользящей средней, можно непосредственно сравнивать с фактическим значением за июль-сентябрь 1996 г., равным 182. Отметим, что это означает отсутствие оценок тренда за первые два или последние два квартала временного ряда. Результаты этих расчетов приведены в табл.8.

Для каждого квартала мы имеем оценки сезонной компоненты, которые включают в себя ошибку или остаток. Прежде чем мы сможем использовать сезонную компоненту, нужно пройти два следующих этапа. Найдем средние значения сезонных оценок для каждого сезона года. Эта процедура позволит уменьшить некоторые значения ошибок. Наконец, скорректируем средние значения, увеличивая или уменьшая их на одно и то же число таким образом, чтобы общая их сумма была равна нулю.

Таблица 8

Расчет по 4 точкам центрированных скользящих средних значений тренда для модели А - Т =• S + Е

Дата Объем продаж, Итого за четыре Скользящая средняя Центрированная Оценка сезонной
  тыс. шт., Y квартала за четыре квартала скользящая средняя компоненты Y-T=S+E
Янв.-март 1996   -    
Апр.-июнь   -    
    229,75    
Июль-сент.     240,4 -58,4
       
Окт.-дек.     260,6 +36,4
    270,25    
Янв.-март 1997     279,6 +44,4
       
Апр.-июнь     299,9 -21,9
    310,75    
Июль-сент.     320,4 -63,4
       
Окт.-дек.     340,3 +43,8
    350,5    
Январь-март 1998     360,2 +40,8
       
Апр.-июнь     379,8 -19,8
    389,5    
Июль-сент.     399,5 -64,5
    409,5    
Окт.-дек.   -    
Январь-март 1999   -    

Это необходимо, чтобы усреднить значения сезонной компоненты в целом за год. Корректирующий фактор рассчитывается следующим образом: сумма оценок сезонных компонент делится на 4. В последнем столбце табл.8 эти оценки записаны под соответствующими квартальными значениями. Сама процедура приведена в табл.9.

В данном случае производилось округление двух значений сезонной компоненты до ближайшего большего числа, а двух значений - до ближайшего меньшего числа таким образом, чтобы общая сумма была равна нулю. Значения сезонной компоненты подтверждают тенденцию в изменении исходных уровней ряда, представленных в табл. 7. Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс. шт. соответственно.

Таблица 9

Расчет средних значений сезонной компоненты

  Год Номер квартала
   
  - - -58,4 +36,4
  +44,4 -21,9 -63,4 +43,8
  +40,8 -19,8 -64,5 -
Итого   +85,2 -41,7 -186,3 +80,2
Среднее значение   85,2-2 -41,7-2 -186,3-2 80,2-3  
Оценка сезонной компоненты   +42,6 -20,8 -62,1 +40,1 Сумма =-0,2
Скорректированная сезонная компонента   +42,6 -20,7 -62,0 +40,1 Сумма = 0

Объемы продаж за два зимних квартала превышают среднее трендовое значение приблизительно на 40 тыс. шт., а объемы продаж за два летних периода ниже средних на 21 и 62 тыс. шт. соответственно.

Аналогичная процедура применима при определении сезонной вариации за любой промежуток времени. Если, например, в качестве сезонов выступают дни недели, для элиминирования влияния ежедневной "сезонной компоненты" также рассчитывают скользящую среднюю, но уже не по четырем, а по семи точкам. Эта скользящая средняя представляет собой значение тренда в середине недели, т.е. в четверг; таким образом, необходимость в процедуре центрирования отпадает.

Десезонализация данных при расчете тренда

Шаг 2 состоит в исключении сезонной компоненты из исходных данных за каждый квартал, т.е. Y - S = Т+ Е, что показано ниже.

Таблица 10

Расчет десезонализированных данных

  Дата Номер квар- тала, t Объем тыс. шт. Y Сезонная компо-нента S Десезонализирован-ный объем продаж, тыс. шт. Y -S= T +E
Янв.-март 1996 (+42,6) 196,4
Апрель-июнь (-20,7) 221,7
Июль-сентябрь (-62,0) 244,0
Окт.-декабрь (+40,1) 256,9
Янв.-март 1997 (+42,6) 281,4
Апрель-июнь (-20,7) 298,7
Июль-сентябрь (-62,0) 319,0
Окт.-декабрь (+40,1) 343,9
Янв.-март 1998 (+42,6) 358,6
Апрель-июнь (-20,7) 380,7
Июль-сентябрь (-62,0) 397,1
Окт.-декабрь (+40,1) 421,9
Янв.-март 1999 (+42,6) 438,4

Новые оценки значений тренда, которые еще содержат ошибку, можно использовать для построения модели основного тренда. Если нанести эти значения на исходную диаграмму, можно сделать вывод о существовании явного линейного тренда.

Уравнение линии тренда имеет вид: Методы выделения сезонной компоненты - student2.ru = а + b×t - номер квартала, где а и b характеризуют точку пересечения с осью ординат и наклон линии тренда. Для определения параметров прямой, наилучшим образом аппроксимирующей тренд, можно использовать метод наименьших квадратов. Уравнения для расчета параметров линии тренда а и b будут иметь вид:

Методы выделения сезонной компоненты - student2.ru ,

Методы выделения сезонной компоненты - student2.ru (22)

где t - порядковый номер квартала, а значение (Т+Е) - из предыдущей таблицы. С помощью калькулятора подсчитаем:

St = 91, St2 = 819, S(T+E) = 4158,7; S(T+E)t = 32747,1; n = 13.

Подставив найденные значения в соответствующие формулы, получим: b = 19,978, а = 180,046.

Следовательно, уравнение модели тренда имеет следующий вид:

Методы выделения сезонной компоненты - student2.ru = 180,0 + 20,0 ´ t,

где Методы выделения сезонной компоненты - student2.ru - трендовое значение объема продаж, тыс. шт.

Расчет ошибок

Шаг 3 алгоритма, предшествующий составлению прогнозов, состоит в расчете ошибок или остатка. Наша модель имеет следующий вид: Y = Т+S+ Е. Вычитая из фактических объемов продаж каждое из значений S и Т, получим значения ошибок. Последний столбец этой таблицы можно использовать в шаге 4 при расчете среднего абсолютного отклонения dt или средней квадратической ошибки Методы выделения сезонной компоненты - student2.ru :

dt = Методы выделения сезонной компоненты - student2.ru , (2.23)

Методы выделения сезонной компоненты - student2.ru = Методы выделения сезонной компоненты - student2.ru . (2.24)

Таблица 11

Расчет ошибок для модели с аддитивной компонентой

Дата Номер Объем Сезонная Трендовое Ошибка,
  квартала, t продаж, тыс.шт,Y компо-нента, S значение, тыс. шт, Т тыс. шт. Y-S-T = E
Янв.-март 1996 (+42,6) -3,6
Апрель-июнь (-20,7) +1,7
Июль-сентябрь (-62,0) +4,0
Окт.-декабрь (+40,1) -3,1
Янв.-март 1997 (+42,6) +1,4
Апрель-июнь (-20,7) -1,3
Июль-сентябрь (-62,0) -1,0
Окт.-декабрь (+40,1) +3,9
Янв.-март 1998 (+42,6) -1,6
Апрель-июнь (-20,7) +0,7
Июль-сентябрь (-62,0) -3,0
Окт.-декабрь (+40,1) +1,9
Янв.-март 1999 (+42,0) -1,6

В нашем случае ошибки достаточно малы и составляют от 1 до 2%. Тенденция, выявленная по фактическим данным, достаточно устойчива и позволяет получить хорошие краткосрочные прогнозы.

Прогнозирование по аддитивной модели

Прогнозные значения по модели с аддитивной компонентой рассчитываются как

Методы выделения сезонной компоненты - student2.ru = Т+S (тыс. шт. за квартал), (25)

где трендовое значение Т = 180+20×t( номер квартала), а сезонная компонента S составляет +42,6 в январе-марте, - 20,7 в апреле-июне, 62,0 в июле-сентябре и +40,1 в октябре-декабре.

Порядковый номер квартала, охватывающего ближайшие три месяца с апреля по июль 1999 г., равен 14, таким образом прогнозное трендовое значение составит:

Т14 = 180 + 20 ´ 14 = 460 (тыс. шт. за квартал) .

Соответствующая сезонная компонента равна - 20,7 тыс. шт. Следовательно, прогноз на этот квартал определяется как:

Методы выделения сезонной компоненты - student2.ru (апрель-июнь 1999 г.) = 460- 20,7 = 439,3 тыс. шт.

Не следует забывать: чем более отдаленным является период упреждения, тем меньшей оказывается обоснованность прогноза. В данном случае мы предполагаем, что тенденция, обнаруженная по ретроспективным данным, распространяется и на будущий период. Для сравнительно небольших периодов упреждения такая предпосылка может действительно иметь место, однако ее выполнение становится менее вероятным по мере составления прогнозов на более отдаленную перспективу.

Наши рекомендации