Метод простой скользящей средней
Сглаживание временного ряда с помощью скользящей средней заключается в том, что вычисляется средний уровень из определённого числа первых по порядку уровней ряда, затем – средний уровень из такого же числа уровней, начиная со второго, далее – начиная с третьего и т.д. Таким образом, при расчётах среднего уровня как бы «скользят» по ряду от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя один следующий. Отсюда название – скользящая средняя. Каждое звено скользящей средней – это средний уровень за соответствующий период, который относится к середине выбранного периода.
Самым простым методом механического сглаживания является метод простой скользящей средней. Алгоритм расчёта по этому методу следующий.
1) Определяется интервал сглаживания, т.е. число m (m<n) входящих в него уровней. Если необходимо сгладить мелкие беспорядочные колебания, то интервал сглаживания берут по возможности большим; интервал сглаживания уменьшают, если нужно сохранить более мелкие колебания. При прочих равных условиях интервал сглаживания рекомендуется брать нечётным; обычно, 3, 5 или 7.
2) Вычисляется среднее значение уровней, образующих интервал сглаживания. Это будет сглаженное значение уровня ряда, находящегося в середине интервала сглаживания. При условии, что m нечётное число, применяется формула
, (9.16)
где .
Определение скользящей средней по чётному числу уровней временного ряда несколько сложнее, т.к. средняя может быть отнесена только к середине между двумя уровнями, находящимися в середине интервала сглаживания.
Если число членов скользящей средней обозначить через 2m, то серединным будет уровень, относящийся к m+½ члену ряда. Например, средняя, найденная для четырёх членов, относится к середине между вторым и третьим уровнями, следующая средняя – к середине между третьим и четвёртым, и т.д.
Чтобы ликвидировать такой сдвиг, применяют т.н. центрирование, которое заключается в нахождении средней из двух смежных скользящих средних для отнесения полученного уровня к определенному исходному уровню.
В результате процедуры сглаживания получают n–m+1 сглаженных уровней ряда. При этом первые p и последние p уровней теряются (не сглаживаются).
Простая скользящая средняя даёт представление об общей тенденции поведения временного ряда – основной тенденции (тренде) и циклической компоненте. Сделаем несколько замечаний о её свойствах.
1. При применении метода скользящей средней выбор величины интервала сглаживания должен делаться из содержательных соображений и привязываться к периоду сезонных колебаний. Если процедура скользящей средней используется для сглаживания несезонного ряда, то чаще всего величину интервала сглаживания выбирают нечётной.
2. Соседние уровни скользящих средних сильно коррелированны, т.к. в их формировании участвуют одни и те же уровни исходного рядя. Это может приводить к тому, что ряд скользящих средних может содержать периодические компоненты («псевдоколебания»), отсутствующие в исходном ряде. Это явление носит название эффекта Слуцкого-Юла.
3. Метод простой скользящей средней вполне приемлем, если тенденция временного ряда близка к прямой линии. В этом случае не искажается динамика исследуемого явления. Однако когда тенденция временного ряда носит явно нелинейный характер, использовать для сглаживания ряда метод простой скользящей средней нецелесообразно, т.к. простая скользящая средняя может привести к значительным искажениям исследуемого процесса. В этих случаях более надёжным является использование взвешенной скользящей средней.
4. Отметим, что вместо средней арифметической можно использовать медиану значений, попавших в интервал (окно) сглаживания. Такой метод называется медианным сглаживанием. Его преимущество состоит в том, что результаты сглаживания становятся более устойчивыми к выбросам (т.е. к резко выделяющимся данным). Однако при отсутствии резких выбросов при медианном сглаживании получаются более изогнутые кривые, что является основным недостатком данного метода.
Пример 9.4. Провести сглаживание по методу простой скользящей средней по данным временных рядов примеров 9.2 и 9.3.
Решение. Покажем расчёт 3-х, 5-ти и 4-х уровневых средних на данных примера 9.2.
Таблица 9.14
t | yt | Трехуровневые скользящие средние | Пятиуровневые скользящие средние | Четырехуровневые скользящие средние (нецентрированные) | Четырехуровневые скользящие средние (центрированные) |
6,0 | – | – | 6,10 6,40 6,50 6,75 7,00 7,20 7,40 7,50 7,75 8,00 8,25 8,40 8,35 | – | |
4,4 | 6,0 | – | – | ||
5,0 | 5,13 | 6,32 | 6,250 | ||
9,0 | 6,13 | 6,08 | 6,450 | ||
7,2 | 7,07 | 6,40 | 6,625 | ||
4,8 | 7,00 | 7,40 | 6,875 | ||
6,0 | 6,00 | 7,20 | 7,100 | ||
10,0 | 6,93 | 6,88 | 7,300 | ||
8,0 | 8,00 | 7,20 | 7,450 | ||
5,6 | 7,87 | 8,20 | 7,650 | ||
6,4 | 6,67 | 8,00 | 7,875 | ||
11,0 | 7,67 | 7,72 | 8,125 | ||
9,0 | 8,80 | 8,00 | 8,325 | ||
6,6 | 8,87 | 8,88 | 8,375 | ||
7,0 | 7,53 | – | – | ||
10,8 | – | – | – |
Как видим из рис. 9.6а-в четырехкратная скользящая средняя даёт плавное изменение уровней ряда. Это связано с тем, что период скольжения в данном случае совпадает с периодом сезонных колебаний.
Покажем расчёт 3-х, 5-ти и 4-х уровневых средних на данных примера 9.3.
Таблица 9.15
t | yt | Трехуровневые скользящие средние | Пятиуровневые скользящие средние | Четырехуровневые скользящие средние (нецентрированные) | Четырехуровневые скользящие средние (центрированные) |
57,8 | – | – | 97,85 100,4 106,325 102,2 101,875 101,5 101,05 100,6 106,425 117,2 136,075 164,825 | – | |
75,2 | 72,73 | – | – | ||
85,2 | 106,07 | 89,84 | 95,93 | ||
157,8 | 105,40 | 95,36 | 99,13 | ||
73,2 | 105,47 | 102,1 | 103,36 | ||
85,4 | 89,17 | 113,32 | 104,26 | ||
108,9 | 111,87 | 96,14 | 102,04 | ||
141,3 | 107,37 | 98,28 | 101,69 | ||
71,9 | 99,03 | 102,62 | 101,28 | ||
83,9 | 87,63 | 108,74 | 100,83 | ||
107,1 | 110,17 | 99,52 | 103,51 | ||
139,5 | 113,93 | 110,54 | 111,81 | ||
95,2 | 120,57 | 130,28 | 126,64 | ||
134,93 | 159,76 | 150,45 | |||
182,6 | 188,03 | – | – | ||
254,5 | – | – | – |
Как видим из рис. 9.7а-в четырехкратная скользящая средняя даёт более плавное изменение уровней ряда. Это также связано с тем, что период скольжения совпадает с периодом сезонных колебаний.
[1] Понятие об уравнении тенденции временного ряда было введено в статистику английским ученым Гукером в 1902 г. Он предложил называть такое уравнение трендом (the trend).