Выявление аномальных наблюдений
Сопоставимость уровней ряда – одно из главных требований, предъявляемых к рядам динамики. Для проверки однородности данных и выявления аномальных значений уровней ряда используется метод Ирвина. Для всех или только для подозреваемых уровней вычисляется величина
Расчетные значения сравниваются с табличным значением и, если расчетные значения оказываются больше табличных, то соответствующие значения признаются аномальными и их следует заменить, например, на среднее арифметическое двух соседних. Пример таблицы для уровня значимости имеет вид
n | ||||
2,8 | 2,3 | 1,5 | 1,3 |
Сглаживание временного ряда
Выявление детерминированной, постоянно действующей составляющей временного ряда проводится: 1) либо подбором аналитической функции с использованием МНК, 2) либо механическим выравниванием уровней ряда с использованием значений соседних уровней.
Остановимся на методах механического сглаживания. Часто используют метод простой скользящей средней и взвешенной скользящей средней.
При выборе количества точек, по которым проводится усреднение, имеет значение наличие или отсутствие периодической составляющей динамического ряда.
Если периодическая составляющая отсутствует, т.е. ряд динамики содержит только тренд и случайную компоненту, то выбор точек для сглаживания относительно произволен. В этом случае есть только одна рекомендация: для сглаживания брать нечетное число членов ряда. Сглаживание есть фильтрация динамического ряда, способ локального усреднения данных, при котором случайные составляющие частично взаимно погашают друг друга.
Рассмотрим метод простой скользящей средней. Он заключается в вычислении новых уровней ряда по формуле:
В результате процедуры получаем сглаженных уровней. При этом первые p и последние p уровней ряда не сглаживаются (это можно сделать “вручную”). Например, сглаживание методом трехчленной скользящей средней имеет вид:
Первый и последний уровни вычисляются отдельно. Так обеспечивается хорошее согласование всех уровней динамического ряда.
Опишем суть метода взвешенной скользящей средней. Этот метод отличается от предыдущего метода сглаживания тем, что уровни, входящие в интервал сглаживания, суммируются с разными весами. Это связано с аппроксимацией ряда в пределах интервала сглаживания полиномом не первой степени, как в предыдущем случае, а степени, начиная со второй. Используется формула средней арифметической взвешенной
Веса pt определяются с помощью метода наименьших квадратов. Эти веса рассчитываются для различных степеней аппроксимирующего полинома и различных интервалов сглаживания.
Уровню рядаyt присваивается определенный вес, таким образом, что ближние к рассматриваемому моменту времени значения ytимеют больший удельный вес, нежели более отдаленные значения yt.
Приведем примерывзвешенной средней для интервалов с m=5;7, т.е. усредняем по пяти и семи уровням ряда.Тогда линейно-взвешеннаяскользящая средняя с периодом 5 может иметь вид
а линейно-взвешеннаяскользящая средняя с периодом 7 может иметь вид
Сглаживание по периоду, включающему 8 точек.
При наличии периода для сглаживания следует брать количество точек фиксирующее период в общей динамике, см. рис. На рисунке динамический ряд предположительно содержит нисходящий тренд и периодическую составляющую.
В этом случае для актуализации тренда сглаживание следует проводить по четырем уровням, которые задают период ряда. Такое сглаживание устраняет сезонную компоненту. Так, для аддитивной модели ряда сумма скорректированных сезонных компонент равна . В частности, если известны значения трех скорректированных компонент , то .
Часто используется метод экспоненциального сглаживания, суть которого заключается в получении сглаженного уровня с использованием только предшествующих уровней исходного ряда, взятых с весами. При этом вес учитываемого уровня, уменьшается с удалением от текущего момента в историю процесса. Пусть – исходный ряд. Обозначим сглаженные уровни через , тогда экспоненциально сглаженные уровни вычисляются по формуле – параметр сглаживания. Близкое к 1 значение α придает больший вес последним наблюдениям, а близкое к 0 – более отдаленным. Первый случай соответствует быстроменяющимся процессам, а второй – медленно меняющимся, т.е. более стабильным.
Можно показать, что экспоненциальная средняя имеет то же математическое ожидание, что и исходный ряд, но меньшую дисперсию.Использование экспоненциальной средней целесообразно для рядов со слабой динамикой и незначительной сезонной составляющей.