Обзор условий, методов, логики и последовательности анализа
Корректность методов анализа случайных процессов, последовательные этапы анализа временных рядов, а также интерпретации результатов анализа могут существенно различаться в зависимости от цели конкретного анализа и от некоторых основных свойств анализируемого процесса. К их числу относятся:
1. стационарность,
2. нормальность распределения случайной составляющей процесса,
3. присутствие периодических составляющих.
Стационарность процесса играет важную роль потому, что методы анализа нестационарных процессов существенно более громоздки, чем для стационарных. Для стационарного случайного процесса определять вероятностные характеристики можно лишь по одной реализации достаточно большой длительности, существенно превышающей период самой низкочастотной циклической составляющей.
Оценку стационарности процесса начинают с рассмотрения его физической природы. Если основные физические факторы, определяющие процесс, не зависят от времени, то можно без дальнейшего исследования полагать изучаемый процесс стационарным. Например, можно считать, что случайный процесс колебаний силы резания при фрезеровании обладает свойством стационарности, если величина припуска и ширина заготовки остаются в процессе резания неизменными. С другой стороны, если известно, что на рассматриваемом промежутке времени происходит существенный износ фрезы, влияющий на усилие резания, то процесс можно считать стационарным только после исключения тренда.
Если простые физические соображения не позволяют априори предположить гипотезу о стационарности, то она должна быть проверена путём анализа имеющихся реализаций. Способы проверки могут быть различными: от визуального просмотра реализаций опытным специалистом до детального статистического оценивания параметров процесса. В частности, для проверки стационарности случайного процесса по отдельной его реализации x(t) следует выполнить следующую последовательность действий:
- реализация процесса разделяется на N равных интервалов, причем наблюдения в различных интервалах полагаются независимыми;
- вычисляются средние значения и дисперсии для каждого интервала, и эти оценки располагаются в порядке возрастания номера интервала;
- полученные последовательности проверяются на наличие тренда и периодических составляющих.
Предположение о нормальности позволяет существенно упростить аналитическое исследование свойств случайного процесса.
Установление содержания периодических составляющих является одним из важных направлений исследований производственных процессов. В частности, в металлообработке, эти составляющие могут быть вызваны, например, колебаниями узлов и деталей (см. главу 5) и определять многие характеристики качества (точность, шероховатость и т.д.). Определение циклической составляющей (составляющих) позволяет избежать ошибок при интерпретации результатов анализа. В частности, это позволяет не путать их со случайным шумом.
Если периодические составляющие имеют большие амплитуды, то их наличие можно обнаружить в результате визуального анализа графического представления временного ряда. Однако при малых амплитудах и при наложении нескольких периодических компонент они не проявляются столь отчетливо. Поэтому практические методы выделения скрытых периодичностей представляют собой развитие методов анализа случайных процессов. Установление наличия скрытых периодичностей наиболее эффективно осуществляется методами гармонического анализа, см. ????.
Этапы анализа могут располагаться в следующем порядке:
- «сглаживание», см. …,
- графическое представление и описание поведения временного ряда;
- выделение и при необходимости удаление тренда (см. …),
- исключение выбросов (см. …),
- «смещение нуля», то есть вычитание из всех значений временного ряда среднего значения, что облегчает выполнение следующих этапов,
- определение циклической составляющей (составляющих), вызванной, например, колебаниями узлов и деталей (см. …). Этот этап может являться одним из важных направлений исследований причин колебаний и неоднородностей. Наоборот, если цель анализа - исследование случайной составляющей временного ряда, то выявление низко- или высокочастотных составляющих процесса требуется для их удаления (процесс «фильтрации»).
- исследование оставшейся случайной составляющей ВР, после удаления перечисленных выше составляющих;
- построение (подбор) математических моделей для описания случайной и систематических составляющих и проверка их адекватности;
- прогнозирование будущего развития процесса;
- исследование взаимодействий между различными временными рядами или различными компонентами многомерного временного ряда;
- разработка технических решений.
Сформулируем основные методы анализа временных рядов:
-«сглаживание и фильтрация»предназначены для преобразования временных рядов с целью удаления из них высокочастотных или сезонных колебаний;
- «модели авторегрессии и скользящего среднего» оказываются особенно полезными для описания и прогнозирования процессов, проявляющих однородные колебания вокруг среднего значения;
-«прогнозирование» позволяет на основе подобранной регрессионной модели поведения временного ряда предсказывать его значения в будущем.
- «спектральный анализ»позволяет находить периодические и квазипериодические составляющие временного ряда;
- «корреляционный анализ» позволяет выявить существенные периодические зависимости и их «лаги»(задержки) внутри одного процесса (автокорреляция) или между несколькими процессами («многомерный спектральный анализ»,«кросскорреляция»);
Способы сглаживания.
При анализе рядов динамики возникает важная задача: определения основной тенденции в развитии исследуемого явления. В некоторых случаях общая тенденция ясно прослеживается в динамике, в других ситуациях она может не просматриваться из-за случайных колебаний. Для нивелирования влияния случайных колебаний с целью выявления основных тенденций развития временного ряда и используются процедуры сглаживания.
Методы сглаживания разделяют на два класса, два подхода:аналитический иалгоритмический.
Аналитический метод сглаживания основан на допущении, что исследователь может задать общий вид функции, описывающей неслучайную составляющую (на основе визуального анализа графика временного ряда, знания процесса, логических соображений). Тогда на следующем этапе проводится статистическая оценка коэффициентов модели, по сути дела регрессионный анализ, где одним из многих или единственным фактором является временной параметр (текущая переменная).
Алгоритмическийметод сглаживания -является темой данного параграфа.
Алгоритмическоесглаживание представляет собой некоторый способ локального усреднения данных, при котором несистематические (случайные) компоненты взаимно погашают друг друга.
Алгоритмическоесглаживание в отличие от аналитического не ставит задачу установления общего вида функции. Обычно алгоритмический этап предшествует аналитическому этапу, т.к. он позволяет точнее установить общую тенденцию развития ряда и обоснованно выбирать вид модели для аналитического этапа.
Основные приемы алгоритмического сглаживания:
1.«Укрупнение интервалов» -наиболее простой прием. Например, ряд данных о ежедневной производительности можно преобразовать в ряд динамики помесячной производительности. Тем самым истинно «случайные» колебания производительности и колебания производительности, объёктивно существующие на протяжении рабочей недели, усредняются и лучше просматривается динамика изменения производительности по месяцам, годам. Уровни эго ряда могут быть получены суммированием уровней исходного ряда, используя свойство аддитивности интервальных временных рядов, см. выше § 8.1, либо могут представлять средние значения моментных временных рядов, усреднённых на большем интервале «текущей переменной».
2.«Собственно сглаживание временного ряда-различные способызамены фактических уровней временного ряда расчетными значениями, в меньшей степени подверженными случайным колебаниям.
2.А.«Метод скользящей средней»(называется также «методом простой скользящей средней», методом «подвижного среднего» или«окном Даниэля») заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем – средний уровень из такого же числа уровней, начиная со второго, далее - начиная с третьего и т.д. Это число, данный интервал уровней ряда (как правило, нечётное число) часто называют «окном». То есть сам выбранный интервал («окно») как бы скользит вдоль ряда. Чем больше размер «окна», тем более гладкий вид имеет график скользящих средних, но слишком большой размер «окна» может привести к упущению сглаживанию каких-то высокочастотных детерминированных колебаний.
2.Б.«Медианное сглаживание» - вместо средней можно использовать медиану значений, попавших в окно. Основное преимущество медианного сглаживанияв сравнении со сглаживанием скользящей средней состоит в том, что результаты становятся более устойчивыми к выбросам, имеющимся внутри окна. Основной недостаток медианного сглаживания в том, что при отсутствии явных выбросов он приводит к более «зубчатым» кривым, чем сглаживание скользящей средней, и не позволяет использовать «веса», см. ниже.
Когда тренд выравниваемого ряда имеет явно нелинейный характер и к тому же желательно сохранить мелкие волны, использование для сглаживания ряда методов 1.Би 2.Бнецелесообразно, так как может привести к значительным искажениям исследуемого процесса.
2.В.В таких случаях более надежным является использование таких методов, которые не просто усредняют уровни ряда в пределах «окна», а придают им при этом разные «веса» в зависимости от расположения в пределах «окна». «Методы взвешенной скользящей средней», в которых в отличие от метода простой скользящей средней, где все расположенные в окне наблюдения временного ряда при усреднении имеют равный «вес», эти веса (выраженные коэффициентами) различаются, увеличиваясь по мере увеличения координаты «текущей переменной». Это увеличение объяснимо, т.к. наиболее «свежие» результаты оказывают наибольшее влияние на текущее значение ряда. Эти методы увеличения «веса» скользящей средней wj, то есть свойства «окна» различаются. Перечислим наиболее известные способы или «окна»:
-«окно Тьюки»;
-«окно Хемминга»;
-«окно Парзена»;
-«окно Бартлетта».
2Г. «Метод экспоненциального сглаживания» в современных условиях использования компьютерной техники находит наиболее частое применение. В отличие от всяческих методов скользящей средней (2А - 2В) в определении экспоненциальной средней участвуют всенаблюдения исходного временного ряда, но с разными весовыми коэффициентами, а не только те, что попали в определенное окно. Для экспоненциального сглаживания, как и в случае взвешенной скользящей средней, момент времени, в который наблюдалось значение временного ряда (в общем случае - значение «текущей переменной»), играет решающую роль. Здесь более «старым» наблюдениям (значительнее удалённым от текущего момента) приписываются экспоненциально убывающие веса. Экспоненциальная средняя обладает большей временной устойчивостью по сравнению со скользящей средней. Формула метода простого экспоненциального сглаживания «рекуррентна», то есть каждый последующий член сглаженного ряда (St) можно выразить через предыдущий (St-1) член ряда. Новое теоретическое сглаженное значение (St) вычисляется как взвешенное среднее текущего наблюдения (Ct) и теоретического сглаженного значения предыдущего периода (St-1):
(8.1)
где: St сглаженный ряд, Ct - исходный ряд, 0< α <1 - коэффициент экспоненциального сглаживания (как правило, берётся α = 0,1- 0,3).