Спектральный (Фурье) анализ
В спектральном анализе исследуются периодические модели данных. Цель анализа - разложить комплексные временные ряды с циклическими компонентами на несколько основных синусоидальных функций с определенной длиной волн. Термин спектральный - своеобразная метафора для описания природы этого анализа. Предположим, Вы изучаете луч белого солнечного света, который, на первый взгляд, кажется хаотически составленным из света с различными длинами волн. Однако, пропуская его через призму, Вы можете отделить волны разной длины или периодов, которые составляют белый свет. Фактически, применяя этот метод, Вы можете теперь распознавать и различать разные источники света. Таким образом, распознавая существенные основные периодические компоненты, Вы узнали что-то об интересующем Вас явлении. В сущности, применение спектрального анализа к временным рядам подобно пропусканию света через призму. В результате успешного анализа можно обнаружить всего несколько повторяющихся циклов различной длины в интересующих Вас временных рядах, которые, на первый взгляд, выглядят как случайный шум.
Наиболее известный пример применения спектрального анализа - циклическая природа солнечных пятен (Шамвэй, 1988 - см. ниже). Оказывается, что активность солнечных пятен имеет 11-ти летний цикл. Другие примеры небесных явлений, изменения погоды, колебания в товарных ценах, экономическая активность и т.д. также часто используются в литературе для демонстрации этого метода. В отличие от АРПСС или метода экспоненциального сглаживания, цель спектрального анализа - распознать сезонные колебания различной длины, в то время как в предшествующих типах анализа, длина сезонных компонент обычно известна (или предполагается) заранее и затем включается в некоторые теоретические модели скользящего среднего или автокорреляции.
Ниже будут рассмотрены основные обозначения и принципы спектрального анализа и кросс-спектрального анализа.
Частота и период
Длина волны функций синуса или косинуса, как правило, выражается числом циклов (периодов) в единицу времени (Частота), часто обозначается греческой буквой ню ( ; в некоторых учебниках также используют f). Например, временной ряд, состоящий из количества писем, обрабатываемых почтой, может иметь 12 циклов в году: первого числа каждого месяца отправляется большое количество корреспонденции (много счетов приходит именно первого числа каждого месяца); затем, к середине месяца, количество корреспонденции уменьшается; и затем вновь возрастает к концу месяца. Поэтому каждый месяц колебания в количестве корреспонденции, обрабатываемой почтовым отделением, будут проходить полный цикл. Таким образом, если единица анализа - один год, то будет равно 12 (поскольку имеется 12 циклов в году). Конечно, могут быть и другие циклы с различными частотами. Например, годичные циклы ( = 1) и, возможно, недельные циклы ( = 52 недели в год).
Общая структура модели
Цель спектрального анализа - разложить ряд на функции синусов и косинусов различных частот, для определения тех, появление которых особенно существенно и значимо. Один из возможных способов сделать это - решить задачу линейной множественной регрессии, где зависимая переменная - наблюдаемый временной ряд, а независимые переменные или регрессоры: функции синусов всех возможных (дискретных) частот. Такая модель линейной множественной регрессии может быть записана как
(для k = 1 до q)
Следующее общее понятие классического гармонического анализа в этом уравнении - (лямбда) - это круговая частота, выраженная в радианах в единицу времени, т.е.
где - константа pi = 3.1416 и .
Здесь важно осознать, что вычислительная задача подгонки функций синусов и косинусов разных длин к данным может быть решена с помощью множественной линейной регрессии. Заметим, что коэффициенты при косинусах и коэффициенты при синусах - это коэффициенты регрессии, показывающие степень, с которой соответствующие функции коррелируют с данными (заметим, что сами синусы и косинусы на различных частотах не коррелированы или, другим языком, ортогональны. Таким образом, мы имеем дело с частным случаем разложения по ортогональным полиномам). Всего существует q различных синусов и косинусов; интуитивно ясно, что число функций синусов и косинусов не может быть больше числа данных в ряде. Не вдаваясь в подробности, отметим, если N - количество данных, то будет N/2+1 функций косинусов и N/2-1 функций синусов. Другими словами, различных синусоидальных волн будет столько же, сколько данных, и вы сможете полностью воспроизвести ряд по основным функциям. (Заметим, если количество данных в ряде нечетно, то последнее наблюдение обычно опускается. Для определения синусоидальной функции нужно иметь, по крайней мере, две точки: высокого и низкого пика).
В итоге, спектральный анализ определяет корреляцию функций синусов и косинусов различной частоты с наблюдаемыми данными. Если найденная корреляция (коэффициент при определенном синусе или косинусе) велика, то можно заключить, что существует строгая периодичность на соответствующей частоте в данных.
Шамвэй предлагает следующий простой пример для объяснения спектрального анализа. Создадим ряд из 16 наблюдений, полученных из уравнения, показанного ниже, а затем посмотрим, каким образом можно извлечь из него информацию. Сначала создадим переменную и определим ее как:
В системе STATISTICA вы можете создать эту переменную, введя формулу как длинную метку переменной. Переменная состоит из двух основных периодичностей: первая с частотой n=0.0625 (или периодом 1/n=16; одно наблюдение составляет 1/16-ю длины полного цикла, или весь цикл содержит каждые 16 наблюдений) и вторая с частотой n=0.2 (или периодом 5). Коэффициент при косинусе (1.0) больше чем коэффициент при синусе (0.75). Итоговая таблица результатов спектрального анализа, вычисленная модулем Временные ряды, показана ниже.
Спектральный анализ Число наблюд.: 16 | |||||
t | Частота | Период | Косинус коэфф. | Синус коэфф. | периодограмма |
0.0000 | 16.00 | 0.000 | 0.000 | 0.000 | |
0.0625 | 8.00 | 1.006 | 0.028 | 8.095 | |
0.0125 | 5.33 | 0.033 | 0.079 | 0.059 | |
0.1875 | 4.00 | 0.374 | 0.559 | 3.617 | |
0.2500 | 3.20 | -0.144 | -0.144 | 0.333 | |
0.3125 | 2.67 | -0.089 | -0.060 | 0.092 | |
0.3750 | 2.29 | -0.075 | -0.031 | 0.053 | |
0.4375 | 2.00 | -0.070 | -0.014 | 0.040 | |
0.5000 | -0.068 | 0.000 | 0.037 |
Теперь рассмотрим столбцы таблицы результатов. Ясно, что наибольший коэффициент при косинусах расположен напротив частоты 0.0625. Наибольший коэффициент при синусах соответствует частоте 0.1875. Таким образом, эти две частоты, которые были внесены в данные, отчетливо проявились.