Шаг 5: Отыскание возможных циклов

Отыскание циклов с помощью визуальной проверки.Возмож­но, основной способ отыскания циклов состоит в том, чтобы посчитать время между схожими максимумами и минимумами в ряду данных. Именно этим методом пользовались исследователи (например, Сэмюэл Беннер) для отыскания циклов в XIX столетии. К сожалению, при боль­шом объеме данных этот метод чрезвычайно утомителен. Значительно более простой подход заключается в том, чтобы с помощью линейки измерить расстояния между главными максимумами и минимумами на графике. Одним из инструментов, весьма облегчающих эту процедуру, оказывается определитель циклов Эрлиха, — похожий на аккордеон инструмент с девятью указателями, который может быть растянут таким образом, что указатели оказываются под главными максимумами или минимумами. Одна из проблем, связанных с методами визуальной про­верки, состоит в том, что они не позволяют статистически проверить найденные циклы. Кроме того, трудно обнаружить комбинацию несколь­ких циклов без использования стандартных математических приемов.

Периодограмма.Периодограмма, которая была впервые разработа­на в 1898 г. Шустером, — один из наиболее известных и наиболее важ­ных инструментов исследования цикла. Периодограмма ищет циклы, анализируя данные в табличной форме. Имеющиеся данные будут в хро­нологическом порядке разбиты на колонки, причем количество исполь­зуемых колонок равно длине цикла, который отыскивается. Для каждо­го отыскиваемого цикла определенной длины приходится строить от­дельную периодограмму. Например, если у нас есть годичные данные за 135 лет, и мы хотели бы проверить, присутствуют ли в них 9-годич-ные циклы, нам пришлось бы разбивать данные на девять колонок и пят­надцать строк. Данные в первой точке были бы помещены в первую строку первой колонки; данные во второй точке — в строку 1 и колон­ку 2; данные в девятой точке — в строку 1 и колонку 9; данные в деся­той точке — в строку 2 и колонку 1. Таблица заполняется таким обра­зом, пока данные в 135 точке ни будут помешены в 9 колонку 15 стро­ки. Затем для каждой колонки было бы выведено среднее значение. Если бы в данных присутствовал 9-годичный цикл, мы бы ожидали, что сред­нее значение для одной колонки будет показывать значительный макси­мум, а для другой колонки — значительный минимум. (Если бы 9-годич-ного цикла не было, средние значения для колонок оказались бы при­мерно совпадающими, если тренд предварительно удален из данных.) Табл. 16.1 предоставляет пример периодограммы, использующей логарифмы годичных цен на кукурузу с 1850 по 1989 г. (Логарифмы данных были умножены на 1000, чтобы избежать десятичных дробей.




590 ЧАСТЬ 3. осцилляторы и циклы

Умножение всех данных на константу не будет оказывать какое-либо воздействие на анализ цикла.) Рис. 16.7 показывает диаграмму средних значений всех строк. Если бы из данных был полностью удален тренд, средние значения строк были бы примерно одинаковыми. Общий вос­ходящий тренд в диаграмме средних значений строк возникает благо­даря тому факту, что взятие логарифмов лишь частично снимает на­правленность данных.

Рис. 16.8 показывает средние значения колонок. Тот факт, что на­блюдается существенный пик в восьмой колонке и существенный спад во второй колонке, предполагает, что в данных может присутствовать 9-годичный цикл*.

Если бы, с другой стороны, диаграмма средних значений колонок была относительно плоской, возможность присутствия 9-годичного цик­ла следовало бы исключить. Например, на рис. 16.9 одновременно показаны диаграммы средних значений для периодограмм с восемью и девятью колонками. Как можно видеть, различия между средними зна­чениями в случае восьми колонок значительно меньше, чем в случае девяти колонок. Это означает, что мы можем исключить возможность восьмигодичных циклов в данных.

Главное преимущество периодограммы в том, что она предостав­ляет простой метод идентификации всех возможных циклов, присут­ствующих в данных. Основной недостаток состоит в том, что проце­дура не позволяет определить, какие из найденных возможных циклов статистически значимы (та же самая проблема, что и в случае визуаль­ной проверки). Другими словами, всегда присутствует некоторый раз­брос средних значений колонок. Как мы можем судить, является ли этот разброс статистически важным? В случае только что приведен­ного примера данных по кукурузе интуитивно ясно, что разброс сред­них значений в периодофамме, состоящей из восьми колонок, не ва­жен, но как мы можем убедиться в том, что разность между средними значениями колонок в периодофамме, состоящей из девяти колонок, статистически значима? Проверка статистической достоверности цик­лов стала возможной после разработки гармонического анализа, ко­торый использует периодограмму как базу при тестировании статис­тической значимости циклов. Позже мы вернемся к вопросу статисти­ческой проверки.

Наблюдательный читатель может поинтересоваться, не связан ли тот факт, что спад появляется в колонке с маленьким номером (2), а пик в колонке с большим номером (8), просто с тем, что в данных остался некий тренд. Хотя присутствие тренда действительно будет вести к более высоким средним зна­чениям в колонках с большими номерами, влияние тренда на эти данные явно недостаточно, чтобы объяснить значительный разброс средних значений в пе­риодофамме, состоящей из девяти колонок. Этот момент станет очевидным, как только мы рассмотрим периодограмму из восьми колонок.

Таблица 16.1. ПЕРИОДОГРАММА.

Колонка/ /строка 9 Среднее значение строки
1638,11
1727,22
1918 1645 1826 1568 1847 1541 1684 1570 1577 1690 1559 1822 1811 1723 1793 1705 1644 1626 1739,89 1654,44
1616,33
1563,22
1744,67
1986,11
1924,22
1758,44
2051,56
2168,22
2073,89
2207,78
2439,00
Среднее зна­чение колонки 1836,9 1795,4 1811,2 1840,3 1901,4 1954,0 1953,7 1961,7 1921,3  

ел



Рисунок 16.7.


Наши рекомендации