Шаг 5: Отыскание возможных циклов
Отыскание циклов с помощью визуальной проверки.Возможно, основной способ отыскания циклов состоит в том, чтобы посчитать время между схожими максимумами и минимумами в ряду данных. Именно этим методом пользовались исследователи (например, Сэмюэл Беннер) для отыскания циклов в XIX столетии. К сожалению, при большом объеме данных этот метод чрезвычайно утомителен. Значительно более простой подход заключается в том, чтобы с помощью линейки измерить расстояния между главными максимумами и минимумами на графике. Одним из инструментов, весьма облегчающих эту процедуру, оказывается определитель циклов Эрлиха, — похожий на аккордеон инструмент с девятью указателями, который может быть растянут таким образом, что указатели оказываются под главными максимумами или минимумами. Одна из проблем, связанных с методами визуальной проверки, состоит в том, что они не позволяют статистически проверить найденные циклы. Кроме того, трудно обнаружить комбинацию нескольких циклов без использования стандартных математических приемов.
Периодограмма.Периодограмма, которая была впервые разработана в 1898 г. Шустером, — один из наиболее известных и наиболее важных инструментов исследования цикла. Периодограмма ищет циклы, анализируя данные в табличной форме. Имеющиеся данные будут в хронологическом порядке разбиты на колонки, причем количество используемых колонок равно длине цикла, который отыскивается. Для каждого отыскиваемого цикла определенной длины приходится строить отдельную периодограмму. Например, если у нас есть годичные данные за 135 лет, и мы хотели бы проверить, присутствуют ли в них 9-годич-ные циклы, нам пришлось бы разбивать данные на девять колонок и пятнадцать строк. Данные в первой точке были бы помещены в первую строку первой колонки; данные во второй точке — в строку 1 и колонку 2; данные в девятой точке — в строку 1 и колонку 9; данные в десятой точке — в строку 2 и колонку 1. Таблица заполняется таким образом, пока данные в 135 точке ни будут помешены в 9 колонку 15 строки. Затем для каждой колонки было бы выведено среднее значение. Если бы в данных присутствовал 9-годичный цикл, мы бы ожидали, что среднее значение для одной колонки будет показывать значительный максимум, а для другой колонки — значительный минимум. (Если бы 9-годич-ного цикла не было, средние значения для колонок оказались бы примерно совпадающими, если тренд предварительно удален из данных.) Табл. 16.1 предоставляет пример периодограммы, использующей логарифмы годичных цен на кукурузу с 1850 по 1989 г. (Логарифмы данных были умножены на 1000, чтобы избежать десятичных дробей.
590 ЧАСТЬ 3. осцилляторы и циклы
Умножение всех данных на константу не будет оказывать какое-либо воздействие на анализ цикла.) Рис. 16.7 показывает диаграмму средних значений всех строк. Если бы из данных был полностью удален тренд, средние значения строк были бы примерно одинаковыми. Общий восходящий тренд в диаграмме средних значений строк возникает благодаря тому факту, что взятие логарифмов лишь частично снимает направленность данных.
Рис. 16.8 показывает средние значения колонок. Тот факт, что наблюдается существенный пик в восьмой колонке и существенный спад во второй колонке, предполагает, что в данных может присутствовать 9-годичный цикл*.
Если бы, с другой стороны, диаграмма средних значений колонок была относительно плоской, возможность присутствия 9-годичного цикла следовало бы исключить. Например, на рис. 16.9 одновременно показаны диаграммы средних значений для периодограмм с восемью и девятью колонками. Как можно видеть, различия между средними значениями в случае восьми колонок значительно меньше, чем в случае девяти колонок. Это означает, что мы можем исключить возможность восьмигодичных циклов в данных.
Главное преимущество периодограммы в том, что она предоставляет простой метод идентификации всех возможных циклов, присутствующих в данных. Основной недостаток состоит в том, что процедура не позволяет определить, какие из найденных возможных циклов статистически значимы (та же самая проблема, что и в случае визуальной проверки). Другими словами, всегда присутствует некоторый разброс средних значений колонок. Как мы можем судить, является ли этот разброс статистически важным? В случае только что приведенного примера данных по кукурузе интуитивно ясно, что разброс средних значений в периодограмме, состоящей из восьми колонок, не важен, но как мы можем убедиться в том, что разность между средними значениями колонок в периодограмме, состоящей из девяти колонок, статистически значима? Проверка статистической достоверности циклов стала возможной после разработки гармонического анализа, который использует периодограмму как базу при тестировании статистической значимости циклов. Позже мы вернемся к вопросу статистической проверки.
* Наблюдательный читатель может поинтересоваться, не связан ли тот факт,
что спад появляется в колонке с маленьким номером (2), а пик в колонке с большим номером (8), просто с тем, что в данных остался некий тренд. Хотя присутствие тренда действительно будет вести к более высоким средним значениям в колонках с большими номерами, влияние тренда на эти данные явно недостаточно, чтобы объяснить значительный разброс средних значений в периодограмме, состоящей из девяти колонок. Этот момент станет очевидным, как только мы рассмотрим периодограмму из восьми колонок.
Таблица 16.1. ПЕРИОДОГРАММА.
Колонка/ /строка | Среднее значение строки | |||||||||
1638,11 | ||||||||||
1727,22 | ||||||||||
1918 1645 | 1826 1568 | 1847 1541 | 1684 1570 | 1577 1690 | 1559 1822 | 1811 1723 | 1793 1705 | 1644 1626 | 1739,89 1654,44 | |
1616,33 | ||||||||||
1563,22 | ||||||||||
1744,67 | ||||||||||
1986,11 | ||||||||||
1924,22 | ||||||||||
1758,44 | ||||||||||
2051,56 | ||||||||||
2168,22 | ||||||||||
2073,89 | ||||||||||
2207,78 | ||||||||||
2439,00 | ||||||||||
Среднее значение колонки | 1836,9 | 1795,4 | 1811,2 | 1840,3 | 1901,4 | 1954,0 | 1953,7 | 1961,7 | 1921,3 |
Рисунок 16.7.