Автокорреляция уровней временного ряда и выявление его структуры.
Проведем тестирование ряда на постоянство математического ожидания и дисперсии с помощью параметрического теста на основе критерия Фишера.
Разобьем ряд на 2 части, в первую из которых войдут наблюдения с 1 по 18, а во вторую – с 19 по 28.
Определим математические ожидания:
Рассчитаем дисперсии:
Рассчитаем отношение дисперсий:
Fнабл= 3,52:4,47=0,79.
Критическая область имеет вид Vкрит=( Если Fнабл∉Vкрит, то принимается основная гипотеза Н0 (гипотеза о постоянстве дисперсии), если Fнабл ϵVкрит, то основная гипотеза отклоняется и принимается альтернативная Н1 (гипотеза о непостоянстве дисперсии) на уровне значимости ɑ=0,05.
Vкрит=(2,973696; + ), следовательно, Fнабл∉Vкрит, принимается гипотеза Н0, в соответствии с которой можно судить о постоянстве математического ожидания и дисперсии.
Проведем тестирование ряда на постоянство математического ожидания и дисперсии с помощью непараметрического теста Манна-Уитни.
Для проведения теста Манна-Уитни вновь разделим все данные выборки на 2 части, в первую из которых войдут наблюдения с 1 по 18 , а во вторую – с 19 по 28. Отсортируем теперь все элементы выборки по возрастанию, запомнив, к какой из выборок они относятся (табл.2).
Таблица 2.
Отсортированные значения ряда | Принадлежность к выборке | R1 | R2 |
9,84 | |||
10,61 | |||
11,17 | |||
11,23 | |||
11,25 | |||
11,83 | |||
12,5 | |||
12,52 | |||
12,57 | |||
12,8 | |||
13,12 | |||
13,37 | |||
13,47 | |||
13,76 | |||
13,8 | |||
13,99 | |||
14,04 | |||
14,12 | |||
14,46 | |||
15,3 | |||
15,31 | |||
16,07 | |||
16,16 | |||
16,21 | |||
16,35 | |||
16,72 | |||
18,05 | |||
18,2 | |||
Сумма |
Сумма рангов для элементов первой выборки равна 211,
z=R1-0,5*T1*(T1+T2+1):корень(1/2*T1*T2*(T1+T2))=-2,43975.
Статистика критерия Манна-Уитни имеет стандартное нормальное распределение. Значение квантиля стандартного нормального распределения для уровня значимости а=0,05 равна 1,96. Так как -1,96<z<1,96, то нулевая гипотеза о постоянстве математического ожидания Н0 отклоняется.
Автокорреляция уровней временного ряда и выявление его структуры.
При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависит от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.
Число периодов, по которым рассчитывается коэффициент автокорреляции, называют лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Некоторые авторы считают целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше n/4. В нашем случае n=28.
Имеются следующие значения (таблица 1). Определим коэффициент автокорреляции первого порядка (добавим yt-1 в таблицу 1). Он составит 0,827023484. Продолжим расчеты аналогичным образом (таблица 3).
Таблица 3.
t | y | y-1 | y-2 | y-3 | y-4 | y-5 | y-6 | y-7 |
11,25 | - | - | - | - | - | - | - | |
12,8 | 11,25 | - | - | - | - | - | - | |
13,8 | 12,8 | 11,25 | - | - | - | - | - | |
14,04 | 13,8 | 12,8 | 11,25 | - | - | - | - | |
14,12 | 14,04 | 13,8 | 12,8 | 11,25 | - | - | - | |
12,5 | 14,12 | 14,04 | 13,8 | 12,8 | 11,25 | - | - | |
11,23 | 12,5 | 14,12 | 14,04 | 13,8 | 12,8 | 11,25 | - | |
9,84 | 11,23 | 12,5 | 14,12 | 14,04 | 13,8 | 12,8 | 11,25 | |
10,61 | 9,84 | 11,23 | 12,5 | 14,12 | 14,04 | 13,8 | 12,8 | |
11,17 | 10,61 | 9,84 | 11,23 | 12,5 | 14,12 | 14,04 | 13,8 | |
12,52 | 11,17 | 10,61 | 9,84 | 11,23 | 12,5 | 14,12 | 14,4 | |
15,3 | 12,52 | 11,17 | 10,61 | 9,84 | 11,23 | 12,5 | 14,12 | |
16,16 | 15,3 | 12,52 | 11,17 | 10,61 | 9,84 | 11,23 | 12,5 | |
16,21 | 16,16 | 15,3 | 12,52 | 11,17 | 10,61 | 9,84 | 11,23 | |
15,31 | 16,21 | 16,16 | 15,3 | 12,52 | 11,17 | 10,61 | 9,84 | |
13,47 | 15,31 | 16,21 | 16,16 | 15,3 | 12,52 | 11,17 | 10,61 | |
13,12 | 13,47 | 15,31 | 16,21 | 16,16 | 15,3 | 12,52 | 11,17 | |
12,57 | 13,12 | 13,47 | 15,31 | 16,21 | 16,16 | 15,3 | 12,52 | |
11,83 | 12,57 | 13,12 | 13,47 | 15,31 | 16,21 | 16,16 | 15,3 | |
13,76 | 11,83 | 12,57 | 13,12 | 13,47 | 15,31 | 16,21 | 16,16 | |
14,46 | 13,76 | 11,83 | 12,57 | 13,12 | 13,47 | 15,31 | 16,21 | |
16,35 | 14,46 | 13,76 | 11,83 | 12,57 | 13,12 | 13,47 | 15,31 | |
18,05 | 16,35 | 14,46 | 13,76 | 11,83 | 12,57 | 13,12 | 13,47 | |
18,2 | 18,05 | 16,35 | 14,46 | 13,76 | 11,83 | 12,57 | 13,12 | |
16,72 | 18,2 | 18,05 | 16,35 | 14,46 | 13,76 | 11,83 | 12,57 | |
16,07 | 16,72 | 18,2 | 18,05 | 16,35 | 14,46 | 13,76 | 11,83 | |
13,99 | 16,07 | 16,72 | 18,2 | 18,05 | 16,35 | 14,46 | 13,76 | |
13,37 | 13,99 | 16,07 | 16,72 | 18,2 | 18,05 | 16,35 | 14,46 |
Таким образом, мы получили автокорреляционную функцию этого ряда (таблица 4).
Таблица 4.
Лаг | Коэффициент автокорреляции уровней |
0,827023484 | |
0,482247928 | |
0,091043139 | |
-0,247560872 | |
-0,384964231 | |
-0,313219699 | |
-0,019734626 | |
0,416444715 | |
0,805391786 | |
0,939589159 | |
0,725918616 | |
0,270248881 | |
-0,218825119 | |
-0,572509587 |
Коррелограмма (график зависимости значений автокорреляционной функции временного ряда от величины лага) представлена на рисунке 1.
Рис.1. Коррелограмма
Анализ значений автокорреляционной функции позволяет сделать вывод о наличии в изучаемом временном ряде. Во-первых, линейной тенденции, во-вторых, колебаний с периодом, составляющим примерно 10 элементов временного ряда, т.к. мы видим, что при анализе наиболее высоким оказался коэффициент автокорреляции 10-го порядка (0,939589159).
Временным рядом называется последовательность значений некоторого параметра в последовательные моменты времени. В качестве параметра при этом может, например, выступать объем продаж, курс обмена валют, индекс потребительских расходов и т.д.
Допустим, у нас имеется такая последовательность:
Y1,Y2,…,Yn, (1)
где – значение параметра Y в следующие друг за другом моменты времени , . Значения времени могут быть либо равностоящими (по дням, неделям, месяцам и т.д.), либо нет.
Обычно предполагается, что статистические данные по параметру Y являются следствием проявления трех факторов:
T=T(t) - тенденция,
C=C(t) - сезонность,
И=И(t) - иррациональность,
где t – время.
Если предположить , что Y есть оценка событий, протекающих в некоторой среде не подверженной резким изменения, то тенденция (т.е. нечто предопределенное) должна хотя бы на ближайшую перспективу существовать. При увеличении, например реальных доходов населения в целом, будет расти и объем продаж каждого отдельного предпринимателя.
Внешняя среда или способ организации какой-либо деятельности могут привести к тому, что в данных (1) будут проявляться некоторые колебательные процессы. Часто спрос на отдельные виды товаров или услуг носит сезонный характер.
Очевидно, есть множество других факторов, влияющих на параметр Y, которые мы не замечаем и не осознаем. Они проявляют себя, с нашей точки зрения, как бы случайно. Их суммарное воздействие стараются учесть в факторе иррациональности.
Наличие указанных трёх факторов в параметре Y может быть отражено по-разному. На практике, как правило, используют две модели:
Y(t)=T(t)*C(t)*И(t) – мультипликативная, (2)
Y(t)=T(t)+C(t)+И(t) – аддитивная. (3)
Принципиальное их отличие состоит в том, что отсутствие фактора сезонного колебания есть С(t) = 1 в первой модели и С(t) = 0 – во второй.
Технология использования обеих моделей однотипна и приводит к схожим результатам. Продемонстрируем ее на следующем примере.
Допустим, имеются данные по некоторому параметру Y объёма n=28 для равностоящих моментов времени ti=t, i= (табл.5).
Графическое представление временного ряда (рис.2) показывает наличие в параметре Y всех трех факторов:
Необходимо дать прогноз поведения параметра Y в будущем на один цикл сезонных колебаний, основанный на мультипликативной модели.