Часові ряди і прогнозування. Автокореляція збурень
Одним із найважливіших етапів аналізу часового (динамічного) ряду є прогнозування. При цьому виходять із того, що тенденція розвитку, яка встановлена у минулому, може бути поширена (екстрапольована) на майбутній період. Завдання ставиться так: є часовий (динамічний) ряд і потрібно дати прогноз рівня цього ряду в момент . Було розглянуто точковий та інтервальний прогнози значень залежної змінної Y, тобто визначення точкових та інтервальних оцінок Y, отриманих для парної (див. розділ 6) і множинної (див. додаток 3) регресій для значень пояснюючих змінних Х, що розташовані поза межами досліджуваного діапазону значень Х.
Якщо розглядати часовий ряд як регресійну модель ознаки, що вивчається, по змінній «час», то до нього можуть бути застосовані розглянуті вище методи аналізу. Одна з основних передумов регресійного аналізу полягає в тому, що збурення є незалежною випадковою величиною з математичним сподіванням (середнім значенням), рівним нулю. А при роботі з часовими рядами таке припущення виявляється у багатьох випадках невірним.
Дійсно, якщо вид функції тренда вибраний невдало, то навряд чи можна говорити про те, що відхилення від неї (збурення ) є незалежними. В цьому випадку спостерігається помітна концентрація позитивних і негативних збурень, і можна припускати їх взаємозв'язок. Якщо послідовні значення корелюють між собою, то кажуть про автокореляцію збурень (залишків, помилок).
Метод найменших квадратів і у випадку автокореляції збурень дає незміщені і спроможні оцінки параметрів, проте їх інтервальні оцінки можуть містити грубі помилки. У разі виявлення автокореляції збурень доцільно знов повернутися до проблеми специфікації рівняння регресії (вибору функції тренда) переглянути набір включених в нього змінних і тому подібне .
Найбільш простим і достатньо надійним критерієм визначення автокореляції збурень є критерій Дарвіна— Уотсона. За допомогою цього критерію перевіряється гіпотеза про відсутності автокореляції між сусідніми залишковими членами ряду і (для лага =1), де вибіркова оцінка . Статистика критерію має вигляд:
(8.9)
При достатньо великому можна вважати, що
Тоді, після нескладних перетворень, отримаємо:
(8.10)
Статистика знаходиться в межах від 0 до 4; за відсутності автокореляції ( оскільки при цьому ); при повній додатній автокореляції при повній від’ємній — Для - статистики знайдені верхня і нижня
критичні межі на рівнях значущості = 0,01; 0,025 і 0,05.
Якщо фактично спостережуване значення :
a) , то гіпотеза про відсутність автокореляції не відкидається (приймається);
б) або , то питання про відкидання гіпотези залишається відкритим (область невизначеності критерію);
в) , то приймається альтернативна гіпотеза про позитивну автокореляцію;
г) , то приймається альтернативна гіпотеза про негативну автокореляцію.
У табл. 8.2 наведений фрагмент таблиці значень статистик і
критерію Дарбіна—Уотсона на рівні значущості = 0,05.
Таблиця 8.2
Кількість спостережень n | Кількість пояснюючих змінних | |||||
р=1 | р=2 | р=3 | ||||
1,08 1,10 1,13 1,16 1,18 1,20 1,29 1,35 1,40 1,44 1,48 1,50 | 1,36 1,37 1,38 1,39 1,40 1,41 1,45 1,49 1,52 1,54 1,57 1,59 | 0,95 0,98 1,02 1,05 1,08 1,10 1,21 1,28 1,34 1,39 1,43 1,46 | 1,54 1,54 1,54 1,53 1,53 1,54 1,55 1,57 1,58 1,60 1,62 1,63 | 0,82 0,86 0,90 0,93 0,97 1,00 1,12 1,21 1,28 1,34 1,28 1,42 | 1,75 1,73 1,71 1,69 1,68 1,68 1,66 1,65 1,65 1,66 1,67 1,67 |
Недоліками критерію Дарбіна—Уотсона є наявність області невизначеності критерію, а також те, що критичні значення - статистики визначені для об'ємів вибірки не менше 15.
◄Приклад 8.4Виявити на рівні значущості 0,05 наявність автокореляції збурень для часового ряду по даним табл. 7.1.
Розв’язання. У прикладі 8.2 отримано рівняння тренда (од.). У табл. 8.3 наведений розрахунок сум необ-
хідних для обчислення - статистики.
Таблиця 8.3
t | ||||||
207,0 232,7 258,4 284,0 309,7 335,4 361,1 386,8 | 6,0 -61,7 32,6 25,0 7,3 26,6 -10,1 -25,8 | — 6,0 -61,7 32,6 25,0 7,3 26,6 -10,1 | — -370,2 -2011,4 815,0 182,5 194,2 -268,7 260,6 | 36,0 3806,9 1062,8 625,0 53,3 707,6 102,0 665,6 | ||
— | — | — | — | -1198,0 | 7059,2 |
Тепер за формулою (8.10) статистика 2(1+1198,0/7059,2)=2,34. За табл. 8.2 при р=1, n=15 критичні значення =1,08; =1,36, тобто фактично знайдене =2,34 знаходиться в межах від до 4- (1,36< <2,64). Критичні значення - статистики у табл. 8.2 відсутні, але можна допустити, що знайдене значення залишиться в інтервалі ( ;4- ), тобто для даного часового ряду попиту на рівні значущості 0,05 гіпотеза про відсутність автокореляції збурень не відкидається (приймається).►
У разі відсутності значущої автокореляції збурень методами регресійного аналізу може бути знайдена не тільки точкова, але й інтервальна оцінка рівнів ряду, тобто здійснені їх точковий та інтервальний прогнози.
◄Приклад 8.5За даними табл. 8.1 дати точкову і, з надійністю 0,95, інтервальну оцінки прогнозу середнього та індивідуального значень попиту на деякий товар на момент t = 9 (дев'ятий рік).
Розв’язання. В прикладі 8.2, отримано рівняння регресії
= 181,32+25,679 , тобто щорічно попит на товар збільшувався в середньому на 25,7 од. Треба оцінити умовне математичне очікування Оцінкою є групова середня
= 181,32+25,679 9=412,4 од.
Знайдемо оцінку (див. розділ 6) дисперсії (див. табл. 8.3):
Обчислимо оцінку дисперсії групової середньої (див. розділ 6):
;
(од.)
(тут ми використали дані, отримані у прикладі 8.2).
За табл. =2,45. Інтервальна оцінка (див. розділ 6) прогнозу се-
реднього значення попиту:
або (од.).
Для знаходження інтервальної оцінки прогнозу індивідуального значення обчислимо дисперсію його оцінки: ; (од.),
а потім — саму інтервальну оцінку для :
або (од.).
Отже, з надійністю 0,95 середнє значення попиту на товар
на дев'ятий рік знаходитиметься в межах від 346,9 до 477,9 (од.), а його індивідуальне значення — від 305,9 до 518,9 (од.). ►
Прогноз розвитку процесу, що вивчається, на основі екстраполяції часових рядів може виявитися ефективним, як правило, в рамках короткострокового, в крайньому випадку середньострокового періоду прогнозування.
Якщо в даній регресійній моделі автокореляція збурень існує, то необхідні заходи по її усуненню (або зниженню). З цією метою використовуються різні методи.
Метод послідовних різниць полягає, зокрема, в переході від рівнів ряду , до їх перших різниць і розгляду рівняння регресії , в якому коефіцієнт інтерпретується як середній приріст змінної при зміні приросту на одну одиницю. Метод ефективний, коли невипадкова складова тимчасового ряду представляє пряму лінію.
Іншим можливим методом зниження автокореляції є включення в модель регресії часу t в якості додаткової пояснюючою змінною:
. Метод виправданий, якщо він не приводить до мультиколінеарності (див. додаток 3).
◄Приклад 8.6За даними табл. 8.1, що відображає динаміку цін і
попиту деякого товару за восьмирічний період, з'ясувати на рівні значущості 0,05, чи впливає ціна на попит.
Розв’язання. Якщо абстрагуватися від того, що змінні і є часовими рядами, то в припущенні існування лінійної регресії можна отримати аналогічно прикладу 6.1 (розділ 6) рівняння регресії у вигляді: = 635,2 — 0,8843 . По F - критерию рівняння регресії значущо на рівні 0,05, оскільки обчислене значення статистики
Проте, такий висновок був би правомірний принаймні за відсутності автокореляції збурень часового ряду залежної змінної . Використання критерію Дарбіна — Уотсона показує наявність істотної автокореляції залишкового часового ряду . Таким чином, для обгрунтованої відповіді на питання завдання необхідно виключити автокореляцію збурень.
Перший спосіб. Перейдемо від рівнів ряду і до їх перших різниць . Значення змінних представимо в табл. 8.4.
Таблиця 8.4
-30 | -112 | -33 | |||||
-42 | -11 |
Рівняння регресії: . Перевірка рівняння по
F -критерию на рівні 0,05 показує що воно незначуще, оскільки
F = 3,96< = 6,61. Отже, немає підстав вважати, що ціна на даний товар має істотний вплив на попит.
Другий спосіб. Включимо в модель регресії час t в якості додаткової пояснюючої змінної. Методом найменших квадратів отримаємо рівняння = 380,4 - 0,4443 + 19,22t, причому коефіцієнт при змінній t виявився значущим по t-критерию ( = 3,82 > = 2,57), а при змінній — незначущим ( = 2,22 < = 2,57), Отже, підтверджується висновок про відсутність істотного впливу ціни на попит .►
Авторегресійна модель
Одним із поширених методів усунення автокореляції є використання авторегресійної моделі. Для даного часового ряду далеко не завжди вдається підібрати адекватну модель, для якої ряд збурень задовольнятиме основним передумовам регресійного аналізу, зокрема, не буде мати автокореляції.
У теперішній час набули поширення й інші регресійні моделі, в яких регресорами виступають лагові змінні, тобто змінні, вплив яких в регресійній моделі характеризується деяким запізненням. Ще одна відмінність: представлені в моделях пояснюючі змінні є величинами випадковими.
Авторегресійна модель р-го порядку має вигляд:
(8.11)
де —деякі константи.
Вона описує процес, що вивчається, в момент t в залежності від його значень в попередні моменти t — 1, t— 2..., t— р. Якщо досліджуваний процес в момент t визначається лише його значеннями в попередній період t — 1, то розглядають авторегресійну модель 1-го порядку (марківський випадковий процес):
(8.12)
◄Приклад 8.7В таблиці8.5 представлені дані, що відображають динаміку курсу акцій деякої компанії (грош. од.). Використовуючи авторегресійну модель 1-го порядку, дати точковий та інтервальний прогнози середнього та індивідуального значень курсу акцій в момент t= 23, тобто на глибину один інтервал.
Таблиця 8.5
t | |||||||||||
t | |||||||||||
Розв’язання. Спроба підібрати до даного часового ряду адекватну модель виявляється даремною. Відповідно до умови застосуємо авторегресійну модель вигляду (8.12). Отримаємо (аналогічно прикладу 8.2): Знайдене рівняння регресії значуще на 5%-вому рівні по F - критерию, оскільки фактично спостережене значення статистики F = 24,32 > = 4,35. Застосування критерію Дарбіна—Уотсона свідчить про незначущу автокореляцію збурень .
Обчислення, аналогічні прикладу 8.5, дають точковий прогноз по рівнянню : =284,0+0,7503 1213=1194,1 та інтервальний на рівні значущості 0,05 для середнього та індивідуального значень — 1046,6 1341,6; 879,1 1509,1. Отже, з надійністю 0,95 середнє значення курсу акцій компанії на момент t = 23 буде знаходитись в межах від 1046,6 до 1341,6 (грош. од.), а його індивідуальне значення — від 879,1 до 1509,1 (грош. од.).►
Ще одним важливим застосуванням методів регресійного аналізу є моделі фінансового ринку, дізнатися про які можна в додатку 4.
Контрольні питання
1. В чому полягає відмінність часового ряду від вибіркового?
2. Основні характеристики стаціонарних часових рядів.
3. Для оцінки яких параметрів застосовується кореляційний аналіз?
4. Застосування авторегресійних моделей.
Додаток 1