Лінійна економетрична модель з трьома змінними. МНК для моделі з трьома змінними
У випадку, якщо факторів є 2, то система нормальних рівнянь міститиме 3 рівняння, бо оціночне рівняння матиме вигляд:
Y=a0+a1x1+a2x2
Щоб знайти параметри а0, а1, а2 СНР матиме вигляд:
Поділивши на n отримаємо:
Щоб знайти відповідні параметри слід знайти відповідні суми або середні.
Найпростіший метод знаходження невідомих – метод Крамера:
20. Коефіцієнти парної, частинної та множинної кореляції
Коефіцієнти парної кореляції:
Показують щільність лінійного зв’язку між парами змінних у випадку, коли інший фактор сталий. | ryx= |
Коефіцієнт множинної кореляції, як і парної, знаходяться в межах (-1;1) | |
rxkxl= | |
Коефіцієнти частинної кореляції: показують, яку частину дисперсії у, яку не пояснив фактор х1 може пояснити додатково введений фактор х2
Ryx2.x1=
20. Коефіцієнти парної, частинної та множинної кореляції
Для вимірювання сили лінійних зв’язків різних пар змінних використовується коефіцієнт парної кореляції. Причому для будь-яких двох факторів x і та x j коефіцієнт кореляції лежить в межах:
Якщо то випадкові величини x і x j зв’язані додатною кореляцією (при зростанні однієї друга теж зростає); якщо то випадкові величини x і x j зв’язані від’ємною кореляцією (при зростанні однієї друга спадає). Коефіцієнт парної кореляції між змінними можна визначити за формулою
Крім коефіцієнтів парної кореляції вводяться коефіцієнти частинної кореляції. Частинною кореляцією між факторами x і Х j називається кореляційна залежність між цими факторами при фіксованих значеннях інших факторів [2].
. В економетричній моделі з 2-ма змінними (однофакторній) ми дали поняття коефіцієнта кореляції r і коефіцієнта детермінації d . У випадку економетричної моделі з кількістю змінних більшою ніж 2, вводиться поняття коефіцієнта множинної кореляції R. Він визначається як коефіцієнт кореляції між y та yˆ по формулі:
21.Постановка задачі в матричній формі та основні припущення МНК для загального випадку. МНК в матричній формі.
Лінійну багатофакторну економетричну модель зручно розглядати за допомогою теорії матриць. Для цього запишемо модель (3.1) для кожного окремого спостереження:
1. Лінійну багатофакторну економетричну модель зручно розглядати за допомогою теорії матриць. Для цього запишемо модель (3.1) для кожного окремого спостереження:
(3.11)
де - і-е значення залежної змінної; - і-е значення ] -ої незалежної
змінної; - невідомі детерміновані параметри; - і-е значення
випадкової змінної. Можна (3.11) подати у вигляді системи:
(3.12)
матриця спостережень за т змінними х1, х2.
У матричному вигляді основні припущення лінійної багатофакторної економетричної моделі матимуть вигляд:
Оскільки для випадкової величини властива гомоскедастичність та відсутній зв’язок між випадковими величинами, то:
'а 2 | ... 0 | '1 | 0. | . 0" | |||
М (ии') = | а2 | ... 0 | = а 2 | 1. | . 0 | ||
_ 0 | ... а2 _ | 0. | . 1_ |
: а 2Е, (3.15) |
де Е - одинична матриця розміру п х п.
2. Для того щоб знайти оцінки параметрів р запишемо економетричну модель у матричному вигляді, використавши попередні позначення і наступні:
параметрів; e = |
Лінійна багатофакторна економетрична модель має вигляд:
Вектор оцінок параметрів знайдемо методом найменших квадратів, мінімізуючи суму квадратів залишків: |
e(ß) = Еef = е’е = (Y - *ß)'(Y - Xß) = Y Y - 2ß'X Y + ß'XXß ® min, (3.17)
i = 1
де символ штрих (') означає операцію транспонування.
Зауваження. При перетворенні (3.17) враховані властивості транспонованих матриць: (Xß)' = ß 'X'; ß 'X Y = Y Xß.
Знайдемо частинну похідну виразу (3.17) за компонентами вектора ß і прирівняємо її до нуля: |
öe(ß) |
Звідси отримуємо систему рівнянь в матричній формі: |
X Xß = X Y |
/V /V /V /V /V /-Ч М (3 т - 3 т )(3 0 -3с) М (3 т -3 т )(31 - в) ■ М (3 т -3т )2 _ |
(3.18) є системою нормальних рівнянь МНК для знаходження оцінок (3 0, 3і3т в матричній формі. Якщо визначник матриці X'X не дорівнює нулю (д^(ХX) Ф 0), то існує обернена матриця (XX)-1 і розв’язок системи (3.18) буде вектор-стовпець в = (X X)-1X У (3.19) Рівняння (3.19) є фундаментальним результатом для визначення невідомих параметрів у матричному вигляді. 22. Дисперсійно-коваріаційна матриця . Матриця кореляції. В економетричній моделі У = XP + и вектор и і залежний від нього вектор У є випадкові змінні. Оскільки в ми визначаємо з виразу в = (XX)-1X'У в який входить У, то в також можна вважати випадковою функцією оцінювання параметрів моделі. Тому для характеристики в необхідно знати не тільки математичне сподівання, а й дисперсію, коваріацію. У матричній формі легко знайти дисперсії параметрів 30, 3ь- -, 3т та встановити коваріації між двома попарними їхніми значеннями, тобто між 3і та З j при і Ф у . Ці значення утворюють дисперсійно-коваріаційну матрицю М[(в - в) • (в - Р)'] = /V /-Ч /V /V /V /V М (30 - 30) М (30 - 30)(31 -31) ■■■ М (30 — 30)(3т — 3т ) /V /V /V г\ /V /V = М(31 - 31)(30 - 30) М(31 - 31) ■■■ М(31 - 31 )(3т - 3т ) = |
або в матричному вигляді: |
6 2 = — : (3.21) п - т -1 |
На головній діагоналі цієї матриці знаходяться дисперсії оцінок, а поза діагоналлю - коваріації оцінок. Позначається дисперсійно-коваріаційна матриця уаг(Р) і визначається за формулою: уагф) = с „2( X X)-1 (3.20) де с2 - оцінена дисперсія випадкової величини, яка визначається за формулою: П Те.2 |
62 = УТ^СУ = . (3.21') п - т -1 п - т -1 |
23.Перевірка адекватності прийнятої економетричної моделі реальній дійсності проводиться аналогічно лінійній моделі з однією пояснюючою змінною. Для цього користуються найчастіше критерієм Фішера (^—критерієм). Нульова гіпотеза має вигляд:
Н 0 : Р 0 = Ь1 = — = Р т = °.
Альтернативна гіпотеза наступна:
Н1 : не всі Р у (] = 0, т) дорівнюють нулю.
Якщо нульова гіпотеза відхиляється і приймається альтернативна гіпотеза, то це означає, що включені до моделі фактори пояснюють змінну у. Величина ^—відношення для багатофакторної моделі з т та п — т — 1
ступенями вільності наступна:
де т - кількість факторів, що ввійшли в модель, п - кількість спостережень у вибірці. |
Р =------------ т----------- =---------------------- і=1-------------- , (3.26) пп Е( у і- р);)2 тЕ(Уі- у;)2 і=1____________________ і = 1 п - т -1 |
Або якщо відоме значення коефіцієнта детермінації то Р-відношення таке: р = (п - т - 1>д2 (3.26') т(1 - Я2) Після обчислення ^-відношення Фішера знаходимо Екр(т;п - т -1;у), яке є критичним значенням Р при заданому рівні значущості у (або у-100%) та відповідно т і п - т -1 ступенях вільності. Якщо Р > Ркр, то ми відкидаємо Н0 з ризиком помилитися не більше ніж в у % випадків, і приймаємо, що побудоване рівняння економетричної моделі адекватне реальній дійсності. В протилежному випадку Р < Ркр - Н0 приймаємо і вважаємо, що побудована модель неадекватна. Тоді необхідно, можливо, будувати нелінійну модель або ввести додаткові фактори. |
24. Для розгляду значущості оцінок параметрів розглядаються нульові гіпотези: |
Альтернативна - Н1 : Ь j Ф 0, тобто пояснююча змінна Xj впливає суттєво
на У .
Емпіричне значення відношення tj для перевірки нульової гіпотези стосовно параметрів Ьj знаходиться за формулою:
де - стандартна похибка оцінки о з матриці
var(ß ), яку знаходимо по формулі (3.20).
Емпіричне значення оцінки порівнюють з критичним, знайденим за таблицями Стьюдента, для заданого рівня значущості ступенів
вільності. Якщо го гіпотеза про рівність нулю параметра в
генеральній сукупності не відхиляється, оцінка є статистично незначущою;
то із заданим рівнем значущості гіпотезу слід відхилити і
відповідну оцінку вважають статистично значущою.
Побудова довірчих інтервалів для параметрів проходить аналогічно
довірчим інтервалам параметрів рівняння економетричної моделі з двома змінними. Спочатку знаходимо граничні похибки оцінок за формулою
де - імовірнісний коефіцієнт, який знаходиться за таблицями Стьюдента при рівні значущості і ступенях вільност
Довірчий інтервал, в межах якого при заданому рівні значущості або надійності міститься невідомий параметр генеральної сукупності: |
25. Перевірка нульової гіпотези стосовно коефіцієнта множинної кореляції.
Так як коефіцієнт множинної кореляції R є вибірковою характеристикою, то при перевірці якості побудованої моделі проводять оцінку його значущості. За результатами вибірки обчислюється статистика:
tрозр =
Яка має розподіл Стьюдента. Для заданого рівня значущості y(гама) і k=n-m-1 cтупенів вільності знаходимо табличне значення tрозр порівняно з tкр . Прийняття чи відхилення гіпотези про значущість коефіцієнта множинної кореляції проводиться аналогічно як для економетричної моделі з двома невідомими. Якщо І t розрІ> tкр то із заданим рівнянням значущості ᵞ(гама) гіпотеза Но слід відхилити ,прийняти альтернативну гіпотезу Н1 про існування залежності між залежною і незалежними змінними.
Значущість коефіцієнта множинної кореляції можна оцінювати на основі проведення процедури перевірки значущості коефіцієнта детермінації, оскільки вони зв’язані між собою: R=√R2
26. Покроковий метод побудови економетричних моделей.
27. Мультиколінеарність і її наслідки.
Між факторами часто присутнє явище мультиколінеарності.
Припустимо, що є лінійна залежність між факторами x1 та x2 . В такому разі
неможливо точно визначити окремий вплив кожного з факторів на залежну
змінну y . Графічно цю ситуацію подамо у вигляді кругової діаграми. б)
a)
a) відсутня залежність (колінеарність);
б) наявна колінеарність.
Підмножина 1 описує окремий вплив фактора x1.
Підмножина 2 описує окремий вплив фактора x2 .
Підмножина 3 - спільний вплив обох факторів на змінну y , який не
можна відокремити. Графічно описує ситуацію колінеарності. Термін
«мультиколінеарність» означає, що в багатофакторній регресійній моделі дві
або більше незалежних змінних, факторів пов’язані між собою лінійною
залежністю або, іншими словами, мають високий ступінь кореляції.
Наприклад, мультиколінеарність може бути проблемою, коли ми
вивчаємо залежність між ціною акції, дивідендами на акцію та заробленим
прибутком на акцію, оскільки дивіденди та зароблений прибуток на одну акцію мають високий ступінь кореляції і майже неможливо оцінити окремий вплив кожного з них. Якщо між xi і x j існує лінійна залежність xi = ax j - то між xi і x j існує строга мультиколінеарність. Якщо лінійна залежність xi = ax j + L , де L –відхилення то нестрога мультиколінеарність.
28. Дослідження мультиколінеарності.
При строгій мультиколінеарності неможливо отримати оцінки параметрів МНК. Якщо мультиколінеарність нестрога, то оцінки параметрів мало надійні. Існує багато методів дослідження мультиколінеарності. Основна частина цих методів полягає в дослідженні матриці кореляції. В економетричних задачах для дослідження наявності мультиколінеарності широко застосовується метод Фаррара-Глобера . Приведемо алгоритм цього методу. Для дослідження загальної мультиколінеарності і мультиколінеарності між окремими факторами використовується кореляційна матриця [R] і обернена до неї матриця [Z]. Для дослідження загальної мультиколінеарності використовується χ² (χi квадрат) Для цього знаходиться визначник кореляційної матриці [R] і знаходиться розрахункове значення:
χp²=[n-1-1\6(2m+5)]Indet[R] де n - об’єм вибірки, m - число незалежних змінних.
За даною довірчою ймовірністю р і числом ступенів вільності K=1\2m(m-1) знаходиться табличне значення χ²кр.
Порівнюється розрахункове χp² та і табличне значення χ²кр.. Якщо, χp² ≤ χ²кр.. то з заданою надійністю можна вважати, що загальна мультиколінеарність відсутня і на цьому закінчуєтьсядослідження мультиколінеарності. Якщо, χp² ≥ χ²кр. то з прийнятою надійністюможна вважати, що між факторами існує мультиколінеарність.
Для з’ясування питання між якими факторами існує мультиколінеарність
використовуєтся F- або t-статистика. Для знаходження t-статистики між двома
факторами спочатку знаходиться матриця обернена до кореляційної матриці
[Z ]= [R-1 ]
Після чого знаходяться частинні коефіцієнти кореляції:
r 2ij.12…k =
Де zij, zii, zjj - елементи матриці [Z]. Для цих частинних коефіцієнтів
знаходиться t-статистики.
Для заданої довірчої ймовірності р і ступенів вільності K = n - m -1
знаходиться критичне значення критерію Стьюдента tкр. Якщо tij>tкр то з
надійністю р можна стверджувати, що між факторами xi і x j існує мультиколінеарність.
29. Способи усунення мультиколінеарності.
Для усунення мультиколінеарності існує декілька способів:
1) якщо між двома факторами xi і x j існує мультиколінеарність, то один із факторів виключається з розгляду;
2) полягає в заміні фактора x*j = xi - x j . Після цього перевіряється наявність мультиколінеарності між факторами i x і * j x . При наявності мультиколінеарності переходять до 1-го способу. При відсутності мультиколінеарності замість фактора j x розглядається фактор *j x . Слід
відмітити що 1-й спосіб може призвести до помилки специфікації. Так, якщо
за економічною теорією для пояснення розширення споживання модель повинна включати і доход і багатство тоді вилучення змінної багатства створюватиме помилку специфікації;
3) оскільки мультиколінеарність змінюється у кожній вибірці то
можливо, що в іншій вибірці з такими змінними мультиколінеарність буде
іншою. Іноді просте збільшення спостережень у моделі (якщо це можливо)
пом’якшує проблему мультиколінеарності.
30. Поняття гомо- і гетероскедастичності.
Для оцінки параметрів моделі МНК повинно виконуватися 6 умов Гаусса-
Маркова. Однією із умов є припущення про сталість дисперсії кожної
випадкової величини ui . Таке явище називається гомоскедастичністю і є
другою умовою Гаусса-Маркова. Математично його можна записати наступним чином: M(ui2 )= su2 = const . (1)
Отже, якщо дисперсія залишків стала для кожного спостереження, тобто
має місце (1), то дана властивість називається гомоскедастичністю.
У прикладних дослідженнях бувають випадки порушення умови
гомоскедастичності, тобто умова (1) не виконується в якомусь конкретному
випадку: M(u ) const i = sui ¹ 2 2 або M(uu ) S ¢ = su × 2 , (2)
де S - деяка матриця.
Така ситуація породжує проблему гетероскедастичності. У даному
випадку отримані оцінки параметрів регресії за методом найменших квадратів будуть неефективними, хоча і незміщеними та обґрунтованими.
Отже, якщо дисперсія залишків змінюється для кожного спостереження
або групи спостережень, тобто має місце (2), то таке явище називається
гетероскедастичністю.
Суть припущення гомоскедастичності полягає в тому, що
варіація кожної випадкової величини ui навколо її математичного сподівання
не залежить від її пояснювальної змінної, то у випадку порушення цієї
властивості можуть виникнути наступні випадки при збільшенні значень x :
1) дисперсія залишків зростає
2) дисперсія залишків спадає
3) дисперсія залишків починає спадати, але з деякого значення x вона
починає зростати
Появу проблеми гетероскедастичності можна передбачити на
початковому етапі дослідження, поклавши в основу знання про характер даних.
Припущення про гомоскедастичність справджується в тих випадках, коли
об’єкти дослідження достатньо однорідні. Наприклад, при дослідженні
надходжень до бюджету від однопрофільних підприємств. Якщо
досліджуються неоднорідні об’єкти, то в такому випадку, як правило, виникає проблема гетероскедастичності. Наприклад, при вивченні залежності прибутку підприємства від розміру основних виробничих фондів, зрозуміло, що для великих підприємств коливання прибутку буде більшим, чим для малих. Отже, гетероскедастичність стає проблемою, коли значення змінних у моделі значно відрізняється в різних спостереженнях. Тому дана проблема може бути усунена, якщо позбутися розкиду даних.
Якщо припущення відносно гомоскедастичності порушується, то раніше
отримані співвідношення обчислення дисперсії параметрів моделі для оцінки
їх значущості та побудови інтервалів довіри використовувати неможливо,
оскільки в деякому випадку вони не збігаються з такими самими оцінками при обчисленні їх за умови, що гетероскедастичність відсутня. Це пов’язано з тим, що дисперсія залишків у першому випадку буде змінним значенням і в той же час вона є складовою при знаходженні дисперсій параметрів моделі.
31. Методи виявлення гетероскедастичності. (Декілька питань по різних тестах)
Перевірити модель на наявність гетероскедастичності можна з допомогою графічних та аналітичних методів. Серед аналітичних методів найбільш поширеними є такі тести:
- рангової кореляції Спірмена;
- Гольтфельда-Кванта;
- Глейзера;
- Уайта.
Тест рангової кореляції Спірмена передбачає найбільш загальні припущення про залежність дисперсій помилок регресії від значень незалежної змінної:
, . (3.10)
При цьому ніяких додаткових припущень відносно виду функцій не робиться. Відмітимо також, що відсутнє обмеження стосовно закону розподілу помилок.
Ідея тесту полягає в тому, що абсолютні величини залишків регресії розглядаються як оцінки , тому при наявності гетероскедастичності і значення будуть корелювати. Проте кореляція в цьому випадку передбачається ранговою.
Рангова кореляція досліджується тоді, коли необхідно встановити силу зв’язку між ординальними (порядковими) змінними. Прикладами ординальних змінних є житлові умови, тестові бали, екзаменаційні оцінки. Джерелом ординальних змінних можуть бути і кількісні змінні, для яких здійснюється процес ранжування. Наприклад, кожну з двох множин чисел , можна ранжувати в порядку зростання. В результаті -тий об’єкт характеризується двома рангами та по змінних та . Тоді коефіцієнт рангової кореляції Спірмена знаходиться за формулою
. (3.11)
Якщо ранги всіх об’єктів рівні між собою, тобто , то . Цей випадок називається повним прямим зв’язком. При повному оберненому зв’язку, коли ранги об’єктів по обох змінних розташовані в оберненому порядку, можна довести, що . У решті випадків .
При перевірці значущості виходять із того, що у випадку правильності нульової гіпотези (про відсутність кореляційного зв’язку між змінними) при статистика
(3.12)
має -розподіл Ст’юдента із ступенями вільності. Тому значущий на рівні , якщо
. (3.13
Тест Голдфелда-Квандта використовується у тому випадку, коли помилки регресії можна вважати нормально розподіленими випадковими величинами. При цьому спостережень має бути хоча б удвічі більше, ніж число оцінюваних параметрів. Як правило, тест застосовується до великих вибірок.
Припустимо, що середні квадратичні відхилення збурень пропорційні значенням пояснюючої змінної . Це означає постійність відносного, а не абсолютного, як у класичній моделі, розкладу збурень регресійної моделі.
Впорядкуємо спостережень в порядку зростання значень і виберемо перших і останніх спостережень (число визначимо пізніше). Тоді гіпотеза про гомоскедастичність буде рівносильна тому, що значення та є вибірковими спостереженнями нормально розподілених випадкових величин, які мають однакові дисперсії.
Зауваження. Для знаходження для двох груп ( та ) необхідно попередньо знайти два емпіричні рівняння для кожної з груп.
Гіпотеза про рівність дисперсій двох нормально розподілених сукупностей, як відомо [4], перевіряється з допомогою критерія Фішера-Снедокора. Нульова гіпотеза про рівність дисперсій двох сукупностей по спостережень (тобто гіпотеза про відсутність гетероскедастичності) відкидається на рівні , якщо
. (3.14)
Відмітимо, що чисельник і знаменник в (3.14) слід було розділити на відповідне число ступенів вільності, проте в даному випадку ці числа однакові і рівні .
Виявляється, що коли вибрати порядку , тоді потужність тесту, тобто імовірність відкинути гіпотезу про відсутність гетероскедастичності, коли насправді гетероскедастичності немає, буде максимальною.
Тест рангової кореляції Спірмена і тест Голдфелда-Квандта дозволяють лише виявити наявність гетероскедастичності, але вони не дають можливості з’ясувати кількісний характер залежності дисперсій помилок регресії від значень незалежної змінної, і, отже, не дають методів усунення гетероскедастичності.
Для досягнення цієї мети необхідні деякі додаткові припущення стосовно характеру гетероскедастичності. Справді, без цих припущень, очевидно, неможливо було б оцінити дисперсій помилок регресії ( ) з допомогою спостережень.
Найбільш простий і часто використовуваний тест на гетероскедастичність – тест Уайта. При його використанні припускається, що дисперсії помилок регресії є однією і тією ж функцією від спостережених значень незалежної змінної, тобто рівняння (3.10) набирають такого виду:
, . (3.15)
Найчастіше функція обирається квадратичною:
, (3.16)
що відповідає тому, що залежить від приблизно лінійно. У випадку гомоскедастичності , тобто вибіркові коефіцієнти регресії , , які є оцінками невідомих чисел , відповідно, незначуще відрізняються від нуля.
Ідея тесту Уайта полягає в оцінці функції з (3.15) за допомогою відповідного рівняння регресії для квадратів залишків:
, , (3.17)
де випадкова величина (за аналогією з із рівняння (2.3)).
Відмітимо, що ліві частини рівнянь (3.15) та (3.17) співпадають, оскільки (див. 2.21)).
Гіпотеза про відсутність гетероскедастичності (умова ) приймається у випадку незначущості регресії (3.17) в цілому (тобто одночасної незначущості теоретичних коефіцієнтів регресії та ).
Якщо обрати функцію у вигляді (3.16), тоді знаходити «вручну» оцінки , , , а також їх середні квадратичні відхилення – достатньо працемісткий процес. Оптимальний шлях – використання персонального комп’ютера із відповідним програмним забезпеченням.
Тест Глейзера аналогічний тесту Уайта, тільки в якості залежної змінної для вивчення гетероскедастичності вибирається не квадрат залишків, а їх абсолютна величина, тобто розглядається регресія
, . (3.18)
В якості функції зазвичай обирається функція виду
, (3.19)
Регресія (3.18) вивчається при різних значеннях , а потім вибирається те конкретне значення, при якому коефіцієнт виявляється найбільш значущим, тобто має найбільше значення -статистики. При цьому в якості значень беруться числа: 1, 2, 3, 1/2, 1/3 тощо. Якщо ж незначущий для всіх розглянутих значень (випадок ), тоді робиться висновок про відсутність гетероскедастичності.
32. Узагальнений МНК.
Система рівнянь для оцінки параметрів моделі на основі методу Ейткена запишеться так: або ‑ вектор оцінок параметрів економ-ої моделі; ‑ матриця не залеж змінних; ‑ матриця, транспон-а до матриці X; ‑ матриця, обернена до матриці кореляції залишків; ‑ матриця, обернена до матриці V, де , а - залишкова дисперсія; Y ‑ вектор залеж змінних. Звідси або Отже, щоб оцінити параметри моделі на основі методу Ейткена, треба сформ-и матрицю S або V. Матриця S має вигляд:
Параметрρ наближено можна визначити на основі залишків вибіркової моделі, оціненої за звичайним 1МНК.
33. Природа автокореляції та її вплив в економетричних моделях.
Одним з основних припущень класичного лінійного регресійного аналізу є припущення про відсутність взаємозв’язку між значеннями стохастичної складової моделі εу різних спостереженнях, тобто припущення
. ( 1 )
Якщо це припущення порушується виникає явище, яке носить назву автокореляції залишків.
aОзначення 1. Автокореляцією залишків називається залежність між послідовними значеннями стохастичної складової моделі .
У випадку автокореляції залишків маємо :
, ( 2 )
і ,як у випадку гетероскедастичності, формально можна записати :
, ( 3 )
де - деяка невідома константа, S – відома квадратна, додатньо визначена матриця розмірністю n×n.
У загальному випадку залежність між значеннями стохастичної складової ε у різних спостереженнях для випадку автокореляції можна подати наступним чином :
, ( 4 )
де : ρ1, ρ2, ... ,ρs – коефіцієнти автокореляції 1,2 і s-го порядку відповідно ; ui – випадкова величина, яка відповідає усім припущенням класичного лінійного регресійного аналізу – тобто вона розподілена за нормальним законом із сталою дисперсією і має нульове математичне сподівання.
Найпростішим і найбільш поширеним випадком автокореляції залишків є випадок ,коли залежність між послідовними значеннями стохастичної складової описується так званою авторегресійною схемою першого порядку – AR(1) яка має наступний вигляд :
. ( 5 )
Якщо ρ додатне ( ρ>0 ), то автокореляція залишків є позитивною, якщо ρ від’ємне ( ρ<0 ), то автокореляція залишків є негативною. При ρ=0 автокореляція залишків відсутня.
Автокореляція залишків найчастіше спостерігається у наступних двох випадках :
1) коли економетрична модель будується на основі часових рядів (у цьому випадку, якщо існує кореляція між послідовними значеннями деякої незалежної змінної, то буде спостерігатися і кореляція між послідовними значеннями стохастичними складової ε, особливо ,якщо використовуються лагові змінні ) ;
2) коли допущена помилка специфікації економетричної моделі – до моделі не включена істотна пояснююча змінна.
Негативними наслідками автокориляції буде :
1) завищені значення дисперсії параметрів моделі ;
2) помилки при використанні t – тестів і F – тестів ;
3) неефективність прогнозів, тобто отримання прогнозів з дуже великою дисперсією.