Побудова спряженої кореляційно-регресійної моделі
Зміст
1. Побудова аналітичного групування.
2. Побудова парної лінійної кореляційно-регресійної моделі.
3. Економетрична інтерпретація параметрів моделі.
4. Обчислення випадкових відхилень та їх інтерпретація.
5. Перевірка моделі на наявність автокореляції.
6. Визначення тісноти зв’язку між змінними.
7. Побудова спряженої кореляційно-регресійної моделі.
8. Геометрична інтерпретація спряжених моделей.
9. Обчислення тангенса кута між спряженими лініями регресії.
10. Перевірка формули декомпозиції загальної дисперсії результуючої змінної.
11. Обчислення стандартної похибки моделі.
12. Побудова довірчого інтервалу для оцінки фактичного значення результуючої змінної, його геометрична інтерпретація.
13. Розрахунок теоретичного та емпіричного значень відношення детермінації, їх економетрична інтерпретація. Обчислення кореляційного відношення.
14. Обчислення вибіркових похибок параметрів регресії. Побудова довірчих інтервалів для істинних значень параметрів регресії, їх геометрична інтерпретація.
15. Розрахунок вибіркової похибки моделі. Побудова довірчого інтервалу для середнього прогнозного значення результуючої змінної, його геометрична інтерпретація.
16. Обчислення похибки індивідуального прогнозу. Побудова довірчого інтервалу для індивідуального прогнозного значення результуючої змінної, його геометрична інтерпретація.
17. Оцінення коефіцієнта кореляції.
18. Перевірка статистичної значущості параметрів зв’язку між змінними.
19. Експрес-діагностика моделі.
20. Економічна інтерпретація результатів економетричного дослідження та їх використання.
Таблиця 1. Вибіркова сукупність даних про залежність величини валового регіонального продукту від величини роздрібного товарообороту
Регіон | Роздрібний товарооборот підприємств, млн. грн. | Валовий регіональний продукт у факт. цінах , млн. грн. |
Х | У | |
АР Крим | 18937,9 | |
Вінницька | 12485,9 | |
Волинська | ||
Дніпропетровська | 35464,9 | |
Донецька | 44289,8 | |
Житомирська | 9557,5 | |
Закарпатська | 9081,1 | |
Запорізька | 20570,9 | |
Івано-Франківська | 11190,7 | |
Київська | ||
Кіровоградська | 7511,6 | |
Луганська | 18013,7 | |
Львівська | 20171,9 | |
Миколаївська | 11158,7 | |
Одеська | 24292,3 | |
Полтавська | 12848,4 | |
Рівненська | 8326,7 | |
Сумська | 8757,7 | |
Тернопільська | 7283,9 | |
Харківська | 32862,3 | |
Херсонська | 9464,9 | |
Хмельницька | 10710,7 | |
Черкаська | 10149,4 | |
Чернівецька | 6787,5 | |
Чернігівська |
Факторна ознака (Х) - Роздрібний товарооборот підприємств, млн. грн. Результуюча ознака (У) - Валовий регіональний продукт у факт. цінах, грн.
1. Побудова аналітичного групування
Одним із найпростіших способів дослідження взаємозв’язку між результуючою змінною та факторними ознаками є аналітичне групування. Аналітичне групування – це статистична таблиця в якій вказані інтервали значень факторної ознаки, згідно з якими згруповані одиниці сукупності, а також наведені групові середні значення результуючої змінної.
Кількість груп можна визначити за допомогою формули Стерджеса:
k= 1+3,322 lg n,
Де k – кількість груп аналітичного групування, n – кількість одиниць сукупності.
Розмір інтервалу h при цьому розраховують за формулою:
h = ,
де R = - – розмах сукупності (вибірки), - максимальне значення факторної ознаки, – мінімальне значення факторної ознаки.
Результати аналітичного групування доцільно подавати графічно. Для цього по осі абсцис проставляють середні значення факторної ознаки для кожного інтервалу групування, а по осі ординат – групові середні значення результуючої змінною. Усі ці точки сполучають і отримують емпіричну лінію регресії.
Для нашого випадку = 44289,8, а = 6787,5. Відповідно до формули Стерджеса, дана вибірка буде мати 6 інтервалів. Обчислимо ширину інтервалу:
h = = 6250,38
Аналітичне групування дуже зручно зобразити у вигляді таблиці (Таблиця 1.1).
Таблиця 1.1. Аналітичне групування величини валового регіонального продукту за величиною роздрібного товарообороту
№ | Роздрібний товарооборот підприємств у факт. цінах, млн. грн.. | Кількість регіонів | Середнє значення роздрібного товарообороту підприємств у фактичних цінах, млн. грн. (x) | Середнє значення валового регіонального продукту у факт. цінах, млн. грн. (y) |
6787,5-13037,88 | 9912,69 | 12446,56 | ||
13037,88-19288,26 | 16163,07 | 17704,87 | ||
19288,26-25538,64 | 22413,45 | 21678,37 | ||
25538,64-31789,02 | ||||
31789,02-38039,4 | 34914,21 | 34163,60 | ||
38039,4-44289,8 | 41164,60 | 92093,00 | ||
Разом | ||||
У середньому | 24913,60 | 35617,28 |
Графічно дане аналітичне групування представлено на Рис. 1.1.
Рис. 1.1.Емпірична лінія регресії залежності валового регіонального продукту у фактичних цінах, млн. грн., від роздрібного товарообороту підприємств, млн. грн..
Аналітичне групування має ряд переваг і недоліків. Основною перевагою аналітичного групування є відносна простота виконання, а недоліком є те, що аналітичне групування дає надто загальний і розмитий результат, його не слід використовувати у випадках, коли потрібно отримати конкретні дані.
2. Побудова парної лінійної кореляційно-регресійної моделі
Будемо вважати, що кореляційна залежність результуючої змінної від факторної ознаки є лінійною і описується рівнянням регресії (узагальнена ПЛКРМ):
Де - коефіцієнт регресії,
- вільний член регресії.
- випадкова величина, яка містить різноманітні помилки спостереження та вимірювання тощо.
Оскільки ці параметри нам невідомі, то ми повинні здійснити їх оцінку. Щоб одержати оцінки параметрів на основі заданих статистичних даних необхідно побудувати рівняння регресії (вибіркову ПЛКРМ) :
- теоретичне, нормативне або прогнозне значення результуючої змінної.
Щоб одержати оцінки застосуємо метод найменших квадратів, знайшовши мінімум функції:
Після здійснення ряду перетворень і використання методу Крамера отримаємо формули для обчислення даних оцінок:
Для того, щоб обчислити дані оцінки необхідно здійснити ряд додаткових обчислень, які наведені в Таблиці 2.1.
Таблиця 2.1. Вхідні дані і допоміжні розрахунки для визначення параметрів залежності валового регіонального продукту у фактичних цінах від роздрібного товарообороту підприємств у фактичних цінах.
Регіон | Роздрібний товарооборот підприємств, млн. грн. | Валовий регіональний продукт у факт. цінах , млн. грн. | Розрахункові величини | ||
xi | yi | xi2 | xi yi | ||
АР Крим | 18937,9 | 358644056,4 | 395309724,6 | ||
Вінницька | 12485,9 | 155897698,8 | 192045627,9 | ||
Волинська | |||||
Дніпропетровська | 35464,9 | ||||
Донецька | 44289,8 | ||||
Житомирська | 9557,5 | 91345806,25 | 106346302,5 | ||
Закарпатська | 9081,1 | 82466377,21 | 95424198,8 | ||
Запорізька | 20570,9 | 423161926,8 | 682089902,2 | ||
Івано-Франківська | 11190,7 | 125231766,5 | 155729781,2 | ||
Київська | |||||
Кіровоградська | 7511,6 | 56424134,56 | 75033372,4 | ||
Луганська | 18013,7 | 324493387,7 | |||
Львівська | 20171,9 | 406905549,6 | 564550965,3 | ||
Миколаївська | 11158,7 | 124516585,7 | 164780522,9 | ||
Одеська | 24292,3 | 590115839,3 | 804463806,8 | ||
Полтавська | 12848,4 | 165081382,6 | |||
Рівненська | 8326,7 | 69333932,89 | |||
Сумська | 8757,7 | 76697309,29 | 108078775,7 | ||
Тернопільська | 7283,9 | 53055199,21 | 60281556,4 | ||
Харківська | 32862,3 | ||||
Херсонська | 9464,9 | 89584332,01 | 85505906,6 | ||
Хмельницька | 10710,7 | 114719094,5 | 132159327,3 |
Продовження Таблиці 2.1. Вхідні дані і допоміжні розрахунки для визначення параметрів залежності валового регіонального продукту у фактичних цінах від роздрібного товарообороту підприємств у фактичних цінах.
Черкаська | 10149,4 | 103010320,4 | 138600206,4 | |
Чернівецька | 6787,5 | 46070156,25 | ||
Чернігівська |
За методом найменших квадратів маємо:
= -7640,39;
= 2,01
Рівняння регресії має вигляд:
-7640,39 + 2,01х
Графік даного рівняння зображено на Рисунку 2.1.
Рис. 2.1. Пряма регресії, яка описує залежність валового регіонального продукту у фактичних цінах від роздрібного товарообороту підприємства у фактичних цінах.
3. Економетрична інтерпретація параметрів моделі
На основі аналізу коефіцієнта регресії = 2,01, можна зробити висновки:
· оскільки він відмінний від 0, то на підставі вибірки можна стверджувати, між валовим регіональним продуктом у фактичних цінах та роздрібним товарооборотом підприємства у фактичних цінах існує лінійна кореляційна залежність;
· оскільки значення додатне, то при збільшенні інвестицій в основний капітал на одну особу в фактичних цінах середнє значення валового регіонального продукту у фактичних цінах зростає;
· при збільшенні роздрібного товарообороту підприємства у фактичних цінах на 1 грн. обсяг валового регіонального продукту у фактичних цінах зросте на 2,01 грн.
Вільний член рівняння регресії =3454,71 показує , що при нульовому обсягу роздрібного товарообороту у фактичних цінах валовий регіональний продукт у фактичних цінах буде становити 3454,71 грн. Слід зауважити, що таке інтерпретування вільного члена є достатньо умовним.
4. Обчислення випадкових відхилень та їх інтерпретація
Отримавши парну лінійну кореляційно-регресійну модель (ПЛКРМ) можна обчислити відхилення , і= , емпіричних чи теоретичних значень результуючої змінної від відповідних нормативних .
………
.…
Ці відхилення називають випадковими відхиленнями моделі.
Враховуючи , парну лінійну кореляційно-регресійну модель можна зобразити як:
+ е
Випадкові відхилення еi дають змогу оцінити ефективність використання факторної ознаки та резерви зміни результуючої змінної.
Для того, щоб обчислити усі випадкові відхилення потрібно виконита обчисленн, наведені у Таблиці 4.1.
Таблиця 4.1. Вхідні і допоміжні розрахунки для визначення випадкових відхилення
Регіон | Роздрібний товарооборот підприємств, млн. грн. | Валовий регіональний продукт у факт. цінах (фактичні значення) грн. | Валовий регіональний продукт у факт. цінах (нормативні значення) грн. | Випадкові відхилення (грн.) |
xi | yi | ỹ | еi | |
АР Крим | 18937,9 | 30462,17 | -9588,17 | |
Вінницька | 12485,9 | 17480,91 | -2099,91 | |
Волинська | 10145,46 | -73,46 | ||
Дніпропетровська | 35464,9 | 63714,06 | 7458,94 | |
Донецька | 44289,8 | 81469,53 | 10623,47 | |
Житомирська | 9557,5 | 11589,05 | -462,05 | |
Закарпатська | 9081,1 | 10630,54 | -122,54 | |
Запорізька | 20570,9 | 33747,72 | -589,72 |
Продовження таблиця 4.1. Вхідні і допоміжні розрахунки для визначення випадкових відхилення
Івано-Франківська | 11190,7 | 14875,00 | -959,00 | |
Київська | 24879,14 | 1341,86 | ||
Кіровоградська | 7511,6 | 7472,75 | 2516,25 | |
Луганська | 18013,7 | 28602,70 | 3677,30 | |
Львівська | 20171,9 | 32944,94 | -4957,94 | |
Миколаївська | 11158,7 | 14810,62 | -43,62 | |
Одеська | 24292,3 | 41235,08 | -8119,08 | |
Полтавська | 12848,4 | 18210,25 | 10144,75 | |
Рівненська | 8326,7 | 9112,71 | 2067,29 | |
Сумська | 8757,7 | 9979,87 | 2361,13 | |
Тернопільська | 7283,9 | 7014,62 | 1261,38 | |
Харківська | 32862,3 | 58477,70 | -14609,70 | |
Херсонська | 9464,9 | 11402,74 | -2368,74 | |
Хмельницька | 10710,7 | 13909,26 | -1570,26 | |
Черкаська | 10149,4 | 12779,94 | 876,06 | |
Чернівецька | 6787,5 | 6015,88 | 656,12 | |
Чернігівська | 8952,36 | 2579,64 |
У даному випадку випадкові відхилення набувають як додатних так і від’ємних значень. Якщо випадкове відхилення набуває додатних значень, то це означає, що фактичне значення валового регіонального продукту на одну особу у фактичних цінах перевищує відповідне нормативне значення, а отже, можна стверджувати, що у цьому регіоні інвестиції в основні засоби використовуються ефективніше, ніж у середньому по Україні. В протилежному випадку – навпаки.
5. Перевірка моделі на наявність автокореляції
Одним з припущень класичного кореляційно-регресійного аналізу є припущення про незалежність випадкових величин .
Для перевірки моделі на наявність автокореляції використаємо коефіцієнт Дарбіна-Уотсона, який обчислимо за формулою:
Його ще називають d-статистика.
Автокореляція визначає зв'язок між значеннями результуючої змінної, які спостерігаються.
Якщо є близький до 0, то автокореляція існує і вона додатна; якщо є близьким до 4, то автокореляція існує і від'ємна; якщо ж =2, то автокореляція відсутня.
Для використання критерію потрібно здійснити обчислення (Таблиця 5.1.).
Таблиця 5.1. Додаткові обчислення для знаходження критерію Дарбіна-Уотсона
Регіон | еi | ei2 | (ei - ei-1)2 |
АР Крим | -9588,17 | 91932954,27 | |
Вінницька | -2099,91 | 4409631,90 | 56073963,75 |
Волинська | -73,46 | 5395,93 | 4106521,21 |
Дніпропетровська | 7458,94 | 55635806,09 | 56737025,29 |
Донецька | 10623,47 | 112858192,02 | 10014264,56 |
Житомирська | -462,05 | 213488,57 | 122888795,10 |
Закарпатська | -122,54 | 15017,01 | 115263,19 |
Запорізька | -589,72 | 347770,44 | 218254,10 |
Івано-Франківська | -959,00 | 919688,42 | 136370,10 |
Київська | 1341,86 | 1800584,85 | 5293968,70 |
Кіровоградська | 2516,25 | 6331508,99 | 1379192,49 |
Луганська | 3677,30 | 13522526,39 | 1348036,63 |
Львівська | -4957,94 | 24581199,75 | 74567402,45 |
Миколаївська | -43,62 | 1902,77 | 24150564,54 |
Одеська | -8119,08 | 65919460,11 | 65213042,83 |
Полтавська | 10144,75 | 102915894,46 | 333567381,81 |
Рівненська | 2067,29 | 4273684,37 | 65245327,76 |
Продовження таблиці 5.1. Додаткові обчислення для знаходження критерію Дарбіна-Уотсона
Сумська | 2361,13 | 5574927,42 | 86341,53 |
Тернопільська | 1261,38 | 1591067,97 | 1209456,64 |
Харківська | -14609,70 | 213443205,45 | 251890895,55 |
Херсонська | -2368,74 | 5610926,63 | 149841007,14 |
Хмельницька | -1570,26 | 2465705,29 | 637575,14 |
Черкаська | 876,06 | 767488,94 | 5984485,96 |
Чернівецька | 656,12 | 430492,45 | 48375,90 |
Чернігівська | 2579,64 | 6654560,32 | 3699945,41 |
Отже,
Після обчислення d-статистики задамо рівень значущості a=0,05 і за таблицями d-статистики Дарбіна-Уотсона при заданому рівні значущості, кількості факторів k (в нашому випадку k=1) та кількості спостережень n (n=25) знаходять критичні значення статистики .
· якщо емпіричне значення d-статистики попадає в інтервал ( ; 4 – ), то автокореляції відсутня;
· якщо емпіричне значення d-статистики потрапляє в інтервал (0 ; ), то це свідчить про наявність додатної автокореляції;
· якщо емпіричне значення d-статистики потрапляє в інтервал (4 – ; 4), то наявна від’ємна автокореляція;
· якщо емпіричне значення d-статистики потрапляє в інтервал [ ; ], [4 – ; 4 – ] то неможливо зробити висновок про наявність чи відсутність автокореляції.
В даному випадку коефіцієнт знаходитьсь в проміжку ( ; 4 – ), а саме (1,454<1,71<2,546). Тоді з довірчою імовірністю можна стверджувати, що у вибірковій сукупності автокореляція відсутня.
6. Визначення тісноти зв’язку між змінними
Для лінійної форми зв'язку між результуючою й факторною змінними найчастіше використовують коефіцієнт кореляції, який обчислюють за такою формулою:
.
Для обчислення коефіцієнта кореляції доцільною буде побудова Таблиці 6.1.
Таблиця 6.1. Додаткові обчислення для обчислення коефіцієнта кореляції
Регіон | xi | yi | xi2 | xi yi | yi2 |
АР Крим | 18937,9 | 358644056,4 | 395309724,6 | ||
Вінницька | 12485,9 | 155897698,8 | 192045627,9 | ||
Волинська | |||||
Дніпропетровська | 35464,9 | ||||
Донецька | 44289,8 | ||||
Житомирська | 9557,5 | 91345806,25 | 106346302,5 | ||
Закарпатська | 9081,1 | 82466377,21 | 95424198,8 | ||
Запорізька | 20570,9 | 423161926,8 | 682089902,2 | ||
Івано-Франківська | 11190,7 | 125231766,5 | 155729781,2 | ||
Київська | |||||
Кіровоградська | 7511,6 | 56424134,56 | 75033372,4 | ||
Луганська | 18013,7 | 324493387,7 | |||
Львівська | 20171,9 | 406905549,6 | 564550965,3 | ||
Миколаївська | 11158,7 | 124516585,7 | 164780522,9 | ||
Одеська | 24292,3 | 590115839,3 | 804463806,8 | ||
Полтавська | 12848,4 | 165081382,6 | |||
Рівненська | 8326,7 | 69333932,89 | |||
Сумська | 8757,7 | 76697309,29 | 108078775,7 | ||
Тернопільська | 7283,9 | 53055199,21 | 60281556,4 | ||
Харківська | 32862,3 | ||||
Херсонська | 9464,9 | 89584332,01 | 85505906,6 | ||
Хмельницька | 10710,7 | 114719094,5 | 132159327,3 | ||
Черкаська | 10149,4 | 103010320,4 | 138600206,4 | ||
Чернівецька | 6787,5 | 46070156,25 | |||
Чернігівська |
- Зв’язок між змінними дуже слабкий
- Зв’язок між змінними слабкий
- Зв’язок між змінними помірний
- Зв’язок між змінними тісний
- Зв’язок між змінними функціональний.
В даному випадку = 0,96, це означає, що коефіцієнт кореляції попадає в проміжок , отже, зв’язок між змінними Х та У функціональний. Можна вважати, що 96% зміни валового регіонального продукту у фактичних цінах пояснюється зміною роздрібного товарообороту підприємствау фактичних цінах.
Побудова спряженої кореляційно-регресійної моделі
Якщо за факторну ознаку взяти валовий регіональний продукт у розрахунку на одну особу у фактичних цінах, а за результуючу – інвестиції в основний капітал на одну особу у фактичних ціних, то можна побудувати рівняння прямої регресії x на y:
,
яке називають спряженим до рівняння регресії y на x.
Параметри і можна знайти декількома способами
· аналогічно параметрам та :
· за допомогою формули:
З цієї формули випливає, що:
Модуль розкриваємо зі знаком коефіцієнта регресії.
визначаємо з формули:
За обома способами отримуємо:
=1,261
=-13924,17
Спряжену кореляційно-регресійну модель можна зобразити так:
=-13924,17+1,261y
Коефіцієнт кореляції між кількістю сільського населення та загальною кількістю населення становить: