Кореляційний та регресійний аналіз

ОСНОВНІ ПОЛОЖЕННЯ КОРЕЛЯЦІЙНОГО АНАЛІЗУ.

КОЕФІЦІЄНТ КОРЕЛЯЦІЇ

Поняття кореляції та регресії з’явилися в середині ХІХ ст. завдяки роботам англійських статистиків Ф. Гальтона і К. Пірсона.

В економічній та інших сферах між змінними величинами існує залежність, коли кожному значенню однієї змінної відповідає множина можливих значень іншої змінної, тобто кожній змінній відповідає умовний розподіл другої змінної. Така залежність отримала назву статистичної або стохастичної. Прикладами статистичного зв’язку є залежність врожайності від кількості внесених добрив, продуктивність праці від енергоозброєння працівників і т.ін.

Означення 6.1. Статистична залежність між двома змінними, при якій кожному значенню однієї змінної відповідає певне умовне математичне сподівання іншої, називається кореляційною(від латинського «correlatio» - співвідношення, взаємозв’язок).

Кореляційна залежність має вигляд:

кореляційний та регресійний аналіз - student2.ru (6.1)

або кореляційний та регресійний аналіз - student2.ru , (6.2)

де кореляційний та регресійний аналіз - student2.ru . Ці рівняння називаються модельними рівняннями регресії (від лат. «regressio»- рух у зворотньому напрямку) або просто рівняннями регресії відповідно Y по X та X по Y; функції кореляційний та регресійний аналіз - student2.ru - модельними функціями регресії, а їх графіки – лініями регресії.

Для відшукання модельних рівнянь регресії необхідно знати закон розподілу двовимірної випадкової величини (X, Y), що не завжди можливо. На практиці дослідник має лише вибірку пар значень ( кореляційний та регресійний аналіз - student2.ru ). В цьому випадку досліджують найкращу оцінку – вибіркову лінію регресії Y по X:

кореляційний та регресійний аналіз - student2.ru , (6.3)

де кореляційний та регресійний аналіз - student2.ru - умовне середнє змінної Y при фіксованому значенню змінної X=х; кореляційний та регресійний аналіз - student2.ru - параметри кривої.

Аналогічно визначається вибіркова лінія регресії X по Y:

кореляційний та регресійний аналіз - student2.ru , (6.4)

де кореляційний та регресійний аналіз - student2.ru - умовне середнє змінної X при фіксованому значенню змінної Y =у; кореляційний та регресійний аналіз - student2.ru - параметри кривої. Рівняння (6.3) і (6.4) називають вибірковими рівняннями регресії відповідно Y по X та X по Y. При вдало визначених функціях кореляційний та регресійний аналіз - student2.ru і кореляційний та регресійний аналіз - student2.ru із збільшенням об’єму вибірки ( кореляційний та регресійний аналіз - student2.ru ) вони будуть збігатися за ймовірністю до функцій кореляційний та регресійний аналіз - student2.ru .

Статистичні зв’язки можна вивчати методами кореляційного і регресійного аналізу.

Основною задачею регресійного аналізу є встановлення форми і вивчення залежності між змінними.

Основною задачею кореляційного аналізу є виявлення зв’язку між випадковими змінними і оцінка його тісноти .

Лінійна парна регресія

Дані про статистичну залежність зручно задавати у вигляді кореля-ційної таблиці. Розглянемо, як приклад, таблицю залежності між добовим виробітком продукції Y (т) і величиною основних виробничих фондів (ОВФ) Х (млн.грн) для сукупності однотипних виробництв (табл.6.1).

Таблиця 6.1

Величина ОВФ млн.грн (Х) Середини інтервалів Добовий виробіток продукції, т (Y) Всього кореляційний та регресійний аналіз - student2.ru Групове середнє, т,( кореляційний та регресійний аналіз - student2.ru )
7-11 11-15 15-19 19-23 23-27
кореляційний та регресійний аналіз - student2.ru \ кореляційний та регресійний аналіз - student2.ru
20-25 22,5 - - - 10,3
25-30 27,5 - - 13,3
30-35 32,5 - - 17,8
35-40 37,5 - 20,3
40-45 42,5 - - - 23,0
Всього ni -
Групове середнє млн.грн, кореляційний та регресійний аналіз - student2.ru 25,5 29,3 37,9 35,4 39,2 - -

Зобразимо отриману залежність графічно точками координатної площини. Таке зображення статистичної залежності називається полем кореляції. Для кожного значення кореляційний та регресійний аналіз - student2.ru , тобто для кожного рядка кореля-ційної таблиці обчислимо групові середні

кореляційний та регресійний аналіз - student2.ru , (6.5)

де кореляційний та регресійний аналіз - student2.ru - частоти пар кореляційний та регресійний аналіз - student2.ru і кореляційний та регресійний аналіз - student2.ru ; кореляційний та регресійний аналіз - student2.ru - кількість інтервалів за змінною Y. Обчислені групові середні кореляційний та регресійний аналіз - student2.ru розташуємо в останньому стовпці кореляційної таблиці і зобразимо графічно у вигляді ламаної, що називається

емпіричною лінією регресії Y по Х (рис. 6.1).

ОВФ, млн.грн
5 10 15 20 25 30 35 40 45
             
Добовий виробіток, т
кореляційний та регресійний аналіз - student2.ru
Емпірична лінія регресії, Y по Х
у=16,92
кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru
x=32,1

Рис. 6.1

Аналогічно, для кожного значення кореляційний та регресійний аналіз - student2.ru обчислимо групові середні (розміщені у нижньому рядку кореляційної таблиці):

кореляційний та регресійний аналіз - student2.ru , (6.6) де кореляційний та регресійний аналіз - student2.ru , кореляційний та регресійний аналіз - student2.ru - кількість інтервалів за змінною Х. За виглядом ламаної

лінії можна припустити наявність лінійної кореляційної залежності Y по Х між двома змінними, що розглядаються. Ця залежність графічно буде більш точною, якщо збільшити об’єм вибірки:

кореляційний та регресійний аналіз - student2.ru . (6.7)

Тому рівняння регресії будемо шукати у вигляді кореляційний та регресійний аналіз - student2.ru . (6.8)

Параметри рівняння кореляційний та регресійний аналіз - student2.ru знайдемо за методом найменших квадратів, тобто відшукаємо значення кореляційний та регресійний аналіз - student2.ru мінімізуючи функцію

кореляційний та регресійний аналіз - student2.ru (6.9)

Необхідні умови екстремуму:

кореляційний та регресійний аналіз - student2.ru

Після перетворень отримаємо систему нормальних рівнянь для визначення параметрів кореляційний та регресійний аналіз - student2.ru : кореляційний та регресійний аналіз - student2.ru (6.10)

Враховуючи формулу (6.5), перетворимо вирази:

кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru .

Поділимо обидві частини нормальних рівнянь на кореляційний та регресійний аналіз - student2.ru і застосуємо формулу (6.7). Отримаємо систему у вигляді:

кореляційний та регресійний аналіз - student2.ru (6.11)

де кореляційний та регресійний аналіз - student2.ru , (6.12)

кореляційний та регресійний аналіз - student2.ru (6.13)

кореляційний та регресійний аналіз - student2.ru (6.14)

Підставимо значення кореляційний та регресійний аналіз - student2.ru з першого рівняння системи (6.11) в рівняння регресії:

кореляційний та регресійний аналіз - student2.ru (6.15)

Коефіцієнт кореляційний та регресійний аналіз - student2.ru називається вибірковим коефіцієнтом регресії Y по Х

( кореляційний та регресійний аналіз - student2.ru ), отже,

кореляційний та регресійний аналіз - student2.ru (6.16)

Коефіцієнт регресії Y по Х показує, на скільки одиниць в середньому зміниться Y при збільшенні Х на одну одиницю.

Розв’яжемо остаточно нормальну систему і знайдемо кореляційний та регресійний аналіз - student2.ru :

кореляційний та регресійний аналіз - student2.ru (6.17)

де кореляційний та регресійний аналіз - student2.ru - вибіркова дисперсія змінної Х; кореляційний та регресійний аналіз - student2.ru - вибірковий кореляційний момент, або вибіркова коваріація.

Розмірковуючи аналогічно, з рівняння регресії Х по Y кореляційний та регресійний аналіз - student2.ru матимемо: кореляційний та регресійний аналіз - student2.ru - вибірковий коефіцієнт регресії Х по Y , що показує, на скільки одиниць в середньому зміниться Х при збільшенні Y на одну одиницю. кореляційний та регресійний аналіз - student2.ru - вибіркова дисперсія змінної Y. Коефіцієнти регресії кореляційний та регресійний аналіз - student2.ru мають однакові знаки, що визначаються знаком кореляційний та регресійний аналіз - student2.ru . Коефіцієнти кореляційний та регресійний аналіз - student2.ru визначають кутові коефіцієнти відповідних ліній регресії (лінії перетинаються в точці ( кореляційний та регресійний аналіз - student2.ru )) (див. рис. 6.3).

◄ Приклад 6.1За даними таблиці 6.1 знайти рівняння регресії Y по Х і Х по Y та пояснити їх зміст.

Розв’язання. Обчислимо всі необхідні суми: кореляційний та регресійний аналіз - student2.ru

кореляційний та регресійний аналіз - student2.ru Знаходимо вибіркові характеристики і параметри рівняння регресії:

кореляційний та регресійний аналіз - student2.ru

кореляційний та регресійний аналіз - student2.ru

Отже, рівняння регресії:

кореляційний та регресійний аналіз - student2.ru

З першого рівняння регресії Y по Х випливає, що при збільшенні основних виробничих фондів (ОВФ) Х на 1 млн.грн. добовий виробіток продукції Y збільшиться в середньому на 0,6762 т. Друге рівняння регресії Х по Y показує, що для збільшення добового виробітку продукції на 1 т необхідно в середньому збільшити ОВФ на 0,8099 млн.грн. Зауважимо, що вільні члени рівнянь не мають реального змісту.►

Коефіцієнт кореляції

Оцінимо тісноту лінійної кореляційної залежності. Виберемо стандартну систему одиниць виміру, в якій дані за різними характеристиками виявилися б такими, що можуть бути порівняні між собою. Ця система використовує в якості одиниці виміру змінної її середнє квадратичне відхилення кореляційний та регресійний аналіз - student2.ru . Представимо рівняння регресії кореляційний та регресійний аналіз - student2.ru у вигляді:

кореляційний та регресійний аналіз - student2.ru (6.18)

Величина кореляційний та регресійний аналіз - student2.ru показує на скільки кореляційний та регресійний аналіз - student2.ru зміниться в середньому Y, коли Х збільшиться на одне кореляційний та регресійний аналіз - student2.ru .

Величина кореляційний та регресійний аналіз - student2.ru є показником тісноти лінійного зв’язку і називається вибірковим коефіцієнтом кореляції.

На рис. 6.2 наведено дві кореляційні залежності змінної Y по Х: у випадку а) залежність між змінними менш тісна, ніж у випадку б). Якщо кореляційний та регресійний аналіз - student2.ru , кореляційний зв’язок називається прямий, а якщо кореляційний та регресійний аналіз - student2.ru - обернений.

Формула для кореляційний та регресійний аналіз - student2.ru симетрична відносно змінних Y та Х, отже, можна записати кореляційний та регресійний аналіз - student2.ru . Перемножимо обидві формули для кореляційний та регресійний аналіз - student2.ru :

кореляційний та регресійний аналіз - student2.ru (6.19) Отже, коефіцієнт кореляції кореляційний та регресійний аналіз - student2.ru змінних Y та Х є середнє геометричне кое-

фіцієнтів регресії і має їх знак.

б)
a)
y
x
кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru
y
x
кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru кореляційний та регресійний аналіз - student2.ru

Рис. 6.2

◄ Приклад 6.2 Обчислити коефіцієнт кореляції між величиною основних виробничих фондів Х і добовим виробітком продукції Y за даними табл. 6.1.

Розв’язання. В прикладі 6.1 були обчислені коефіцієнти регресії

кореляційний та регресійний аналіз - student2.ru Отже, кореляційний та регресійний аналіз - student2.ru . Таким чином, зв’язок між змінними прямий і достатньо тісний►.

Основні властивості коефіцієнта кореляції:

( об’єм вибірки достатньо великий)

1. Коефіцієнт кореляції приймає значення на відрізку кореляційний та регресійний аналіз - student2.ru .

В залежності від того наскільки кореляційний та регресійний аналіз - student2.ru наближається до одиниці розрізняють зв’язок слабкий, помірний, відчутний, достатньо тісний, тісний і вельми тісний.

2. Якщо всі значення змінних збільшити (зменшити) на одне і те саме число або в одне і те саме число разів, то величина коефіцієнта кореляції не зміниться.

3. При кореляційний та регресійний аналіз - student2.ru кореляційний зв’язок представляє лінійну функціональну залежність. При цьому лінії регресії Y по Х та Х по Y співпадають і всі спостереженні значення розташовані на спільній прямій.

4. При кореляційний та регресійний аналіз - student2.ru лінійний кореляційний зв’язок відсутній. При цьому групові середні змінних співпадають з їх загальними середніми, а лінії регресій Y по Х та Х по Y паралельні осям координат. Рівність кореляційний та регресійний аналіз - student2.ru каже лише про відсутність лінійної кореляції, але не про відсутність взагалі кореляційної або статистичної залежності.

Наши рекомендации