Відшукання параметрів виборчого рівняння прямої лінії середньоквадратичної регресії по несгрупованим даним
Лекція № 14
Тема: Елементи теорії кореляції
Питання лекції:
1.Функціональна, статистична і кореляційна залежності.
2.Виборчі рівняння регресії.
3.Відшукання параметрів виборчого рівняння прямої лінії середньоквадратичної регресії по несгрупованим даним.
4.Кореляційна таблиця.
5.Відшукання параметрів вибіркового рівняння прямої лінії регресії по згрупованим даним.
6.Виборчий коефіцієнт кореляції і методика його обчислення.
Функціональна, статистична і кореляційна залежності
Статистичною називають залежність, при якій зміна однієї з величин тягне за собою зміну розподілу іншої. Зокрема, статистична залежність виявляється в тім, що при зміні однієї з величин змінюється середнє значення іншої, в цьому випадку статистичну залежність називають кореляційною.
Приклад кореляційної залежності: залежність врожаю зернових і кількості добрив на одному полі. На однакових площах і при однакових кількостях добрив врожаї різні. Але середній врожай є функцією від кількості добрив.
Крім статистичної і кореляційної залежності існує і функціональна залежність.
Виборчі рівняння регресії
Умовним математичним сподіванням дискретної випадкової величини при ( – визначене можливе значення ) називають добуток можливих значень при умові ймовірності
.
Для неперервних величин
,
де – умовна густина випадкової величини при .
Умовне математичне сподівання є функція від :
,
Яку називають функцією регресії на .
Аналогічно визначається умовне математичне сподівання випадкової величини і функція регресії на :
.
Умовне математичне сподівання є функція від , отже його оцінка, тобто умовне середнє є також функцією від ; позначивши цю функцію через , отримаємо рівняння
.
Це рівняння називають виборчим рівнянням регресії на ; функцію називають виборчою регресією на , а її графік – виборчою лінією регресії на .
Аналогічно рівняння
Називають виборчим рівнянням регресії на , а її графік – виборчою лінією регресії на .
Відшукання параметрів виборчого рівняння прямої лінії середньоквадратичної регресії по несгрупованим даним
Нехай вивчається система кількісних ознак . В результаті незалежних іспитів отримали пар чисел , , , .
Знайдемо по даним спостережень виборче рівняння прямої лінії середньоквадратичної регресії. Для визначеності будемо відшукувати рівняння
регресії на .
Оскільки різні значення ознаки і відповідні їм значення ознаки спостерігались по одному разу, згруповувати дані немає необхідності. Також немає потреби використовувати поняття умовної середньої; тому відшукувань рівняння можна записати так:
Кутовий коефіцієнт прямої лінії регресії на називають виборчим коефіцієнтом регресії на і позначають через , він є оцінкою коефіцієнта регресії . Отже виборче рівняння прямої лінії регресії на має вигляд
(1)
Підберемо параметри і так, щоб точки , , , , побудовані по даним спостережень на площині лежали як можна ближче до прямої (1).
Назвемо відхиленням різницю
,
де – обчислена по рівнянню(1) ордината, що відповідає спостерігаємому значенню ; – спостерігаєма ордината, що відповідає .
Підберемо параметри і так, щоб сума квадратів відхилень була мінімальною
,
або
.
Для відшукання мінімуму прирівняємо до нуля відповідні часткові похідні:
;
.
Зробивши елементарні перетворення, отримаємо систему двох лінійних рівнянь відносно і
Звідки
;
.
Аналогічно можна знайти виборче рівняння прямої лінії регресії на :
,
де – виборчий коефіцієнт регресії на .
4*. Кореляційна таблиця
При великому числі спостережень одне й те ж значення може зустрічатися разів, одне й те ж значення – разів, одна й та ж пара чисел може спостерігатися разів. Тому дані спостережень групують, тобто відраховують частоти , , . Усі згруповані дані записують в вигляді таблиці, яку називають кореляційною.
В першому рядку таблиці записані спостерігаємі значення ознаки , а в першому стовпці – спостерігаємі значення ознаки . На схрещенні рядків і стовпців знаходяться частоти спостерігаємих пар значень ознак. Наприклад, частота , вказує, що пара чисел спостерігалась разів. Всі частоти помічені в прямокутнику. В останньому стовпці записані суми частот рядків. В останньому рядку записані суми частот стовпців.
Перевіркою може бути .
;
.