Визначення взаємозв’язків між факторними та результативними ознаками
Існують такі види зв’язку:
- функціональний – кожному значенню факторної ознаки відповідає одне - значення результативної ознаки.
- стохастичний - кожному значенню факторної ознаки відповідає множина значень результативної, які утворюють умовний розподіл.
Існує декілька методів виявлення зв’язка між двома ознаками:
- метод аналітичних групувань;
- метод регресії і кореляції;
- метод кореляції рангів.
В даній частині курсової роботи буде виявлений зв’язок між часом простою год. та виручка за допомогою методу аналітичних групувань і методу регресії та кореляції.
Вимірювання зв’язку методом аналітичних групувань, який складається з 2 етапів:
1. побудова аналітичного групування;
2. визначення щільності зв’язку між факторною та результативною ознакою за формулою:
,
де -міжгрупова дисперсія,
- загальна дисперсія.
Побудуємо таблицю для обчислення міжгрупової дисперсії:
Розрахунок міжгалузевої дисперсії в аналітичному групуванні
Таблиця 3.9
№ п/п | nїзд | Кількість водіїв, mi | ∑ виручка, грн | Сер. виручка, грн | |||
37,4-39,44 | 358,4 | 128450,6 | 256901,2 | ||||
39,44-41,48 | 491,4 | ||||||
41,48-43,52 | 473,4 | 224107,6 | |||||
43,52-45,56 | 436,4 | ||||||
45,56-47,6 | 282,4 | 79749,76 | 558248,3 | ||||
864226,8 |
Розрахуємо еластичність змін:
При часу простою від 39,44 до 41,48 годин, середня виручка в 65,2 рази збільшилась.
При часі простою від 41,48 до 43,52, середній виручка в 8,8 раз зменшилась.
При часі простою від 43,52 до 45,56, середній виручка в 18,1 раз зменшилась.
При часі простою від 45,56 до 47,6, середній виручка в 75,4 рази зменшилась.
Для обчислення міжгрупової дисперсії використаємо формулу:
,
де - середнє значення ознаки (виручки) по всій сукупності;
= 1036,56 (грн)
- середнє значення ознаки для кожної з груп; - частоти.
= 4025817 / 24 = 167742,4
Отже, обчислимо щільність зв’язку між часом простою та виручкою:
= 167742,4/394885,2 = 0,4
Оскільки = 0,4, то можна сказати, що зв'язок між двома кількісними ознаками сильний , а виручка на 40% залежить від часу простою.
Порівняння істотності зв’язку—це порівняння фактичного значення щільності зв’язку з його критичним значенням, яке ми беремо з таблиці даних. Для цього випадку — Fкр=0,345. Фактичне значення розраховуємо за формулою:
Fф де Κ1 = Г – 1 К2 = n – Г
Fф
Fкр ≤ Fф ; 0,345<3,1. Отже, зв'язок істотний.
Цей метод дає хороші результати, коли використовується велика кількість одиниць сукупності, а недолік його полягає в тому, що неможливо отримати теоретичну лінію регресії, яка характеризує стохастичний зв’язок.
Цей недолік враховує регресійно-кореляційний метод, тому визначимо зв’язок між стажом та виручкою за допомогою цього методу.
Побудуємо кореляційне поле
· факторна ознака – стаж;
· результативна ознака – виручка.
Таблиця 11
№ групи | Стаж | Кількість водіїв, чол | Загальна виручка,грн | Середня виручка,грн |
6-9,2 | 1485,625 | |||
9,2-12,4 | 1445,75 | |||
12,4-15,6 | ||||
15,6-18,8 | 1568,5 | |||
18,8-22 | 1506,2 |
Задача регресійно-кореляційного методу полягає у виявленні зв’язку між факторною та результативною ознаками, та виборі рівняння регресії методом найменших квадратів. Це означає, що сума різниць квадратів теоретичних і емпіричних значень повинна бути мінімальною.
S(Уі - У)2® min
Необхідно знайти параметри рівняння: У = а + b*х
де а – параметр, що показує значення результативної ознаки (у), якщо факторна ознака х = 0;
b – параметр, що показує на скільки одиниці змінюється у середньому результативна ознака (у), якщо факторну ознаку змінити на одиницю.
Для знаходження параметрів будується система рівняння:
n*a + b*S x = S y
a*S x + b*S x2 = S x*y
Для розв’язку системи рівнянь побудуємо допоміжну таблицю.
Щоб виявити щільність зв’язку, вимірюють лінійний коефіцієнт кореляції R:
Лінійний коефіцієнт кореляції r змінюється в межах - 1 < r < +1. Він показує напрямок і тісноту зв’язку між ознаками.
Отже, знайдемо взаємозв’язок між факторною ознакою – коефіцієнтом β (Хі) та результативною ознакою – виручкою (Уі).
Для цього побудуємо допоміжну таблицю.
Взаємозв’язок між факторною ознакою – стаж водіїв (Хі) та результативною ознакою – виручка.
Таблиця 3.10
№п/п | Хі | Уі | Хі2 | Хі * Уі | Хі – | Уі - |
39,06 | 9428,4 | |||||
18,06 | 2106,8 | |||||
1,56 | 49239,6 | |||||
45,6 | 364,8 | |||||
14,06 | 108966,01 | |||||
52,5 | 29894,4 | |||||
5,06 | 4342,8 | |||||
18,06 | 1082,4 | |||||
1,56 | 2590,8 | |||||
3,06 | 954,8 | |||||
7,56 | 6577,2 | |||||
22,5 | 479,6 | |||||
45,6 | 571,2 | |||||
60,06 | 259,2 | |||||
39,06 | 65,6 | |||||
18,06 | 25632,01 | |||||
10,56 | 15901,2 | |||||
0,56 | 846,8 | |||||
14,06 | 12298,8 | |||||
33,06 | 2926,8 | |||||
76,56 | 835,2 | |||||
52,5 | 4342,8 | |||||
27,56 | 396,0 | |||||
0,06 | 26,0 | |||||
606,34 | ||||||
Середні значеня | 13,25 | 1498,9 | 200,8 | 19951,04 | 25,3 | 11672,1 |
Припускаючи, що залежність лінійна, знаходимо:
n*a + b*S x = S y
a*S x + b*S x2 = S x*y
24a + 318b = 35973;
318a + 4820b = 478825
b = 6,2
a = 1446.9
Функція має вигляд:
У^ = а + b×x = 1446,9+6,2×х