Лабораторна робота 3
Кореляційний аналіз
Мета роботи:
набути практичного досвіду застосування кореляційного аналізу для відбору факторів, що суттєво впливають на якість продукції
Навчальний матеріал
1. Кореляційний аналіз
Кореляційний аналіз – це сукупність методів математичної статистики, призначених для встановлення факту наявності або відсутності взаємозв'язків, взаємозалежності між двома або декількома кількісними показниками (ознаками).
В рамках кореляційного аналізу використовуються наступні прийоми:
- оцінка парної кореляції – дозволяє досліджувати зв'язок між двома показниками;
- множинна кореляція – для оцінки залежності одного показника від групи показників;
- канонічна кореляція – для аналізу зв'язку між групами показників;
- частна кореляція – дозволяє досліджувати зв'язок між двома показниками, абстрагуючись від впливу інших показників;
- рангова кореляція – для аналізу зв'язків між якісними показниками.
2. Коефіцієнт парної кореляції
Для дослідження зв'язку між двома показниками, що мають нормальний розподіл, використовується коефіцієнт парної кореляції:
(-1 £ rxy £ +1) | (19) |
де: X, Y – випадкові величини, розподілені за нормальним законом;
xi – i-те спостереження показника X;
yi – i-те спостереження показника Y;
– вибіркове середнє показника X (центр групування);
– вибіркове середнє показника Y (центр групування).
Позитивний знак коефіцієнта парної кореляції означає, що із збільшенням значення одного показника збільшується і інший, негативний – що із збільшенням одного інший зменшується.
Абсолютна величина коефіцієнта означає силу зв'язку. Умовно приймаємо: 0 - 0,3 – слабкий зв'язок; 0,3 - 0,7 – зв'язок середньої сили; 0,7 - 1 – сильний (тісний) зв'язок.
Зв'язок між показниками може бути повним, тобто функціональним, тоді коефіцієнт парної кореляції дорівнює 1 або -1, а може бути зовсім відсутнім, тоді коефіцієнт дорівнює 0.
Якщо залежність неповна, оскільки на неї впливають інші чинники, то коефіцієнт набуватиме проміжних значень (між –1, 0, 1) залежно від тісноти зв'язку. Наприклад, продуктивність праці залежить від стажу роботи, але реально існують і інші чинники, які впливають на цю залежність (здоров'я і тому подібне).
За допомогою коефіцієнта кореляції можна отримати відповіді на такі питання:
- чи є зв'язок між показниками X і Y?
- наскільки тісний зв'язок між показниками X і Y?
Сильна кореляція означає закономірність: чим більше відрізняється від свого середнього значення один показник, тим далі від свого середнього значення знаходиться й інший. При цьому потрібно пам'ятати, що коефіцієнт кореляції застосовується тільки для аналізу випадкових величин, які мають нормальний розподіл.
Кореляційний аналіз безпосередньо не виявляє причинні зв'язки, він тільки встановлює чисельне значення сили цих зв'язків.
Більш того: кореляція – це не причина.
В результаті застосування кореляційного аналізу дослідник встановлює тільки один факт - є чи немає зв'язку між двома показниками, змінюється один показник разом з іншим чи ні. Необхідно усвідомлювати той, що наявність зв'язку нічого не говорить про його причину, про те, чим даний зв'язок може бути обумовлений. Причина взаємозв'язку показників може полягати в одному з цих показників, але може лежати поза даними явищами.
Приклад. Потрібно оцінити тісноту взаємозв'язків між показниками, які характеризують студентів, що вивчають деяку задану дисципліну (табл. 8):
Y – успішність навчання(бал.),
X1 – відвідуваність студентом лекцій (%),
X2 – матеріальне становище студента (бал.),
X3 – ставлення студента до викладача (бал.).
Таблиця 8
Показники, які характеризують студентів,
що вивчають задану дисципліну
Студенти | Успішність навчання | Відвідуваність лекцій | Матеріальне становище | Ставлення до викладача |
5,0 | ||||
4,5 | ||||
4,6 | ||||
5,0 | ||||
3,2 | ||||
4,5 | ||||
2,4 | ||||
2,2 | ||||
3,5 | ||||
4,7 | ||||
4,3 | ||||
3,1 | ||||
3,6 | ||||
2,4 | ||||
4,5 | ||||
4,9 | ||||
5,0 | ||||
3,0 | ||||
4,1 | ||||
4,9 | ||||
4,0 | ||||
3,0 | ||||
4,8 | ||||
2,0 | ||||
4,9 | ||||
4,2 | ||||
3,6 | ||||
4,8 | ||||
4,0 | ||||
3,4 |
Зміст кореляційного аналізу наведено у табл. 9, результат – у табл. 10 та на рис. 8.
Таблиця 9
Розрахунок коефіцієнта парної кореляції (фрагмент)
№ | Y | X1 | X1 - | Y1 - | (X1 - )2 | (Y1 - )2 | (X1 - )´(Y1 - ) | ||
5,0 | 20,2 | 1,1 | 409,4 | 1,1 | 21,5 | ||||
4,5 | 4,2 | 0,6 | 17,9 | 0,3 | 2,4 | ||||
4,6 | 10,2 | 0,7 | 104,7 | 0,4 | 6,8 | ||||
… | |||||||||
3,4 | 9,2 | -0,5 | 85,3 | 0,3 | -5,0 | ||||
Середнє | 3,9 | 79,8 | |||||||
Сума | 7109,4 | 25,1 | 350,4 | ||||||
Таблиця 10
Кореляційна матриця
яка демонструє коефіцієнти парної кореляції для множини показників
Y | X 1 | X 2 | X 3 | |
Y | 0,83 | -0,23 | 0,30 | |
X 1 | 0,83 | -0,19 | 0,25 | |
X 2 | -0,23 | -0,19 | 0,01 | |
X 3 | 0,30 | 0,25 | 0,01 |
Рис. 8. Кореляційний граф,
який демонструє тісноту зв’язків між показниками