Метод кореляції рангів Спірмена
Перш за все підкреслимо, що для даного методу справедливим є зауваження із п.2.5.
Даний метод належить до так званих непараметричних методів наближеного оцінювання зв’язку, оскільки його застосування не потребує обчислення будь-яких параметрів сукупності, що вивчається.
Метод кореляції рангів Спірмена:
а) застосовується у випадках, коли обидві ознаки (або одна з них) є атрибутивними або варіаційними, але шкала атрибутивної ознаки може розглядатись як рангова;
б) дає можливість формально (але наближено) перевіряти істотність і оцінювати щільність зв’язку, а також визначати його напрям;
в) не дає можливості визначати вид та характер залежності.
Числовою мірою істотності та щільності зв’язку в даному методі є коефіцієнт кореляції рангів Спірмена
, (3.21)
де di=ui–vi – різниця рангів ui та vi для відповідно хі та уі, п – число пар (хі; уі). Можна показати, що [‑1; 1].
Рангомui(vi) кожного значення хі(уі) є його порядковий номер, якщо всі хі(уі) розташувати у неспадному порядку. Якщо при цьому деякі значення хі(уі) збігаються, то кожному з них присвоюється ранг, що дорівнює середньому арифметичному їх фактичних порядкових номерів.
Для перевірки істотності (тобто існування) зв’язку необхідно за формулою (3.21) обчислити спостережене значення величини і порівняти його модуль з критичним значенням , яке залежить від обсягу сукупності п та рівня значущості α і знаходиться за формулою:
,
де − рівень значущості; − число степенів вільності; − обсяг вибірки; − критична точка розподілу Стьюдента для двосторонньої критичної області (див. додаток 3).
Якщо , то зв’язок вважається істотним з імовірністю γ=( ) і навпаки. Рівень значущості зазвичай вибирається рівним 0,05 або 0,10 і являє собою імовірність ризику визнати зв’язок істотним, коли він насправді не існує.
Якщо зв’язок буде визнано істотним, то його щільність можна оцінювати за правилом трисекції:
– для (0,3 + 0,7; 1] зв’язок вважаємо щільним;
– для (0,7 + 0,3; 0,3 + 0,7] – помірним;
– для ( ; 0,7 + 0,3] – слабким.
Знак визначає напрям залежності: якщо , то зв’язок прямий і навпаки.
Приклад постановки і розв’язування типової задачі.
Постановка задачі
За даними спостереження двадцяти митних установ необхідно дослідити можливу залежність між витратами на їх утримання (факторна ознака Х) та перерахуваннями коштів до держбюджету (результативна ознака Y). Дослідження провести методами: комбінаційного групування, аналітичного групування, дисперсійного аналізу, КРА, збігу знаків, кореляції рангів Спірмена. При цьому метод КРА слід реалізувати для двох видів рівняння регресії, вибравши з них краще за критерієм мінімума регресійної дисперсії.
Таблиця 3.3