Коэффициент ранговой корреляции Кендалла
(тау Кендалла, t)
Коэффициент корреляции Кендалла используется в случае, когда переменные представлены двумя порядковыми шкалами при условии, что связанные ранги отсутствуют. Вычисление коэффициента Кендалла связано с подсчетом числа совпадений и инверсий. Рассмотрим эту процедуру на примере предыдущей задачи.
Алгоритм решения задачи следующий:
1. Переоформляем данные табл. 8.5 таким образом, чтобы один из рядов (в данном случае ряд xi) оказался ранжированным. Другими словами, мы переставляем пары x и y в нужном порядке ивносим данные в столбцы 1 и 2 табл. 8.6.
Таблица 8.6
xi | yi | Совп. | Инв. |
Σ |
2. Определяем «степень ранжированности» 2-го ряда (yi). Эта процедура проводится в следующей последовательности:
а) берем первое значение неранжированного ряда «3». Подсчитываем количество рангов ниже данного числа, которые больше сравниваемого значения. Таких значений 9 (числа 6, 7, 4, 9, 5, 11, 8, 12 и 10). Заносим число 9 в столбец «совпадения». Затем подсчитываем количество значений, которые меньше трех. Таких значений 2 (ранги 1 и 2); вносим число 2 в графу «инверсии».
б) отбрасываем число 3 (мы с ним уже поработали) и повторяем процедуру для следующего значения «6»: число совпадений равно 6 (ранги 7, 9, 11, 8, 12 и 10), число инверсий – 4 (ранги 1, 2, 4 и 5). Вносим число 6 в графу «совпадения», а число 4 – в графу «инверсии».
в) аналогичным образом процедура повторяется до конца ряда; при этом следует помнить, что каждое «отработанное» значение исключается из дальнейшего рассмотрения (подсчитываются только ранги, которые лежат ниже данного числа).
Примечание
Для того чтобы не совершать ошибок в подсчетах, следует иметь в виду, что с каждым «шагом» сумма совпадений и инверсий уменьшается на единицу; это понятно, если учесть, что каждый раз одно значение исключается из рассмотрения.
3. Подсчитывается сумма совпадений (Р) и сумма инверсий (Q); данные вносятся в одну и трех взаимозаменяемых формул коэффициента Кендалла (8.10). Проводятся соответствующие вычисления.
t (8.10)
В нашем случае:
В табл. XIV Приложений находятся критические значения коэффициента для данной выборки: τкр. = 0,45; 0,59. Эмпирически полученное значение сравнивается с табличным.
Вывод
τ = 0,55 > τкр. = 0,45. Корреляция статистически значима для 1-го уровня.
Примечание:
При необходимости (например, при отсутствии таблицы критических значений) статистическая значимость t Кендалла может быть определена по формуле следующего вида:
(8.11)
где S* = P – Q + 1, если P < Q, и S* = P – Q – 1, если P > Q.
Значения z для соответствующего уровня значимости соответствуют мере Пирсона и находятся по соответствующим таблицам (в приложение не включены. Для стандартных уровней значимости zкр = 1,96 (для β1 = 0,95) и 2,58 (для β2 = 0,99). Коэффициент корреляции Кендалла является статистически значимым, если z > zкр
В нашем случае S* = P – Q – 1 = 35 и z = 2,40, т. е. первоначальный вывод подтверждается: корреляция между признаками статистически достоверна для 1-го уровня значимости.