Коэффициент корреляции r-Спирмена
Коэффициент корреляции r-Спирмена применяется при условии отсутствия связей в рангах (т.е. отсутствия повторяющихся рангов):
(2.2)
где d2 – разность рангов для испытуемого с номером. Преимущество r-Спирмена по сравнению с r-Пирсона:
а) более чувствителен к связи в случае существенного отклонения распределения хотя бы одной переменной от нормального вида (асимметрия, выбросы);
б) более чувствителен к связи в случае криволинейной (монотонной) связи.
Коэффициент корреляции τ-Кендалла
В основе корреляции Кендалла лежит идея о том, что о направлении связи можно су- дить, попарно сравнивая между собой испытуемых: если у пары испытуемых направление по
Х совпадает, по направлению с изменением по Y, это положительная связь, если не совпада- ет – отрицательная - инверсии.
Корреляция τ-Кендалла –есть разность относительных частот совпадений и инвер- сий при переборе всех пар испытуемых в выборке:
(2.3)
где Р – число совпадений, Q- число инверсий
При подсчете τ-Кендаллавручную данные сначала упорядочиваются по переменной Х. Затем для каждого испытуемого подсчитывается, сколько раз его ранг по Y оказывается меньше, чем ранг испытуемых, находящихся ниже. Результат записывается в столбец «Сов- падение». Сумма всех значений столбца «Совпадение» и есть Р – общее число совпадений. Далее для каждого испытуемого подсчитывается, сколько раз его ранг по Y оказывается больше, чем ранг испытуемых, находящихся ниже. Результат записывается в столбец «Ин- версии». Сумма всех значений столбца «Инверсии» и есть Q – общее число инверсий.
Для более полной интерпретации данного коэффициента корреляции полезны соот- ношения между величиной Кендалла и вероятностью отдельно совпадений и инверсий:
Р(р) = (1+τ)/2; Р(q) =(1-τ)/2
Так, если τ=0,5 значит, что вероятность совпадений равна 0,75, а вероятность инвер- сий – 0,25, т.е. при сравнении объектов друг с другом прямо пропорциональное соотношение (например, роста и веса) встречается в 3 раза чаще, чем обратно пропорциональное соотно- шение.
τ-Кендалла кажется более простым в вычислительном отношении. Однако при возрас- тании числа выборки, объем вычислений возрастает не пропорционально, а в геометриче- ской прогрессии.
Проблема связанных (одинаковых) рангов
При одинаковых (связанных) рангах формулы ранговой корреляции Спирмена и Кен- далла не подходят. При использовании корреляции Спирмена в случае связанных рангов возможны два подхода:
1. Если связей немного (менее 10% для каждой переменной), то можно вычислить ко- эффициент Спирмена приближенно по формуле.
2. При большом количестве связей применить к ранжированным данным классиче- скую формулу Пирсона; это всегда позволит определить ранговую корреляцию независимо от наличия связей в рангах.
При использовании корреляции Кендалла в случае наличия связанных рангов в фор- мулу вносятся поправки, и тогда получается общая формула для вычисления коэффициента корреляции Кендалла, независимо от наличия или отсутствия связей в рангах:
(2.4)
где Кх – (1/2)×Σfi(fi -1) (i – количество групп связей по Х, f – численность каждой груп- пы); Ку – (1/2)×Σfi(fi -1) (i – количество групп связей по Y, f – численность каждой группы).