Корреляция ранговых переменных
Если к количественным данным неприемлем коэффициент корреляции r-Пирсона, то для проверки гипотезы о связи двух переменных после предварительного ранжирования могут быть применены корреляции r–Спирмена или τ-Кендала. Например, в исследовании психофизических особенностей музыкально одаренных подростков Лавочкина И. А. был использован метод ранговой корреляции.
Для корректного вычисления обоих коэффициентов (Спирмена и Кендалла) результаты измерений должны быть представлены в шкале рангов или интервалов. Принципиальных отличий между этими критериями не существует, но принято считать, что коэффициент Кендала является более «содержательным», так как он более полно и детально анализирует связи между переменными, перебирая все возможные соответствия между парами значений. Коэффициент Спирмена более точно учитывает именно количественную степень связи между переменными.
Коэффициент ранговой корреляции Спирмена (Spearman) является непараметрическим аналогом классического коэффициента корреляции Пирсона, но при его расчете учитываются не связанные с распределением показатели сравниваемых переменных (среднее арифметическое и дисперсия), а ранги. Например, необходимо определить связь между ранговыми оценками качеств личности, входящими в представление человека о своем «Я реальном» и «Я идеальном».
Коэффициент Спирмена также широко используется в психологических исследованиях. Например, в работе Бушова Ю. В. и Несмеловой Н.Н. для изучения зависимости точности оценки и воспроизведения длительности звуковых сигналов от индивидуальных особенностей человека был использован коэффициент ранговой корреляции Спирмена.
Так как этот коэффициент – аналог r-Пирсона, то и применение его для проверки гипотез аналогично применению r-Пирсона. То есть проверяемая статистическая гипотеза, порядок принятия статистического решения и формулировка содержательного вывода те же. В компьютерных программах (SPSS, Statistica) уровни значимости для одинаковых коэффициентов r-Пирсона, и r-Спирмена всегда совпадают.
Преимущество r-Спирмена по сравнению с r-Пирсона – в большей чувствительности к связи в следующих случаях:
1. существенного отклонения распределения хотя бы одной переменной от нормального вида (асимметрия, выбросы);
2. криволинейной (монотонной) связи.
Ограничением для применения коэффициента r-Спирмена является:
1. по каждой переменной не менее 5 наблюдений;
2. коэффициент при большом количестве одинаковых рангов по одной или обеим переменным дает огрубленное значение.
Коэффициент ранговой корреляции τ-Кендалла (Kendall’s tau-b) является самостоятельным оригинальным методом, опирающимся на вычисление соотношения пар значений двух выборок, имеющих одинаковые или отличающиеся тенденции (возрастание или убывание значений). Этот коэффициент называют еще коэффициентом конкордации. Таким образом, основной идеей данного метода то, что о направлении связи можно судить, попарно сравнивая между собой испытуемых: если у пары испытуемых изменение по X совпадает по направлению с изменением по Y, то это свидетельствует о положительной связи, если не совпадает – то об отрицательной связи. Например, при исследовании личностных качеств, имеющих определяющее значение для семейного благополучия. В этом методе одна переменная представляется в виде монотонной последовательности (например, данные мужа) в порядке возрастания величин; другой переменной (например, данные жены) присваиваются соответствующие ранговые места. Количество инверсий (нарушений монотонности по сравнению с первым рядом) используется в формуле для корреляционных коэффициентов.
Применение коэффициента Кендалла является предпочтительным, если в исходных данных имеются выбросы.
Особенностью ранговых коэффициентов корреляции является то, что максимальным по модулю ранговым корреляциям (+1, -1) не обязательно соответствуют строгие прямо или обратно пропорциональные связи между исходными переменными X и Y: достаточна лишь монотонная функциональная связь между ними. Ранговые корреляции достигают своего максимального по модулю значения, если большему значению одной переменной всегда соответствует большее значение другой переменной (+1) или большему значению одной переменной всегда соответствует меньшее значение другой переменной и наоборот (-1).
Проверяемая статистическая гипотеза, порядок принятия статистического решения и формулировка содержательного вывода те же, что и для случая r-Спирмена или r-Пирсона.
Если статистически достоверная связь не обнаружена, но есть основания полагать, что связь на самом деле есть, то следует сначала перейти от r-Спирмена к τ-Кендала (или наоборот), а затем проверить возможные причины недостоверности связи.
1. Нелинейность связи для этого посмотреть график двумерного рассеивания. Если связь не монотонная, то делить выборку на части, в которых связь монотонная или делить выборку на контрастные группы и далее сравнивать их по уровню выраженности признака.
2. Неоднородность выборки (посмотреть график двумерного рассеивания). Попытаться разделить выборку на части, в которых связь может иметь разные направления.
Если же связь статистически достоверна, то прежде, чем делать содержательный вывод, необходимо исключить возможность ложной корреляции (по аналогии с метрическими коэффициентами корреляции).