Тема 8. Коэффициенты корреляции Пирсона, Спирмена и Кендалла
Глава 2. Методы проверки статистических гипотез. Корреляции и методы
Сравнения.
Коэффициент корреляции Пирсона
r-Пирсонаприменяется для изучения взаимосвязи двух метрических переменных, измеренных
на одной и той же выборке. Существует множество ситуаций, в которых уместно его
применение. Влияет ли интеллект на успеваемость на старших курсах университета? Связан ли
размер заработной платы работника с его доброжелательностью к коллегам? Влияет ли
настроение школьника на успешность решения сложной арифметической задачи? Для ответа на
подобные вопросы исследователь должен измерить два интересующих его показателя у
каждого члена выборки.
На величину коэффициента корреляции не влияет то, в каких единицах измерения
представлены признаки. Следовательно, любые линейные преобразования признаков
(умножение на константу, прибавление константы) не меняют значения коэффициента
корреляции. Исключением является умножение одного из признаков на отрицательную
константу: коэффициент корреляции меняет свой знак на противоположный.
Применение корреляции Спирмена и Пирсона.
Коэффициенты Переменные
Зависимая независимая
Корреляция
Пирсона
Метрическая метрическая
Корреляция
Спирмена
Ранговая ранговая
Метрическая ранговая
Метрическая метрическая
Корреляция Пирсона есть мера линейной связи между двумя переменными. Она позволяет
Определить, насколько пропорциональна изменчивость двух переменных. Если переменные
Пропорциональны друг другу, то графически связь между ними можно представить в виде
Прямой линии с положительным (прямая пропорция) или отрицательным (обратная пропорция)
Наклоном.
На практике связь между двумя переменными, если она есть, является вероятностной и
Графически выглядит как облако рассеивания эллипсоидной формы. Этот эллипсоид, однако,
Можно представить (аппроксимировать) в виде прямой линии, или линии регрессии. Линия
регрессии - это прямая, построенная методом наименьших квадратов: сумма квадратов
Расстояний (вычисленных по оси Y) от каждой точки графика рассеивания до прямой является
Минимальной
Особое значение для оценки точности предсказания имеет дисперсия оценок зависимой
Переменной. По сути, дисперсия оценок зависимой переменной Y - это та часть ее полной
Дисперсии, которая обусловлена влиянием независимой переменной X. Иначе говоря,
Отношение дисперсии оценок зависимой переменной к ее истинной дисперсии равно квадрату
Коэффициента корреляции.
Квадрат коэффициента корреляции зависимой и независимой переменных представляет долю
Дисперсии зависимой переменной, обусловленной влиянием независимой переменной, и
Называется коэффициентом детерминации. Коэффициент детерминации, таким образом,
Показывает, в какой степени изменчивость одной переменной обусловлена (детерминирована)
Влиянием другой переменной.
Коэффициент детерминации обладает важным преимуществом по сравнению с коэффициентом
Корреляции. Корреляция не является линейной функцией связи между двумя переменными.
Поэтому, среднее арифметическое коэффициентов корреляции для нескольких выборок не
Совпадает с корреляцией, вычисленной сразу для всех испытуемых из этих выборок (т.е.
Коэффициент корреляции не аддитивен). Напротив, коэффициент детерминации отражает связь
линейно и поэтому является аддитивным: допускается его усреднение для нескольких выборок.
Дополнительную информацию о силе связи дает значение коэффициента корреляции в квадрате
- коэффициент детерминации: это часть дисперсии одной переменной, которая может быть
Объяснена влиянием другой переменной. В отличие от коэффициента корреляции коэффициент