Корреляция метрических переменных
Для изучения взаимосвязи двух метрических переменных измеренных на одной и той же выборке применяется коэффициент корреляции r-Пирсона. Сам коэффициент характеризует наличие только линейной связи между признаками, обозначаемыми, как правило, символами Xи Y. Коэффициент линейной корреляции является параметрическим методом и его корректное применение возможно только в том случае, если результаты измерений представлены в шкале интервалов, а само распределение значений в анализируемых переменных отличается от нормального в незначительной степени. Существует множество ситуаций, в которых его применение целесообразно. Например: влияет ли интеллект школьника на его успеваемость; влияет ли настроение на успешность выхода из проблемной ситуации; зависит ли уровень дохода от темперамента и т.п.
Коэффициент Пирсона находит широкое применение в психологии и педагогике. При обработке данных «вручную» необходимо вычислить коэффициент корреляции, а затем определить p–уровень значимости при помощи критерия t-Стьюдента (в целях упрощения проверки данных пользуются таблицами критических значений rxy, которые составлены с помощью этого критерия). Величина коэффициента линейной корреляции Пирсона не может превышать +1 и быть меньше чем -1. Эти два числа +1 и -1 – являются границами для коэффициента корреляции. Когда при расчете получается величина большая +1 или меньшая -1 – следовательно, произошла ошибка в вычислениях.
Для статистического решения о принятии или отклонении H0 обычно устанавливают α=0,05, а для большого объема наблюдений (100 и более) α=0,01. Если p≤α H0 отклоняется и делается содержательный вывод о том, что обнаружена статистически достоверная (значимая) связь между изучаемыми переменными (положительная или отрицательная – в зависимости от знака корреляции). Когда p>α, H0 не отклоняется, и содержательный вывод ограничен констатацией того, что связь (статистически достоверная) не обнаружена.
Если связь не обнаружена, но есть основания полагать, что связь на самом деле есть, то следует проверить возможные причины
недостоверности связи.
1. Нелинейность связи - для этого посмотреть график двумерного рассеивания. Если связь нелинейная, но монотонная, перейти к ранговым корреляциям. Если связь не монотонная, то делить выборку на части, в которых связь монотонная, и вычислить корреляции отдельно для каждой части выборки, или делить выборку на контрастные группы и далее сравнивать их по уровню выраженности признака.
2. Наличие выбросов и выраженная асимметрия распределения одного или обоих признаков. Для этого необходимо посмотреть гистограммы распределения частот обоих признаков. При наличии выбросов или асимметрии исключить выбросы или перейти к ранговым корреляциям.
3. Неоднородность выборки (посмотреть график двумерного рассеивания). Попытаться разделить выборку на части, в которых связь может иметь разные направления.
Если же связь статистически достоверна, то прежде, чем делать содержательный вывод, необходимо исключить возможность ложной корреляции.
1. Связь обусловлена выбросами. При наличии выбросов перейти к ранговым корреляциям или исключить выбросы.
2. Связь обусловлена влиянием третьей переменной. Если подобное явление, возможно, необходимо вычислить корреляцию не только для всей выборки, но и для каждой группы в отдельности. Если «третья» переменная метрическая – вычислить частную корреляцию.
Коэффициент частной корреляции rxyzвычисляется в том случае если необходимо проверить предположение о том, что связь между двумя переменными X и Y не зависит от влияния третьей переменной – Z. Очень часто две переменные коррелируют друг с другом только за счет того, что обе они согласованно меняются под влиянием третьей переменной. Иными словами, на самом деле связь между соответствующими свойствами отсутствует, но проявляется в статистической взаимосвязи под влиянием общей причины. Например, общей причиной изменчивости двух переменных может являться возраст при изучении взаимосвязи различных психологических особенностей в разновозрастной группе. При интерпретации частной корреляции с позиции причинности следует быть осторожным, так как если Z коррелирует и с X и с Y, а частная корреляция rxyzблизка к нулю, из этого не обязательно следует, что именно Z является общей причиной для X и Y.