Формулы коэффициента корреляции
При сравнении порядковых данных применяется коэффициент ранговой корреляции по Ч. Спирмену (г):
где d — разность рангов (порядковых мест) двух величин, N — число сравниваемых пар величин двух переменных (х и у).
При сравнении метрических данных используется коэффициент корреляции произведенийпо К. Пирсону (г):
где хi — отклонение индивидуального значения х; х’ — среднее арифметическое; уi — отклонение индивидуального значение у; у' — среднее арифметическое; S — сумма.
Внедрение в научные исследования вычислительной техники позволяет быстро и точно определять любые количественные характеристики любых массивов данных. Разработаны различные программы для ЭВМ, по которым можно проводить соответствующий статистический анализ практически любых выборок. Из массы статистических приемов в психологии наибольшее распространение получили следующие:
1) комплексное вычисление статистик;
2) корреляционный анализ;
3) дисперсионный анализ;
4) регрессионный анализ;
5) факторный анализ;
6) таксономический (кластерный) анализ;
7) шкалирование.
Корреляционный анализ
Корреляционный анализ сводится к вычислению коэффициентов корреляции в самых разнообразных соотношениях между переменными. Соотношения задаются исследователем, а переменные равнозначны, то есть, что является причиной, а что следствием, установить через корреляцию невозможно. Кроме тесноты и направленности связей метод позволяет установить форму связи (линейность, нелинейность). Надо заметить, что нелинейные связи не поддаются анализу общепринятыми в психологии математическими и статистическими методами. Данные, относящиеся к нелинейным зонам (например, в точках разрыва связей, в местах скачкообразных изменений), характеризуют через содержательные описания, воздерживаясь от формально-количественного их представления. Иногда для описания нелинейных явлений в психологии удается применить непараметрические математико-статистические методы и модели. Например, используется математическая теория катастроф.
Для эффективного использования вычисленных коэффициентов корреляции необходимо представить имеющуюся числовую информацию в подходящем виде. Прежде всего, надо выделить коэффициенты корреляции, величина которых превышает критические значения. В психологии чаще всего рассматривают два уровня достоверности: 0,05 и 0,01. Целесообразно выделить среди прочих коэффициенты корреляции, превышающие эти уровни достоверности. Можно подчеркнуть коэффициенты с достоверностью 0,05 одной чертой или отметить одной звездочкой, а с достоверностью 0,01 — двумя. Удобно использовать и цветовое кодирование.
Если после этого выделения обнаружилось, что значимых коэффициентов корреляции (превышающих уровень 0,05 или 0,01) довольно много, то для дальнейшего анализа более удобна полная матрица интеркорреляций. Поэтому, если в принтерной распечатке содержится только половина матрицы, отделенная от другой половины главной диагональю, то ее надо восстановить до полного вида.
Матрица интеркорреляций оцифрована только номерами признаков и содержит только коэффициенты корреляции каждого признака с каждым. Испытуемые и их порядковые номера в таблице исходных данных в ней не представлены.
Поскольку матрица интеркорреляций симметрична относительно своей главной диагонали (проходящей из левого верхнего угла в правый нижний), то ее при восстановлении надо «опрокинуть», повернуть относительно этой оси симметрии. Обычно в распечатке каждая строчка начинается с номера признака, затем написано 1,0 — это коэффициент корреляции данного признака с самим собой. Затем напечатан коэффициент корреляции данного признака со следующим по порядковому номеру и далее коэффициенты корреляции с остальными признаками.
Пример. Получена распечатка1:
1 Нули перед десятичной точкой опущены.
1*1.0.58.30.41.60.40
2*1.0.43.57.65.51
3*1.0.39.38.41
4* 1.0 .60 .38
5*1.0.35
6* 1.0
Заполним половину матрицы, используя полученные данные.