Коэффициент корреляции

Корреляцией называют параллельную вариацию двух величин. Предположим, что разрабатывается тест для предсказания успеваемости в колледже. Если это хороший тест, высокие показатели в нем должны связываться с высокой успеваемостью в колледже, а низкие — с низкой успеваемостью. Коэффициент корреляции позволяет точнее установить степень этой связи.

Корреляция как произведение моментов

Чаще всего коэффициент корреляции определяется методом произведения моментов; получаемый в результате индекс обычно обозначается маленькой буквой r. Вычисленный через произведение моментов коэффициент r варьируется между полной положительной корреляцией (r = +1,00) и полной отрицательной корреляцией (r = -1,00). Отсутствие всякой связи дает r = 0,00.

Корреляция вычисляется через произведение моментов по формуле:

Коэффициент корреляции - student2.ru

Здесь одну из парных мер называют x-показателем, а другую y-показателем, dx и dy — это отклонения каждого показателя от среднего; N — количество парных величин, а σx и σy — стандартные отклонения x-показателей и y-показателей.

Для определения коэффициента корреляции надо определить сумму произведений (dx) x (dy). Эту сумму вместе с вычисленными стандартными отклонениями для х-показателей и y-показателей можно затем подставить в формулу.

Пример вычисления корреляции через произведение моментов.Предположим, мы собрали данные, показанные в табл. П6. Для каждого испытуемого получено два показателя; первый — оценка на вступительных экзаменах (ее мы произвольно назовем x-показателем), а второй — оценки за первый курс (y-показатель).

Таблица П6. Вычисление корреляции через произведение моментов

Студент Вступительный экзамен (x-оценка) Оценка в конце года (y-оценка) (dx) (dy) (dx) x (dy)
Андрей +54
Борис -3 -6
Владимир
Григорий -2
Дмитрий -6 -9 +54
Сумма + 102
Среднее      

σx = 4, σy = 6

Коэффициент корреляции - student2.ru

На рис. П6 показан точечный график этих данных. Каждая точка отражает x-показатель и y-показатель данного человека; например, верхняя точка справа означает Андрея. Глядя на эти данные, легко обнаружить, что между х- и у-показателями существует некоторая положительная корреляция. Андрей получил наивысшую оценку на вступительном экзамене и также получил наивысшую отметку за 1-й курс; Дмитрий получил и там, и там самую низкую отметку. В показателях других студентов есть немного нерегулярности, так что мы знаем, что корреляция не полная; следовательно, r меньше 1,00.

Коэффициент корреляции - student2.ru

Рис. П6. Точечная диаграмма.Каждая точка отражает х- и у-показатели определенного учащегося.

Мы подсчитаем корреляцию, чтобы проиллюстрировать этот метод, хотя на практике ни один исследователь не станет считать корреляцию для столь малого количества показателей. Подробности приведены в табл. П6. Согласно процедуре, приведенной в табл. П3, мы вычисляем стандартное отклонение x-показателей, а затем стандартное отклонение y-показателей. Затем мы вычисляем произведение (dx) x (dy) для каждого человека и для 5 случаев в общем. Подставляя полученные числа в уравнение, получаем r = +0.85.

Наши рекомендации