Корреляционная связь, её виды
Из школьного курса математики известно о функциональных связях, при которых каждому значению аргумента х Х соответствует единственное значение функции у У. Существуют и другие виды связи между переменными, в частности – корреляционная связь.
Корреляционная связь –это согласованные изменения двух (или нескольких) признаков; она отражает тот факт, что изменение одного признака находится в соответствии с изменением другого признака.
В отличие от функциональных в корреляционных связях каждому значению одного признака может соответствовать определенное распределение значений другого признака. При этом, корреляционная связь между двумя признаками не устанавливает, какой из признаков является причиной изменений, а какой – следствием; она только свидетельствует о том, что изменениям одного признака сопутствуют определенные изменения другого признака.
Графиком корреляционной связи является диаграмма рассеивания.
Рассмотрим пример. Допустим, что изучаются две переменные: Х – оценки уровня выносливости и У – достижения в беге у 12 учащихся средней школы. Значения переменной Х представлены оценками теста в 6 классе, а значения переменной У – оценками времени на определенной дистанции у учащихся в 8 классе. Оценки Х и У прилагаются. Исследователя интересует вопрос: есть ли связь между этими оценками?
Решение: Построим диаграмму рассеивания для предварительной оценки связи между этими переменными.
Диаграмма рассеивания – это множество точек на плоскости, имеющих координатами хi Х и уi У, где 1 ≤ i ≤ N, а число N – объем каждой из выборок.
Оценки Х и У заданы таблицей:
Номер учащегося | Оценки Х | Оценки У |
1. | ||
2. | ||
3. | ||
4. | ||
5. | ||
6. | ||
7. | ||
8. | ||
9. | ||
10. | ||
11. | ||
12. |
Для построения диаграммы рассеивания на оси абсцисс откладывают значения переменной Х (коэффициент выносливости), а по оси ординат – значения переменной У (результаты по бегу). Затем отмечают все точки с координатами (хi;; уi). По диаграмме рассеивания уже можно видеть наличие связи между переменными. По построенному графику можно заметить, например, что чем выше значения выносливости, тем выше результаты теста (бег).
Корреляционные связи различаются по форме, направлению и силе. По форме корреляционная связь может быть прямолинейной (пример) и криволинейной, по направлению – прямой и обратной.
Если корреляционная связь прямая, то более высоким значениям одного признака соответствуют более высокие значения другого, а более низким одного – более низкие значения другого. При обратной корреляции – наоборот, более высоким значениям одного соответствуют более низкие значения другого.
Сила (иначе степень, теснота) корреляционной связи определяется по величине так называемого коэффициента корреляции r, который принимает значения на отрезке [-1; +1], то есть -1 ≤ r ≤ +1.
Связь считается:
- сильнойпри 0,7 ≤ |r|
- среднейпри0,5 ≤ |r| < 0,7
- умереннойпри 0,3 ≤ |r|< 0,5
- слабойпри 0,2 ≤ |r| < 0,3
- очень слабойпри |r|< 0,2
Но так как эта классификация не учитывает объема выборки, то нередко в исследованиях используется другая – частная классификация корреляционных связей:
1. высокая значимая корреляция – при |r|, соответствующем уровню статистической значимости ρ ≤ 0,01;
2. значимая корреляция – при |r|, соответствующем уровню статистической значимости ρ ≤ 0,05;
3. тенденция достоверной связи – при |r|, соответствующем уровню статистической значимости ρ ≤ 0,1;
4. незначимая корреляция – при |r|, не достигающем уровня статистической значимости.