Понятие о корреляционной зависимости
Корреляционная связь - это согласованные изменения двух признаков или большего количества признаков (множественная корреляционная связь). Корреляционная связь отражает тот факт, что изменчивость одного признака находится в некотором соответствии с изменчивостью другого.
Корреляционная зависимость - это изменения, которые вносят значения одного признака в вероятность появления разных значений другого признака.
Оба термина – корреляционная связь и корреляционная зависимость – часто используются как синонимы. Между тем, согласованные изменения признаков и отражающая это корреляционная связь между ними может свидетельствовать не о зависимости этих признаков между собой, а зависимости обоих этих признаков от какого-то третьего признака или сочетания признаков, не рассматриваемых в исследовании.
Зависимость подразумевает влияние, связь – любые согласованные изменения, которые могут объясняться сотнями причин. Корреляционные связи не могут рассматриваться как свидетельство причинно-следственной связи, они свидетельствуют лишь о том, что изменениям одного признака, как правило, сопутствуют определенные изменения другого, но находится ли причина изменений в одном из признаков или она оказывается за пределами исследуемой пары признаков, нам неизвестно.
Корреляционные связи различаются по форме, направлению и силе.
По формекорреляционная связь может быть прямолинейной или криволинейной. Прямолинейной может быть, например, связь между количеством тренировок на тренажере и количеством правильно решаемых задач в контрольной сессии. Криволинейной может быть, например, связь между уровнем мотивации и эффективностью выполнения задачи. При повышении мотивации эффективность выполнения задачи сначала возрастает, затем достигается оптимальный уровень мотивации, которому соответствует максимальная эффективность выполнения задачи; дальнейшему повышению мотивации сопутствует уже снижение эффективности
По направлениюкорреляционная связь может быть положительной ("прямой"), если коэффициент корреляции положительный и отрицательной ("обратной"), если коэффициент корреляции отрицательный.
При положительной прямолинейной корреляции более высоким значениям одного признака соответствуют более высокие значения другого, а более низким значениям одного признака - низкие значения другого. При отрицательной корреляции соотношения обратные.
Степень, сила или теснота корреляционной связи определяется по величине коэффициента корреляции.
Силасвязи не зависит от ее направленности и определяется по абсолютному значению коэффициента корреляции. Максимальное возможное абсолютное значение коэффициента корреляции r=1,00; минимальное r=0.
Будем использовать общую классификацию корреляционных связей:
1) сильная, или тесная при коэффициенте корреляции r >0,70;
2) средняя при 0,50< r <0,69;
3) умеренная при 0,30< r <0,49;
4) слабая при 0,20< r <0,29;
5) очень слабая при r <0,19.
Следовательно, чтобы охарактеризовать связь необходимо вычислить коэффициент корреляции. В общем виде формула для подсчета коэффициента корреляции такова: , где хi - значения, принимаемые в выборке X, yi — значения, принимаемые в выборке Y; — средняя по X, — средняя по Y.
Метод ранговой корреляции Спирмена позволяет определить тесноту (силу) и направление корреляционной связи между двумя признаками или двумя профилями (иерархиями)признаков. Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. С этим методом предлагается ознакомиться самостоятельно.
Упражнения
I. С целью контроля за физической подготовленностью:
1) У 35 спортсменов - велосипедистов была измерена высота прыжка с места: 53, 48, 48, 53, 52, 53, 48, 56, 50, 52, 50, 49, 51, 62, 58, 52, 56, 54, 45, 58, 47, 44, 50, 59, 45, 60, 49, 39, 55, 48, 47, 55, 51, 54, 59.
2) У 40 студентов 1курса ФФК был измерен 10 км пробег на лыжах в минутах: 46. 2, 49.0, 45. 8, 45. 4, 52.0, 45. 4, 46. 6, 46. 3, 45.0, 49.3, 47.3, 47.8, 46.0, 47.4, 47.4, 48.4, 47.2, 48.6, 46.5, 45.6, 50.0, 46.5, 45.8, 47. 3, 50.0, 48.0, 49. 4, 47.8, 48.3, 47.8, 48.3, 48.8, 48.6, 47.4, 49.5, 50.3, 48. 4, 50.5, 45.5, 50.0.
3) У 50 студентов 1 курса была измерена длина прыжка с места (см):
225, 235, 240, 235, 240, 235, 230, 280, 265, 235, 245, 260, 265, 266, 255, 255, 265, 276, 254, 265, 244, 276, 230, 266, 245, 254, 245, 255, 235, 256, 257, 244, 238, 247, 234, 261, 255, 258, 230, 255, 248, 257, 239, 251, 246, 277, 242, 241, 238, 237.
4) У 30 конькобежцев-юношей была определена величина кислородного пульса во время теста на максимальное потребление кислорода в мл: 28,0 24,0 28,5 25,5 24,5 24,0 23,0 28,5 25,0 24,5 27,5 24,5 23,5 25,0 23,0 25,0 30,0 26,0 25,5 23,5 26,5 30,0 27,0 26,0 30,0 28,0 27,5 28,0 25,0 28,0.
5) У 50 студентов 1 курса ФФК был измерен 5км пробег на лыжах:
19,7 19,9 20,1 20,1 19,8 19,8 19,9 21,5 20,5 19,6 22,0 21,3 19,8 20,5 20,1 20,4 21,0 19,5 20,8 19,9 20,7 20,4 19,0 19,1 19,8 18,5 20,2 20,5 20,6 19,5 21,2 20,9 19,3 20,8 19,8 19,5 20,7 20,2 19,2 20,9 20,9 19,7 20,2 20,5 20,6 19,5 21,2 19,3 19,5 19,2.
6) У 40 студентов ФФК был измерен 15 км пробег на лыжах:
41,20 45,30 41,10 44,50 42,40 41,15 50,10 43,10 52,20 39,00 39,10 42,50 53,00 46,20 52,30 49,40 51,20 42,10 59,20 50,50 43,40 49,40 57,30.
Задания: 1. Составить интервалы группировки.
2. Найти срединные значения, частоты, накопленные частоты, частости, накопленные частости.
3.Построить гистограмму, полигон частот, полигон накопленных частот. Сделать вывод.
4.Найти числовые характеристики выборки: среднее арифметическое, медиану, моду.
5.Характеристики рассеяния: размах вариации, дисперсию, стандартное отклонение.
II. Существует ли взаимосвязь между показателями веса и количеством подтягиваний на перекладине у 11 исследуемых с помощью расчета коэффициента корреляции, если данные выборок таковы:
xi, кг ~ 51; 50; 48; 51; 46; 47; 49; 60; 51; 52; 56.
yi, кол-раз ~ 13; 15; 13; 16; 12; 14; 12; 10; 18; 10; 12.
III. В следующей таблице работники прошедшие курсы повышения квалификации, ранжированы по профессиональным навыкам до курсов и затем по проявленному после практики трудолюбию. Есть ли польза от курсов, т.е. те, кто их прошёл, стали лучше выполнять работу? Или связи между трудовым навыком до курсов и трудолюбием после них не существует?
Работник | Трудовой навык, X | Трудолюбие, Y |
A B C D E F G H I J K L |
IV. В следующей таблице приведены данные о товарообороте и затратах отдельных магазинов за определённый период. Объяснить, что они показывают. Есть ли связь между двумя признаками.
магазин | затраты, Y (тыс. руб.) | оборот, X (тыс. руб.) |
A B C D E F G H I J |
ЛАБОРАТОРНЫЕ РАБОТЫ (краткое содержание)
Лабораторная работа № 1