Тема 6. корреляционная связь и ее статистические изучение
Корреляционная связь – связь, проявляющаяся в массе явлений в средних величинах, в форме тенденции.
В результате анализ сущности изучаемых явлений и причинно- следственных связей устанавливается результативный показатель (у), факторы его изменения (х1; х2; х3…хп). Связь двух признаков (у и х) называется парной корреляцией. Влияние нескольких факторов на результативный признак называется множественной корреляцией.
По направлению связи могут быть прямые и обратные. При прямых связях с увеличением признака х увеличивается и признак (у), при обратных – с увеличением признака х признак у уменьшается.
Для установления наличия корреляционной связи используются: параллельное сопоставление рядов результативного и факторного признака, графическое изображение фактических данных с помощью поля корреляции построения корреляционной таблицы.
После установления факта наличия связи и ее формы, измеряется степень тесноты связи и проводится оценка ее существенности.
Для определения тесноты парной линейной зависимости служит линейный коэффициент корреляции (r), при любой форме зависимости (линейной, криволинейной) – эмпирическое корреляционное отношение ( ).
Для расчета линейного коэффициента корреляции:
, где
, где ; r от –1 до +1.
Хозяйства | х | у | ху | х2 | у2 |
. . 15, 20, 30 | |||||
Итого | ∑х | ∑у | ∑ху | ∑х2 | ∑у2 |
Корреляционное отношение определяется по формулам:
;
где - межгрупповая дисперсия результативного признака, вызванная влиянием признака фактора;
- общая дисперсия результативного признака;
- средняя внутригрупповая дисперсия результативного признака.
- среднее значение результативного признака в соответствующих группах, выделенного по величине признака – фактора.
- общая средняя всей совокупности.
n – число единиц в соответствующей группе.
- внутригрупповая дисперсия.
Коэффициент рангов Спирмена:
, где
d – разность между величинами рангов признака – фактора и результативного признака;
n – число показателей рангов изучаемого ряда.
Он варьирует в процессе от –1 до +1.
Коэффициент ассоциации Д. Юла или коэффициент контингенции К. Пирсона по расчетной таблице (4 поля).
Признаки | А (да) | (нет) | Итого |
В (да) | а | в | а + в |
(нет) | с | d | c + d |
Итого | а +с | в + d | n |
a, в, с, d – частоты взаимного сочетания двух альтернативных признаков.
n – общая сумма частот.
Коэффициент ассоциации
Коэффициент контингенции
Коэффициент множественной корреляции (от двух факторных признаков) имеет вид:
если зависимость выражена уравнением , то система нормальных уравнений следующая:
Мерой достоверности уравнения является процентное отношение средней квадратической ошибки уравнения к среднему уровню результативного показателя, так же как и в случае парной корреляции.
Пример решения задачи
Задача 1. (анализ прямолинейной связи при парной корреляции). Имеются данные о квалификации и месячной выработке пяти рабочих:
Для изучения связи между квалификацией рабочих и их выработкой определить линейное уравнение связи и коэффициент корреляции. Дать интерпретацию коэффициентам регрессии и корреляции.
Решение. Расширим предлагаемую таблицу.
Определим параметры уравнения прямой yx = a +bx. Для этого решим систему уравнений:
Здесь п = 5.
Значит коэффициент регрессии равен 18.
Поскольку в - положительное число, то имеется прямая связь между параметрами x и у.
а=92-4×18
а=20
Линейное уравнение связи имеет вид ух=20+18х.
Для определения тесноты (силы) связи между изучаемыми признаками определим величину коэффициента корреляции по формуле:
= (2020-20×460/5)/(√10×√3280) ≈ 180/181,11=0,99. Поскольку коэффициент корреляции больше 0,7, то связь в данном ряду сильная.