Коэффициент корреляции
1. Пусть с испытанием связаны случайные величины x1,x2 с числовыми характеристиками (а1,s1), (а2,s2). Ковариацией случайных величин x1, x2 называется число
cov (x1, x2) = M [(x1 – a1) (x2 – a2)].
Из определения следует: в дискретном случае
(22)
в непрерывном случае
cov (x1, x2) = . (23)
Укажем основные свойства ковариации.
10. cov (x, x) = dx.
20. cov (x1, x2) = M [x1, x2]-а1а2.
30. Если x1, x2 независимы, то cov (x1, x2)=0.
40. |cov (x1, x2) | ≤ s1· s2 .
50. Если в 40 имеет место равенство: |cov(x1,x2)| =s1· s2, то между x1,x2 имеется линейная функциональная связь:
Аx1 + Вx2 + С = 0 при некоторых А,В,С.
Геометрически это означает, что реализации случайной точки (x1, x2) с достоверностью ложатся на прямую Ах + By + С = 0.
Докажем свойства 10 – 40.
1. cov (x, x)= M [(x – a) (x – a)]= dx.
2. cov (x1, x2) = M [(x1x2– a1x2 – a2x1 + a1a2] =M [x1·x2] – a1M [x2] – a2M [x1] + a1 · a2 = M [x1 · x2] – a1 · a2 – a2· a1 + a1 · a2 = M [x1 · x2] – a1 · a2.
3. Из независимости x1,x2 следует независимость случайных величин x1–a1, x2–a2. Так как математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий, то имеем
cov (x1, x2) = M (x1 – a1) M (x2 – a2)=(M[x1]– a1) (M[x2]– a2)= =(a1 – a1)( a2 – a2)=0.
4. Доказательство этого свойства проведем для непрерывного случая. Представим указанную в начале параграфа интегральную формулу для ковариации в виде
где обозначено
(для удобства записи пределы интегрирования опущены). Воспользуемся известным фактом математического анализа-неравенством Буняковского: для любых непрерывных φ1, φ2 и любой области D
Отсюда следует:
Имеем:
В этом вычислении учтено свойство 50 плотности вероятности f(х,у) и определение дисперсии непрерывной случайной величины. Аналогично найдем
Таким образом
что и требовалось.
2. На практике при изучении совместных свойств случайных величин, как правило, пользуются нормированной ковариацией или коэффициентом корреляции:
(24)
Из свойств ковариации вытекают следующие свойства коэффициента корреляции.
10. -1 ≤ r ≤ 1.
20. Если r = ± 1, то между x1, x2 имеется линейная функциональная связь (рис.26). Уравнение прямой вычисляется по параметрам (а1, а2, σ1, σ2, r).
30. Если x1, x2 независимы, то r = 0.
Замечание 1. Из 10-30 следует, что коэффициент корреляции (и, соответственно, ковариации) является некой мерой связи между x1, x2. Более подробные рассмотрения показывают следующее. Если ׀ r׀ » 1, то связь между x1, x2 близка к линейной функциональной: реализации случайной точки (x1,x2) с практической достоверностью ложатся вблизи заранее прогнозируемой прямой Ах + By + С = 0. Если r » 0, то либо x1, x2 независимы, либо связь между ними имеется, но далека от линейной связи.
Помнить: коэффициент корреляции является мерой линейной связи между случайными величинами.
Замечание 2. В силу свойства 30 из независимости случайных величин x1,x2 следует r=0. Обратное утверждение неверно: имеются примеры, когда r=0 и при этом x1, x2 зависимы. Укажем важный частный случай, когда из r = 0 следует независимость x1, x2. Будем говорить, что случайные величины x1,x2 имеют совместное нормальное распределение с параметрами (а1, σ1, а2, σ2, r), если плотность вероятности случайной точки (x1, x2) дается формулой
(25)
где
Можно показать, что а1, а2 – математические ожидания, σ1, σ2 – СКО случайных величин x1, x2, r- коэффициент корреляции.
(26)
где
,
Нетрудно показать, используя свойство 50 плотности вероятности f(x,y), что f1(x), f2(y) – плотности вероятности случайных величин x1, x2; поэтому в силу свойства 60 f(x,y) x1, x2 независимы.
Помнить: в нормальном случае коэффициент корреляции является точной мерой связи между x1, x2.
Замечание 3. Числа (а1, σ1, а2, σ2, r) называются числовыми характеристиками случайной точки (x1, x2). Пары (а1, σ1), (а2, σ2) характеризуют отдельно x1, x2; r является мерой связи между x1, x2. В непрерывном случае параметр r вычисляется по формулам (23), (24), остальные параметры – по формулам
Пример 1. Найти числовые характеристики случайной точки (x1, x2) в ситуации примера на стр.57.
Решение. Имеем
s1 = s2 = .
Коэффициент корреляции найдем по формулам (22), (24) с учетом свойства 20 для ковариации. Имеем
M [x1 · x2] = =
откуда
.
Пример 2. Найти числовые характеристики случайной точки (x1, x2) в ситуации примера на стр. 60.
Решение. Имеем
а1 = а2 = 1, D1 = D2 = , s1 = s2 = .
Коэффициент корреляции найдем по формулам (23), (24)
cov (x1, x2) =
откуда
.