Коэффициент корреляции

1. Пусть с испытанием связаны случайные величины x1,x2 с числовыми характеристиками (а1,s1), (а2,s2). Ковариацией случайных величин x1, x2 называется число

cov (x1, x2) = M [(x1 – a1) (x2 – a2)].

Из определения следует: в дискретном случае

Коэффициент корреляции - student2.ru (22)

в непрерывном случае

cov (x1, x2) = Коэффициент корреляции - student2.ru . (23)

Укажем основные свойства ковариации.

10. cov (x, x) = dx.

20. cov (x1, x2) = M [x1, x2]-а1а2.

30. Если x1, x2 независимы, то cov (x1, x2)=0.

40. |cov (x1, x2) | ≤ s1· s2 .

50. Если в 40 имеет место равенство: |cov(x1,x2)| =s1· s2, то между x1,x2 имеется линейная функциональная связь:

Аx1 + Вx2 + С = 0 при некоторых А,В,С.

Геометрически это означает, что реализации случайной точки (x1, x2) с достоверностью ложатся на прямую Ах + By + С = 0.

Докажем свойства 10 – 40.

1. cov (x, x)= M [(x – a) (x – a)]= dx.

2. cov (x1, x2) = M [(x1x2– a1x2 – a2x1 + a1a2] =M [x1·x2] – a1M [x2] – a2M [x1] + a­1 · a2 = M [x1 · x2] – a­1 · a2 – a­2· a1 + a­1 · a2 = M [x1 · x2] – a1 · a2.

3. Из независимости x1,x2 следует независимость случайных величин x1–a1, x2–a2. Так как математическое ожидание произведения независимых случайных величин равно произведению их математических ожиданий, то имеем

cov (x1, x2) = M (x1 – a1) M (x2 – a2)=(M[x1]– a1) (M[x2]– a2)= =(a1 – a1)( a2 – a2)=0.

4. Доказательство этого свойства проведем для непрерывного случая. Представим указанную в начале параграфа интегральную формулу для ковариации в виде

Коэффициент корреляции - student2.ru

где обозначено

Коэффициент корреляции - student2.ru

(для удобства записи пределы интегрирования опущены). Воспользуемся известным фактом математического анализа-неравенством Буняковского: для любых непрерывных φ1, φ2 и любой области D

Коэффициент корреляции - student2.ru

Отсюда следует:

Коэффициент корреляции - student2.ru

Имеем:

Коэффициент корреляции - student2.ru

В этом вычислении учтено свойство 50 плотности вероятности f(х,у) и определение дисперсии непрерывной случайной величины. Аналогично найдем

Коэффициент корреляции - student2.ru

Таким образом

Коэффициент корреляции - student2.ru

что и требовалось.

2. На практике при изучении совместных свойств случайных величин, как правило, пользуются нормированной ковариацией или коэффициентом корреляции:

Коэффициент корреляции - student2.ru (24)

Из свойств ковариации вытекают следующие свойства коэффициента корреляции.

10. -1 ≤ r ≤ 1.

20. Если r = ± 1, то между x1, x2 имеется линейная функциональная связь (рис.26). Уравнение прямой вычисляется по параметрам (а1, а2, σ1, σ2, r).

Коэффициент корреляции - student2.ru

30. Если x1, x2 независимы, то r = 0.

Замечание 1. Из 10-30 следует, что коэффициент корреляции (и, соответственно, ковариации) является некой мерой связи между x1, x2. Более подробные рассмотрения показывают следующее. Если ׀ r׀ » 1, то связь между x1, x2 близка к линейной функциональной: реализации случайной точки (x1,x2) с практической достоверностью ложатся вблизи заранее прогнозируемой прямой Ах + By + С = 0. Если r » 0, то либо x1, x2 независимы, либо связь между ними имеется, но далека от линейной связи.

Помнить: коэффициент корреляции является мерой линейной связи между случайными величинами.

Замечание 2. В силу свойства 30 из независимости случайных величин x1,x2 следует r=0. Обратное утверждение неверно: имеются примеры, когда r=0 и при этом x1, x2 зависимы. Укажем важный частный случай, когда из r = 0 следует независимость x1, x2. Будем говорить, что случайные величины x1,x2 имеют совместное нормальное распределение с параметрами (а1, σ1, а2, σ2, r), если плотность вероятности случайной точки (x1, x2) дается формулой

Коэффициент корреляции - student2.ru (25)

где

Коэффициент корреляции - student2.ru Можно показать, что а1, а2 – математические ожидания, σ1, σ2 – СКО случайных величин x1, x2, r- коэффициент корреляции.

Коэффициент корреляции - student2.ru (26)

где

Коэффициент корреляции - student2.ru , Коэффициент корреляции - student2.ru

Нетрудно показать, используя свойство 50 плотности вероятности f(x,y), что f1(x), f2(y) – плотности вероятности случайных величин x1, x2; поэтому в силу свойства 60 f(x,y) x1, x2 независимы.

Помнить: в нормальном случае коэффициент корреляции является точной мерой связи между x1, x2.

Замечание 3. Числа (а1, σ1, а2, σ2, r) называются числовыми характеристиками случайной точки (x1, x2). Пары (а1, σ1), (а2, σ2) характеризуют отдельно x1, x2; r является мерой связи между x1, x2. В непрерывном случае параметр r вычисляется по формулам (23), (24), остальные параметры – по формулам

Коэффициент корреляции - student2.ru Коэффициент корреляции - student2.ru Коэффициент корреляции - student2.ru

Коэффициент корреляции - student2.ru Коэффициент корреляции - student2.ru

Пример 1. Найти числовые характеристики случайной точки (x1, x2) в ситуации примера на стр.57.

Решение. Имеем

Коэффициент корреляции - student2.ru

Коэффициент корреляции - student2.ru s1 = s2 = Коэффициент корреляции - student2.ru .

Коэффициент корреляции найдем по формулам (22), (24) с учетом свойства 20 для ковариации. Имеем

M [x1 · x2] = Коэффициент корреляции - student2.ru =

Коэффициент корреляции - student2.ru откуда

Коэффициент корреляции - student2.ru .

Пример 2. Найти числовые характеристики случайной точки (x1, x2) в ситуации примера на стр. 60.

Решение. Имеем

а1 = а2 = 1, D1 = D2 = Коэффициент корреляции - student2.ru , s1 = s2 = Коэффициент корреляции - student2.ru .

Коэффициент корреляции найдем по формулам (23), (24)

cov (x1, x2) = Коэффициент корреляции - student2.ru

Коэффициент корреляции - student2.ru откуда

Коэффициент корреляции - student2.ru .

Наши рекомендации