Лекции 15. Элементы теории корреляции

Пусть по выборке объема п получено эмпирическое распределение:

Варианты x1 x2 xm
Эмпирические (наблюдаемые) частоты n1 n2 nm

По данным наблюдений выдвигают гипотезу о законе распределения генеральной совокупности, например, предполагают, что генеральная совокупность распределена равномерно или нормально. Такие гипотезы называют статистическими. Затем для тех же объектов, которые попали в выборку, вычисляют частоты, исходя уже из теоретической гипотезы. В результате получают частоты (их называют выравнивающими (теоретическими) частотами), которые, вообще говоря, отличаются от наблюдавшихся. Как определить, правильно или нет выдвинута гипотеза, т. е. случайны ли расхождения наблюдавшихся и выравнивающих частот или эти расхождения являются следствием неправильности гипотезы? Для решения этого вопроса применяют критерии согласия эмпирических наблюдений выдвинутой гипотезе. Имеется несколько критериев согласия: Лекции 15. Элементы теории корреляции - student2.ru (хи-квадрат) К. Пирсона, Колмогорова, Смирнова и др.

Критерии согласия и позволяют оценить вероятность того, что полученная выборка не противоречит сделанному предположению о виде закона распределения рассматриваемой случайной величины.

В различных критериях согласия в качестве меры расхождения статистического и теоретического законов распределения принимают различные величины.

В критерии согласия Пирсона (критерий χ2) за меру расхождения принимается величина χ2, опытное значение Лекции 15. Элементы теории корреляции - student2.ru которой определяется Лекции 15. Элементы теории корреляции - student2.ru , где l – число разрядов, на которые разбиты все опытные значения величины χ, n – объем выборки, mi – численность i-го разряда, pi – вергоятность попадания случайной величины X в интервал i-го разряда, вычисленная для теоретического закона распределения.

При Лекции 15. Элементы теории корреляции - student2.ru закон распределения Лекции 15. Элементы теории корреляции - student2.ru независимо от вида закона распределения случайной величины стремится к закону χ2- распределения с k=l-r-1степенями свободы, где r– число параметров теоретического распределения, вычисляется по данной выборке.

Значения вероятностей Лекции 15. Элементы теории корреляции - student2.ru в зависимости от Лекции 15. Элементы теории корреляции - student2.ru и k приведены в таблице.

Для применения критерия согласия Пирсона в общем случае необходимо, чтобы объем выборки n и численность разрядов Лекции 15. Элементы теории корреляции - student2.ru были достаточно велики (практически считается достаточным, чтобы было Лекции 15. Элементы теории корреляции - student2.ru )

Рассмотрим суть критерия Лекции 15. Элементы теории корреляции - student2.ru Пирсона.

Предположим, что на основе приведенного выше распределения выдвинута гипотеза Н: генеральная совокупность имеет нормальное распределение. Для вычисления выравнивающих частот поступают следующим образом:

1. Находят значения Лекции 15. Элементы теории корреляции - student2.ru , Лекции 15. Элементы теории корреляции - student2.ru

2. Выравнивающие частоты Лекции 15. Элементы теории корреляции - student2.ru ищут по формуле: Лекции 15. Элементы теории корреляции - student2.ru , где п- сумма наблюдавшихся частот, h- разность между двумя соседними вариантами, Лекции 15. Элементы теории корреляции - student2.ru и Лекции 15. Элементы теории корреляции - student2.ru .

В результате получено множество выравнивающих частот Лекции 15. Элементы теории корреляции - student2.ru .

Обозначим через Лекции 15. Элементы теории корреляции - student2.ru сумму квадратов разностей между эмпирическими и выравнивающими частотами, деленных на соответствующие выравнивающие частоты Лекции 15. Элементы теории корреляции - student2.ru .

Для данной выборке по этой формуле находим значение случайной величины Лекции 15. Элементы теории корреляции - student2.ru . Обозначим его через Лекции 15. Элементы теории корреляции - student2.ru . Затем определяем число Лекции 15. Элементы теории корреляции - student2.ru , называемое числом степеней свободы, где т- число различных вариант выборки.

Теперь проверка гипотезы Н проводится следующим образом: задаемся уровнем значимости р, т. е. столь малой вероятностью р, при которой о событии Лекции 15. Элементы теории корреляции - student2.ru , имеющем вероятность р, можно с большой уверенностью сказать, что в единичном испытании оно не произойдет. В таблице значений Лекции 15. Элементы теории корреляции - student2.ru по заданному уровню значимости р и числу степеней свободы к находят значение Лекции 15. Элементы теории корреляции - student2.ru . Если окажется, что Лекции 15. Элементы теории корреляции - student2.ru , то гипотеза Н отвергается на уровне значимости р, так как произошло событие, которое не должно произойти при верной гипотезе Н; если же Лекции 15. Элементы теории корреляции - student2.ru , то Н принимается на уровне значимости р. Обычно в качестве р берут либо 0,05, либо 0,01, либо 0,001.

Если каждому значению одной случайной величины соответствует значение другой, то случайные величины связаны функциональной зависимостью. Однако такая строгая зависимость реализуется весьма редко, т.к. очень часто оба признака (или один из них) подвержены еще действиям случайных факторов, причем среди этих факторов могут быть и общие для обоих признаков. В этом случае и возникает другой вид зависимости – корреляционная зависимость.

Определение 1. Две случайные величины Х и Y находятся в корреляционной зависимости, если каждому значению любой из этих величин соответствует определенное распределение вероятностей другой величины.

Определение 2. Условным математическим ожиданием дискретной случайной величины Х при Y=y (у-определенное возможное значение Y) называют сумму произведений возможных значений величины Х на их условные вероятности: Лекции 15. Элементы теории корреляции - student2.ru , где Лекции 15. Элементы теории корреляции - student2.ru - условная вероятность равенства Х=xi при условии, что Y=y.

Для непрерывных величин Лекции 15. Элементы теории корреляции - student2.ru , где Лекции 15. Элементы теории корреляции - student2.ru - плотность вероятности случайной непрерывной величины Х при условии Y=y.

Условное математическое ожидание Лекции 15. Элементы теории корреляции - student2.ru есть функция от у: Лекции 15. Элементы теории корреляции - student2.ru , которую называют функцией регрессии величины Х на величину Y.

Корреляционная зависимость проявляется в том, что при изменении одной величины, изменяется условное математическое другой.

Аналогично определяется условное математическое ожидание случайной величины Y и функция регрессии Y на Х: Лекции 15. Элементы теории корреляции - student2.ru .

Уравнение Лекции 15. Элементы теории корреляции - student2.ru ( Лекции 15. Элементы теории корреляции - student2.ru ) называют уравнением регрессии Х на Y (Y на Х), а линию на плоскости, соответствующую этому уравнению, называют линией регрессии.

Линия регрессии Y на Х (Х на Y) показывает, как в среднем зависит Y от Х (Х от Y).

Для характеристики корреляционной зависимости между случайными величинами вводится понятие коэффициента корреляции.

Определение 1. Если Х и Y- независимые случайные величины, то Лекции 15. Элементы теории корреляции - student2.ru .

Если же Х и Y не являются независимыми случайными величинами, то Лекции 15. Элементы теории корреляции - student2.ru .

За меру связи (зависимости) двух случайных величин Х и Y приминают безразмерную величину r, определяемую соотношением: Лекции 15. Элементы теории корреляции - student2.ru или более кратко соотношением: Лекции 15. Элементы теории корреляции - student2.ru , где Лекции 15. Элементы теории корреляции - student2.ru , Лекции 15. Элементы теории корреляции - student2.ru и называемую коэффициентом корреляции.

При этом Лекции 15. Элементы теории корреляции - student2.ru

Определение 2. Случайные величины Х и Y называют некоррелированными, если r=0, и коррелированными, если Лекции 15. Элементы теории корреляции - student2.ru .

Свойства коэффициента корреляции:

1. Если Х и Y- независимые случайные величины, то коэффициент корреляции равен нулю.

2. Коэффициент корреляции по абсолютной величине не превышает единицы, т.е. Лекции 15. Элементы теории корреляции - student2.ru , причем, чем ближе Лекции 15. Элементы теории корреляции - student2.ru к единице, тем больше корреляционная зависимость между Лекции 15. Элементы теории корреляции - student2.ru и Лекции 15. Элементы теории корреляции - student2.ru приближается к линейной, а при Лекции 15. Элементы теории корреляции - student2.ru случайные величины связаны линейной функциональной зависимостью.

3. Коэффициент корреляции характеризует относительную величину отклонения математического ожидания произведения Лекции 15. Элементы теории корреляции - student2.ru от произведения математических ожиданий Лекции 15. Элементы теории корреляции - student2.ru величин Х и Y. Так как это отклонение имеет место только для зависимых величин, то коэффициент корреляции характеризует тесноту зависимости между Х и Y.

Определение. Корреляционная зависимость между случайными величинами Х и Y называется линейной корреляцией, если обе функции регрессии Лекции 15. Элементы теории корреляции - student2.ru и Лекции 15. Элементы теории корреляции - student2.ru являются линейными. В этом случае обе линии регрессии являются прямыми; они называются прямыми регрессиями.

Выведем уравнение прямой линии регрессии Y на Х, т. е. найдем коэффициент линейной функции Лекции 15. Элементы теории корреляции - student2.ru .

Обозначим Лекции 15. Элементы теории корреляции - student2.ru . Используя свойства математического ожидания, найдем:

Лекции 15. Элементы теории корреляции - student2.ru или Лекции 15. Элементы теории корреляции - student2.ru .

Полученный коэффициент называют коэффициентом регрессии Y на Х и обозначают Лекции 15. Элементы теории корреляции - student2.ru : Лекции 15. Элементы теории корреляции - student2.ru

Таким образом, уравнение прямой регрессии Y на Х имеет вид Лекции 15. Элементы теории корреляции - student2.ru . Аналогично можно получить уравнение прямой регрессии Х на Y: Лекции 15. Элементы теории корреляции - student2.ru , где коэффициент регрессии Х на Y: Лекции 15. Элементы теории корреляции - student2.ru

Уравнения прямых регрессии можно записать в более симметричном виде, если воспользоваться коэффициентом корреляции: Лекции 15. Элементы теории корреляции - student2.ru и поэтому уравнения прямых регрессий принимают вид: Лекции 15. Элементы теории корреляции - student2.ru

Из уравнений прямых регрессии видно, что обе эти прямые проходят через точку Лекции 15. Элементы теории корреляции - student2.ru ; угловые коэффициенты прямых регрессии равны соответственно: Лекции 15. Элементы теории корреляции - student2.ru .

Так как Лекции 15. Элементы теории корреляции - student2.ru , то Лекции 15. Элементы теории корреляции - student2.ru . Это означает, что прямая регрессия Y на Х имеет меньший наклон к оси абсцисс, чем прямая Х на Y. Чем ближе Лекции 15. Элементы теории корреляции - student2.ru к 1, тем меньше угол между прямыми регрессии. Эти прямые сливаются тогда и только тогда, когда Лекции 15. Элементы теории корреляции - student2.ru .

При Лекции 15. Элементы теории корреляции - student2.ru прямые регрессии имеют уравнения Лекции 15. Элементы теории корреляции - student2.ru . В этом случае Лекции 15. Элементы теории корреляции - student2.ru ; Лекции 15. Элементы теории корреляции - student2.ru .

Коэффициенты регрессии имеют тот же знак, что и коэффициент корреляции r, и связаны соотношением: Лекции 15. Элементы теории корреляции - student2.ru .

Наши рекомендации