Элементы теории корреляции.

Между различного рода признаками, случайными величинами практически всегда существует взаимосвязь. Только иногда эту связь мы замечаем, но в большинстве случаев эти взаимосвязи ускользают от нашего внимания.

В одних случаях получается функциональная связь, когда между признаками Элементы теории корреляции. - student2.ru и существует однозначная зависимость: . Например , и т.д.

В других случаях получается корреляционная зависимость, когда одному значению признака Элементы теории корреляции. - student2.ru соответствуют несколько значений признака . То есть здесь мы имеем дело со статистической связью. Например, связь между ростом человека и его весом, связь между стажем работника и качеством его труда и т.д.

Корреляционная связь между признаками может быть линейной и нелинейной, положительной и отрицательной. Задача корреляционного анализа сводится к установлению формы и направления связи между признаками, измерению ее тесноты и к оценке достоверности выборочных коэффициентов корреляции.

Корреляционным моментом Элементы теории корреляции. - student2.ru случайных величин и называют математическое ожидание произведения отклонений этих величин от своих математических ожиданий:

Элементы теории корреляции. - student2.ru

Корреляционный момент служит для характеристики связи между величинами Элементы теории корреляции. - student2.ru и .

Корреляционный момент равен нулю, если Элементы теории корреляции. - student2.ru и независимы, следовательно, если корреляционный момент не равен нулю, то и — в какой-то степени зависимые случайные величины.

Теорема 1. Корреляционный момент двух независимых случайных величин Элементы теории корреляции. - student2.ru и равен нулю.

Доказательство: т.к. Элементы теории корреляции. - student2.ru и — независимые случайные величины, то их отклонения от своих математических ожиданий и также независимы. Пользуясь свойствами математического ожидания (математическое ожидание произведения независимых случайных величин равно произведению математических ожиданий сомножителей) и отклонения (математическое ожидание отклонения равно нулю), получим

Элементы теории корреляции. - student2.ru

Из определения корреляционного момента следует, что он имеет размерность, равную произведению размерностей величин Элементы теории корреляции. - student2.ru и , т.е. величина корреляционного момента зависит от единиц измерения случайных величин. Поэтому для одних и тех же двух величин величина корреляционного момента имеет различные значения в зависимости от того, в каких единицах были измерены величины.

Такая особенность корреляционного момента является недостатком этой числовой характеристики, т.к. сравнение корреляционных моментов различных систем случайных величин становится затруднительным. Для того чтобы устранить этот недостаток, вводят новую числовую характеристику—коэффициент корреляции Элементы теории корреляции. - student2.ru .

Коэффициентом корреляции случайных величин Элементы теории корреляции. - student2.ru и называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин:

Элементы теории корреляции. - student2.ru

Так как размерность Элементы теории корреляции. - student2.ru равна произведению размерностей величин и , имеет размерность величины , имеет размерность величины , то — безразмерная величина.

Таким образом, величина коэффициента корреляции не зависит от выбора единиц измерения случайных величин. В этом и состоит преимущество коэффициента корреляции перед корреляционным моментом.

Очевидно, коэффициент корреляции независимых случайных величин равен нулю (т.к. Элементы теории корреляции. - student2.ru ).

Абсолютная величина коэффициента корреляции не превышает единицы: Элементы теории корреляции. - student2.ru

На практике мы имеем дело с выборками, а не с генеральными совокупностями. Поэтому на практике рассчитывают выборочный коэффициент корреляции, который может быть достоверным или нет. Выборочный коэффициент корреляции рассчитывается по следующей формуле:

Элементы теории корреляции. - student2.ru (5.10)

Коэффициент корреляции удобный показатель связи, получивший широкое применение в практике. Это отвлеченное число, лежащее в пределах от -1 до +1. При независимом варьировании признаков, когда связь между ними отсутствует, Элементы теории корреляции. - student2.ru . При существует положительная связь между признаками (с ростом растет и ). При - отрицательная связь - с ростом признака признак Элементы теории корреляции. - student2.ru уменьшается. Чем больше по модулю, тем теснее связь между признаками. При между признаками существует функциональная связь.

Лишь один недостаток имеется у этого ценного показателя - он способен характеризовать лишь линейный связи. При наличии нелинейной связи между коррелирующими признаками следует использовать другие показатели.

Выборочный коэффициент корреляции служит оценкой генерального параметра Элементы теории корреляции. - student2.ru , и, как случайная величина, сопровождается ошибками. Поэтому здесь также проверяется гипотеза о значимости выборочного коэффициента корреляции.

Пусть двумерная генеральная совокупность Элементы теории корреляции. - student2.ru распределена нормально. Из этой совокупности извлечены выборки объемом и по ним найден выборочный коэффициент корреляции , который оказался отличным от нуля. Так как выборки отобраны случайно, еще нельзя заключить, что коэффициент корреляции генеральной совокупности Элементы теории корреляции. - student2.ru также отличен от нуля. А, поскольку нас интересует именно этот коэффициент, возникает необходимость при заданном уровне значимости Элементы теории корреляции. - student2.ru проверить нулевую гипотезу : о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе : .

Если нулевая гипотеза отвергается, значит, выборочный коэффициент корреляции значимо отличается от нуля (кратко говоря, значим), а Элементы теории корреляции. - student2.ru и коррелированны, т. е. связаны линейной зависимостью.

Если же нулевая гипотеза будет принята, значит, выборочный коэффициент корреляции является незначимым, а Элементы теории корреляции. - student2.ru и некоррелированные, т. е. не связаны линейной зависимостью.

В качестве критерия проверки нулевой гипотезы примем случайную величину

Элементы теории корреляции. - student2.ru

Величина Элементы теории корреляции. - student2.ru при справедливости нулевой гипотезы имеет распределение Стьюдента с степенями свободы.

Обозначим значение критерия, вычисленное по данным наблюдений, через Элементы теории корреляции. - student2.ru и сформулируем правило проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне значимости Элементы теории корреляции. - student2.ru проверить нулевую гипотезу : о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе : , надо вычислить наблюдаемое значение критерия:

Элементы теории корреляции. - student2.ru (5.11)

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней свободы Элементы теории корреляции. - student2.ru найти критическую точку .

Если Элементы теории корреляции. - student2.ru — нет оснований отвергнуть нулевую гипотезу, если - то ее отвергают.

В то время как задача корреляционного анализа - установить, являются ли данные случайные величины взаимосвязанными, цель регрессионного анализа - описать эту связь аналитической зависимостью, т.е. с помощью уравнения. Мы рассмотрим самый несложный случай, когда связь между точками на графике может быть представлена прямой линией. Уравнение этой прямой линии Элементы теории корреляции. - student2.ru , где

Элементы теории корреляции. - student2.ru , (5.12)

Зная уравнение прямой, мы можем находить значение функции по значению аргумента в тех точках, где значение Элементы теории корреляции. - student2.ru известно, а - нет. Эти оценки бывают очень нужны, но они должны использоваться осторожно, особенно, если связь между величинами не слишком тесная. Отметим также, что из сопоставления формул для Элементы теории корреляции. - student2.ru и видно, что коэффициент не дает значение наклона прямой, а лишь показывает сам факт наличия связи.

7. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.

Ранее предполагалось, что закон распределения генеральной совокупности известен. Если же он неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его Элементы теории корреляции. - student2.ru ), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону .

Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины — критерия согласия.

Критерием согласия Элементы теории корреляции. - student2.ru называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.

Имеется несколько критериев согласия, но мы ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для др. распределений). Для этого будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.

Обычно эмпирические и теоретические частоты различаются. Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.

Критерий Пирсона отвечает на вопрос «Случайно ли расхождение частот?». Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Итак, пусть по выборке объема Элементы теории корреляции. - student2.ru получено эмпирическое распределение: варианты - : , эмпирические частоты - : .

Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты Элементы теории корреляции. - student2.ru . При уровне значимости требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.

В качестве критерия проверки нулевой гипотезы примем случайную величину

Элементы теории корреляции. - student2.ru .

Эта величина случайная, т.к. в различных опытах она принимает различные, заранее не известные значения. Ясно, что, чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия, и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.

Стоит заметить, что возведение в квадрат разностей частот устраняет возможность взаимного погашения положительных и отрицательных разностей. Делением на Элементы теории корреляции. - student2.ru достигают уменьшения каждого из слагаемых – иначе сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже тогда, когда она справедлива.

Доказано, что при Элементы теории корреляции. - student2.ru закон распределения случайной величины независимо от того, к какому закону распределения подчинена генеральная совокупность, стремится к закону распределения Элементы теории корреляции. - student2.ru с степенями свободы. Поэтому случайная величина обозначена через , а сам критерий называют критерием согласия «хи квадрат».

Число степеней свободы находят по равенству Элементы теории корреляции. - student2.ru , где — число групп выборки; — число параметров предполагаемого распределения, которые оценены по данным выборки.

В частности, если предполагаемое распределение — нормальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому Элементы теории корреляции. - student2.ru и число степеней свободы .

Так как односторонний критерий более жестко отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости Элементы теории корреляции. - student2.ru :

Элементы теории корреляции. - student2.ru .

Правило: для того чтобы при заданном уровне значимости проверить нулевую гипотезу Элементы теории корреляции. - student2.ru (генеральная совокупность распределена нормально), надо сначала вычислить теоретические частоты, а затем наблюдаемое значение критерия:

Элементы теории корреляции. - student2.ru

и по таблице критических точек распределения Элементы теории корреляции. - student2.ru , по заданному уровню значимости и числу степеней свободы найти критическую точку . Если — нет оснований отвергнуть нулевую гипотезу, если Элементы теории корреляции. - student2.ru — нулевую гипотезу отвергают.