Элементы теории корреляции.

Между различного рода признаками, случайными величинами практически всегда существует взаимосвязь. Только иногда эту связь мы замечаем, но в большинстве случаев эти взаимосвязи ускользают от нашего внимания.

В одних случаях получается функциональная связь, когда между признаками Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru существует однозначная зависимость: Элементы теории корреляции. - student2.ru . Например Элементы теории корреляции. - student2.ru , Элементы теории корреляции. - student2.ru и т.д.

В других случаях получается корреляционная зависимость, когда одному значению признака Элементы теории корреляции. - student2.ru соответствуют несколько значений признака Элементы теории корреляции. - student2.ru . То есть здесь мы имеем дело со статистической связью. Например, связь между ростом человека и его весом, связь между стажем работника и качеством его труда и т.д.

Корреляционная связь между признаками может быть линейной и нелинейной, положительной и отрицательной. Задача корреляционного анализа сводится к установлению формы и направления связи между признаками, измерению ее тесноты и к оценке достоверности выборочных коэффициентов корреляции.

Корреляционным моментом Элементы теории корреляции. - student2.ru случайных величин Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru называют математическое ожидание произведения отклонений этих величин от своих математических ожиданий:

Элементы теории корреляции. - student2.ru

Корреляционный момент служит для характеристики связи между величинами Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru .

Корреляционный момент равен нулю, если Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru независимы, следовательно, если корреляционный момент не равен нулю, то Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru — в какой-то степени зависимые случайные вели­чины.

Теорема 1. Корреляционный момент двух независимых случайных величин Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru равен нулю.

Доказательство: т.к. Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru — независимые случайные величины, то их отклонения от своих математических ожиданий Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru также независимы. Пользуясь свойствами ма­тематического ожидания (математическое ожидание про­изведения независимых случайных величин равно произ­ведению математических ожиданий сомножителей) и отклонения (математическое ожидание отклонения равно нулю), получим

Элементы теории корреляции. - student2.ru

Из определения корреляционного момента следует, что он имеет размерность, равную произведению размер­ностей величин Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru , т.е. величина корреляционного момента зависит от единиц измерения случайных величин. Поэтому для одних и тех же двух величин величина корреляционного момента имеет различные значения в зависимости от того, в каких еди­ницах были измерены величины.

Такая особенность корреляционного мо­мента является недостатком этой числовой характеристи­ки, т.к. сравнение корреляционных моментов различных систем случайных величин становится затруд­нительным. Для того чтобы устранить этот недостаток, вводят новую числовую характеристику—коэффициент корреляции Элементы теории корреляции. - student2.ru .

Коэффициентом корреляции случайных величин Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru называют отношение корреляционного момента к произведению средних квадратических отклонений этих величин:

Элементы теории корреляции. - student2.ru

Так как размерность Элементы теории корреляции. - student2.ru равна произведению размер­ностей величин Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru , Элементы теории корреляции. - student2.ru имеет размерность величины Элементы теории корреляции. - student2.ru , Элементы теории корреляции. - student2.ru имеет размерность величины Элементы теории корреляции. - student2.ru , то Элементы теории корреляции. - student2.ru — безразмерная величина.

Таким образом, величина коэффициента корреляции не зависит от выбора единиц измерения случайных величин. В этом и состоит преиму­щество коэффициента корреляции перед корреляционным моментом.

Очевидно, коэффициент корреляции независимых слу­чайных величин равен нулю (т.к. Элементы теории корреляции. - student2.ru ).

Абсолютная величина коэффициента кор­реляции не превышает единицы: Элементы теории корреляции. - student2.ru

На практике мы имеем дело с выборками, а не с генеральными совокупностями. Поэтому на практике рассчитывают выборочный коэффициент корреляции, который может быть достоверным или нет. Выборочный коэффициент корреляции рассчитывается по следующей формуле:

Элементы теории корреляции. - student2.ru (5.10)

Коэффициент корреляции удобный показатель связи, получивший широкое применение в практике. Это отвлеченное число, лежащее в пределах от -1 до +1. При независимом варьировании признаков, когда связь между ними отсутствует, Элементы теории корреляции. - student2.ru . При Элементы теории корреляции. - student2.ru существует положительная связь между признаками (с ростом Элементы теории корреляции. - student2.ru растет и Элементы теории корреляции. - student2.ru ). При Элементы теории корреляции. - student2.ru - отрицательная связь - с ростом признака Элементы теории корреляции. - student2.ru признак Элементы теории корреляции. - student2.ru уменьшается. Чем больше Элементы теории корреляции. - student2.ru по модулю, тем теснее связь между признаками. При Элементы теории корреляции. - student2.ru между признаками существует функциональная связь.

Лишь один недостаток имеется у этого ценного показателя - он способен характеризовать лишь линейный связи. При наличии нелинейной связи между коррелирующими признаками следует использовать другие показатели.

Выборочный коэффициент корреляции служит оценкой генерального параметра Элементы теории корреляции. - student2.ru , и, как случайная величина, сопровождается ошибками. Поэтому здесь также проверяется гипотеза о значимости выборочного коэффициента корреляции.

Пусть двумерная генеральная совокупность Элементы теории корреляции. - student2.ru распределена нормально. Из этой совокупности из­влечены выборки объемом Элементы теории корреляции. - student2.ru и по ним найден выборочный коэффициент корреляции Элементы теории корреляции. - student2.ru , который оказался отличным от нуля. Так как выборки отобраны случайно, еще нельзя заключить, что коэффициент корреляции генераль­ной совокупности Элементы теории корреляции. - student2.ru также отличен от нуля. А, поскольку нас интересует именно этот коэффициент, возникает необходимость при заданном уровне значи­мости Элементы теории корреляции. - student2.ru проверить нулевую гипотезу Элементы теории корреляции. - student2.ru : Элементы теории корреляции. - student2.ru о равен­стве нулю генерального коэффициента корреляции при конкурирующей гипотезе Элементы теории корреляции. - student2.ru : Элементы теории корреляции. - student2.ru .

Если нулевая гипотеза отвергается, значит, выборочный коэффициент корреляции значимо отли­чается от нуля (кратко говоря, значим), а Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru коррелированны, т. е. связаны линейной зависимостью.

Если же нулевая гипотеза будет принята, значит, выбо­рочный коэффициент корреляции является незначимым, а Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru некоррелированные, т. е. не связаны линейной зависимостью.

В качестве критерия проверки нулевой гипотезы при­мем случайную величину

Элементы теории корреляции. - student2.ru

Величина Элементы теории корреляции. - student2.ru при справедливости нулевой гипотезы имеет распределение Стьюдента с Элементы теории корреляции. - student2.ru степенями свободы.

Обозначим значение критерия, вычисленное по дан­ным наблюдений, через Элементы теории корреляции. - student2.ru и сформулируем правило проверки нулевой гипотезы.

Правило. Для того чтобы при заданном уровне зна­чимости Элементы теории корреляции. - student2.ru проверить нулевую гипотезу Элементы теории корреляции. - student2.ru : Элементы теории корреляции. - student2.ru о ра­венстве нулю генерального коэффициента корреляции при конку­рирующей гипотезе Элементы теории корреляции. - student2.ru : Элементы теории корреляции. - student2.ru , надо вычислить наблюда­емое значение критерия:

Элементы теории корреляции. - student2.ru (5.11)

и по таблице критических точек распределения Стьюдента, по заданному уровню значимости и числу степеней сво­боды Элементы теории корреляции. - student2.ru найти критическую точку Элементы теории корреляции. - student2.ru .

Если Элементы теории корреляции. - student2.ru — нет оснований отвергнуть нулевую гипотезу, если Элементы теории корреляции. - student2.ru - то ее отвергают.

В то время как задача корреляционного анализа - установить, являются ли данные случайные величины взаимосвязанными, цель регрессионного анализа - описать эту связь аналитической зависимостью, т.е. с помощью уравнения. Мы рассмотрим самый несложный случай, когда связь между точками на графике может быть представлена прямой линией. Уравнение этой прямой линии Элементы теории корреляции. - student2.ru , где

Элементы теории корреляции. - student2.ru , Элементы теории корреляции. - student2.ru (5.12)

Зная уравнение прямой, мы можем находить значение функции по значению аргумента в тех точках, где значение Элементы теории корреляции. - student2.ru известно, а Элементы теории корреляции. - student2.ru - нет. Эти оценки бывают очень нужны, но они должны использоваться осторожно, особенно, если связь между величинами не слишком тесная. Отметим также, что из сопоставления формул для Элементы теории корреляции. - student2.ru и Элементы теории корреляции. - student2.ru видно, что коэффициент не дает значение наклона прямой, а лишь показывает сам факт наличия связи.

7. Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий согласия Пирсона.

Ранее предполагалось, что закон распределения генеральной совокупности известен. Если же он неизвестен, но есть осно­вания предположить, что он имеет определенный вид (назовем его Элементы теории корреляции. - student2.ru ), то проверяют нулевую гипотезу: гене­ральная совокупность распределена по закону Элементы теории корреляции. - student2.ru .

Проверка гипотезы о предполагаемом законе неизве­стного распределения производится так же, как и про­верка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины — критерия согласия.

Критерием согласия Элементы теории корреляции. - student2.ru называют критерий проверки ги­потезы о предполагаемом законе неизвестного распреде­ления.

Имеется несколько критериев согласия, но мы огра­ничимся описанием применения критерия Пирсона к про­верке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для др. распределений). Для этого будем сравнивать эмпирические (наблюда­емые) и теоретические (вычисленные в предположении нормального распределения) частоты.

Обычно эмпирические и теоретические частоты раз­личаются. Возможно, что рас­хождение случайно (незначимо) и объясняется либо ма­лым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что тео­ретические частоты вычислены исходя из неверной гипо­тезы о нормальном распределении генеральной совокуп­ности.

Критерий Пирсона отвечает на вопрос «Случайно ли расхождение частот?». Правда, как и любой критерий, он не доказы­вает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.

Итак, пусть по выборке объема Элементы теории корреляции. - student2.ru получено эмпири­ческое распределение: варианты - Элементы теории корреляции. - student2.ru : Элементы теории корреляции. - student2.ru , эмпирические частоты - Элементы теории корреляции. - student2.ru : Элементы теории корреляции. - student2.ru .

Допустим, что в предположении нормального распре­деления генеральной совокупности вычислены теорети­ческие частоты Элементы теории корреляции. - student2.ru . При уровне значимости Элементы теории корреляции. - student2.ru требуется проверить нулевую гипотезу: генеральная совокупность распреде­лена нормально.

В качестве критерия проверки нулевой гипотезы при­мем случайную величину

Элементы теории корреляции. - student2.ru .

Эта величина случайная, т.к. в различных опытах она принимает различные, заранее не известные значе­ния. Ясно, что, чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия, и, следовательно, он в известной степени характеризует близость эмпирического и теоретического распределений.

Стоит заметить, что возведение в квадрат разностей частот устраняет возможность взаимного погашения положи­тельных и отрицательных разностей. Делением на Элементы теории корреляции. - student2.ru до­стигают уменьшения каждого из слагаемых – иначе сумма была бы настолько велика, что при­водила бы к отклонению нулевой гипотезы даже тогда, когда она справедлива.

Доказано, что при Элементы теории корреляции. - student2.ru закон распределения слу­чайной величины Элементы теории корреляции. - student2.ru независимо от того, к какому закону распределения подчинена генеральная совокупность, стре­мится к закону распределения Элементы теории корреляции. - student2.ru с Элементы теории корреляции. - student2.ru степенями свободы. Поэтому случайная величина Элементы теории корреляции. - student2.ru обозначена через Элементы теории корреляции. - student2.ru , а сам критерий называют критерием согласия «хи квадрат».

Число степеней свободы находят по равенству Элементы теории корреляции. - student2.ru , где Элементы теории корреляции. - student2.ru — число групп выборки; Элементы теории корреляции. - student2.ru — число параметров предполагаемого распре­деления, которые оценены по данным выборки.

В частности, если предполагаемое распределение — нор­мальное, то оценивают два параметра (математическое ожидание и среднее квадратическое отклонение), поэтому Элементы теории корреляции. - student2.ru и число степеней свободы Элементы теории корреляции. - student2.ru .

Так как односторонний критерий более жестко отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требо­вания, чтобы вероятность попадания критерия в эту об­ласть в предположении справедливости нулевой гипотезы была равна принятому уровню значимости Элементы теории корреляции. - student2.ru :

Элементы теории корреляции. - student2.ru .

Обозначим значение критерия, вычисленное по данным наблюдений, через Элементы теории корреляции. - student2.ru и сформулируем правило проверки нулевой гипотезы.

Правило: для того чтобы при заданном уровне зна­чимости проверить нулевую гипотезу Элементы теории корреляции. - student2.ru (генеральная совокупность распределена нормально), надо сначала вы­числить теоретические частоты, а затем наблюдаемое значение критерия:

Элементы теории корреляции. - student2.ru

и по таблице критических точек распределения Элементы теории корреляции. - student2.ru , по заданному уровню значимости Элементы теории корреляции. - student2.ru и числу степеней сво­боды Элементы теории корреляции. - student2.ru найти критическую точку Элементы теории корреляции. - student2.ru . Если Элементы теории корреляции. - student2.ru — нет оснований отвергнуть нулевую гипотезу, если Элементы теории корреляции. - student2.ru — нулевую гипотезу отвергают.

Наши рекомендации