Значимость коэффициента корреляции

Для проведения полноценного статистического анализа свойств генеральной совокупности, основанных на коэффициенте корреляции, необходимо знать ее статистические свойства. Это позволит судить о точности приближения (4.24) к неизвестному истинному значению коэффициента корреляции r, строить статистические критерии для проверки различных гипотез о численных значениях анализируемого коэффициента корреляции.

В частности, какую величину выборочного коэффициента корреляции следует считать достаточной для статистически обоснованного вывода о наличии корреляционной связи между исследуемыми переменными? Ведь надежность статистических характеристик, в том числе и r, ослабевает с уменьшением объема соответствующей выборки, а потому принципиально возможны случаи, когда отклонения от нуля полученной величины выборочного коэффициента корреляции r оказывается статистически незначимым, т.е. целиком обусловленным случайными колебаниями выборки, на основании которой он вычислен. Ответить на этот вопрос позволяет знание закона распределения вероятностей r.

В случае совместной нормальной распределенности исследуемых переменных и при достаточно большом объеме выборки n (а именно при n>200) распределение r можно считать приближенно нормальным со средним, равным своему теоретическому значению r, и дисперсией

Значимость коэффициента корреляции - student2.ru . (4.26)

Однако следует учитывать, что при малых значениях n и r, близких к ±1, это приближение оказывается очень грубым. Кроме того, при малых n следует принимать во внимание, что величина r является смещенной оценкой своего теоретического значения r, в частности

Значимость коэффициента корреляции - student2.ru . (4.27)

В качестве критерия проверки нулевой гипотезы Значимость коэффициента корреляции - student2.ru против альтернативной Значимость коэффициента корреляции - student2.ru используется величина

Значимость коэффициента корреляции - student2.ru . (4.28)

Эта величина при относительно хорошей степени приближения к нормальному распределению и при малых значениях |r| приблизительно распределена по закону распределения Стьюдента с n=n–2 степенями свободы. Поэтому, если окажется, что Значимость коэффициента корреляции - student2.ru , то нулевая гипотеза об отсутствии корреляционной связи между X и Y отвергается с вероятностью ошибиться, равной a.

Пример 4.2. Проверить значимость коэффициентов корреляции в примере 4.1 на уровне значимости a=0,05.

Решение. Для примера 4.1 n=7 и r=0,9389. Вычислим наблюдаемое и критическое значения критерия Стьюдента

Значимость коэффициента корреляции - student2.ru и Значимость коэффициента корреляции - student2.ru .

Поскольку Значимость коэффициента корреляции - student2.ru , то коэффициент корреляции существенно отличается от нуля. â

Пример 4.3. Взяты 10 наблюдений показателей инфляции и безработицы в США за 1931-1940 годы, для них рассчитана выборочный коэффициент корреляции r=–0,227. Связь отрицательная, что соответствует теории (кривая Филлипса), но значима ли она? Проверить гипотезу H0:r=0 о равенстве нулю истинного значения коэффициента корреляции на уровне значимости a=0,05.

Решение. Вычисляем наблюдаемое и критическое значения критерия Стьюдента

Значимость коэффициента корреляции - student2.ru и Значимость коэффициента корреляции - student2.ru .

Поскольку Значимость коэффициента корреляции - student2.ru , то коэффициент корреляции не значимо отличается от нуля. Следовательно, в нашем случае не исключается, что истинное значение коэффициента корреляции равно нулю, т.е. на основе имеющейся выборки нельзя делать вывод о наличии корреляционной значимой линейной связи показателей инфляции и безработицы в США. Нельзя, впрочем, здесь делать вывод об отсутствии такой связи. â

Наши рекомендации