Вычисление коэффициента связи (корреляции)
Пусть у нас есть n пар измерений двух случайных величин X и Y (коэффициент корреляции можно вычислить ТОЛЬКО для связанных выборок) распределенных по нормальному закону, тогда коэффициент корреляции Пирсона можно вычислить по следующей формуле:
(2)
В уравнении (2): и - соответственно средние арифметические для выборок из случайных величин X и Y, σx и σy – среднеквадратичные отклонения, оцененные по тем же выборкам, - полученные в эксперименте пары измерений для случайных величин Y и X .
Проверка значимости коэффициента (достоверно ли он отличается от нуля)
Как всегда в статистике, формула (2) дает точечное значение коэффициента корреляции. Для ответа на вопрос: значимо ли он отличается от нуля (т.е. есть ли связь?) необходимо построить доверительный интервал и посмотреть: попадает ли в этот интервал нулевое значение. Если попадает, то мы не имеем право говорить, что связь существует, если нет, то с той вероятностью, с которой строился доверительный интервал, мы может считать, что связь действительно существует. Вычисление точных значений доверительного интервала достаточно сложно. Однако существует более простой способ. Для определения достоверности отличия от нуля коэффициента корреляции Пирсона, можно использовать Таблицу приложения 10. Для этого необходимо:
- Рассчитать точечное значение коэффициента корреляции по формуле (2)
- Задаться уровнем достоверности (0,95; 0,99 или 0,999) и войти в таблицу приложения 10, учитывая число проведенных пар измерений n.
- Сравнить полученную точечную оценку коэффициента корреляции с табличным значением. Если оценка больше или равна табличному значению, коэффициент корреляции достоверно отличается от нуля на данном уровне значимости и, следовательно, можно сделать заключение, что связь между изучаемыми случайными величинами действительно существует.
Например, проведя 20 пар измерений двух случайных величин и проведя расчеты по формуле (2), мы получили значение . Достоверно ли это значение отличается от нуля? Для ответа на этот вопрос входим в таблицу приложения 5 по двадцатой строке. Для уровня значимости 0,05, чтобы сделать заключение о наличии связи необходимо, чтобы значение выборочной оценки коэффициента корреляции было больше 0,444. Для уровня значимости 0,01 это значение должно быть больше чем 0,561, а для уровня значимости 0,001 – больше чем 0,679. Поскольку в нашем случае выборочная оценка равна 0,754, мы можем заключить, что с вероятностью 0,999 связь между изучаемыми случайными величинами действительно существует.