Измерение тесноты связи между явлениями
Чтобы измерить тесноту прямолинейной связи между двумя признаками, пользуются парным коэффициентом корреляции, который обозначается r.Так как при корреляционной связи имеют дело не с приращением функции в связи с изменением аргумента, а с сопряженной вариацией результативных и факторных признаков, то определение тесноты связи, по существу, сводится к изучению этой сопряженности, т.е. того, в какой мере отклонение от среднего уровня одного признака сопряжено с отклонением другого. Это значит, что при наличии полной прямой связи все значения (х-X) и (у-Y) должны иметь одинаковые знаки, при полной обратной - разные, при частичной связи знаки в преобладающем числе случаев будут совпадать, а при отсутствии связи - совпадать примерно в равном числе случаев. Для оценки существенности коэффициента корреляции пользуются специально разработанной таблицей критических значений r. Коэффициент корреляции r применяется только в тех случаях, когда между явлениями существует прямолинейная связь. Если же связь криволинейная, то пользуются индексом корреляции, который рассчитывается по формуле:
где у - первоначальные значения;
- среднее значение;
Y - теоретические (выровненные) значения переменной величины.
Показатель остаточной, случайной дисперсии определяется по формуле:
Она характеризует размер отклонений эмпирических значений результативного признака у от теоретических Y, т.е. случайную вариацию. Общая дисперсия:
характеризует размер отклонений эмпирических значений результативного признака у от , т.е. общую вариацию. Отношение случайной дисперсии к общей характеризует долю случайной вариации в общей вариации, а
есть не что иное, как доля факторной вариации в общей, потому что по правилу сложения дисперсий общая дисперсия равна сумме факторной и случайной дисперсий:
σ2=σ2Y+σ20.Подставим в формулу индекса корреляции соответствующие обозначения случайной, общей и факторной дисперсий и получим:
Таким образом, индекс корреляции характеризует долю факторной вариации в общей:
однако с той лишь разницей, что вместо групповых средних берутся теоретические значения Y. Индекс корреляции по своему абсолютному значению колеблется в пределах от 0 до 1. При функциональн ой зависимости случайная вариация
, индекс корреляции равен 1. При отсутствии связи R = 0, потому что Y=y. Коэффициент корреляции является мерой тесноты связи только для линейной формы связи, а индекс корреляции - и для линейной, и для криволинейной. При прямолинейной связи коэффициент корреляции по своей абсолютной величине равен индексу корреляции: |r|=R.Если индекс корреляции возвести в квадрат, то получим коэффициент детерминации
R2=σ2Y/σ2.Он характеризует роль факторной вариации в общей вариации и по построению аналогичен корреляционному отношению η2.
Как и корреляционное отношение, коэффициент детерминации R2может быть исчислен при помощи дисперсионного анализа, так как дисперсионный анализ позволяет расчленить общую дисперсию на факторную и случайную. Однако при дисперсионном анализе для разложения дисперсии пользуются методом группировок, а при корреляционном анализе - корреляционными уравнениями.Коэффициент детерминации является наиболее конкретным показателем, так как он отвечает на вопрос о том, какая доля в общем результате зависит от фактора, положенного в основание группировки. При прямолинейной парной связи факторную дисперсию можно определить без вычисления теоретических значений Y по следующей формуле: