Коэффициент детерминации
Величина называется коэффициентом детерминации. Он характеризует, на сколько процентов изменчивость одной переменной можно объяснить изменчивостью другой переменной. Остальные относятся к воздействию других переменных, которые нам неизвестны.
Например, в предыдущей задаче коэффициент корреляции между Y – себестоимостью и Х – зарплатой был равен 0,65. Тогда
Kd = 42,25%. Следовательно, 42,25% изменчивости себестоимости продукции объясняется изменчивостью зарплаты. Остальные 57,75% объясняются другими факторами, например, стоимостью покупных комплектующих изделий, стоимостью энергообеспечения, стоимостью материалов и т.д.
Пример. Рассмотрим зависимость между ростом Х (в см) и весом Y (в кг) женщин. Пусть по результатам случайной выборки объема n = 15 получена таблица:
Х | |||||||||||||||
Y |
Требуется: а) построить диаграмму рассеяния;
б) составить корреляционную таблицу;
в) вычислить условные средние ;
г) вычислить парный коэффициент корреляции rxy и проверить его значимость на уровне значимости a = 0,10;
д) вычислить коэффициент детерминации и объяснить его смысл.
Решение. а) Диаграмму рассеяния получим, если нанесем пары значений на координатную плоскость ХОУ.
В скобках указана частота встречаемости значений .
б) Построим таблицу с двумя входами Х и Y. Для каждой переменной составим вариационный ряд. Частоту встречаемости в выборке запишем на пересечении i-ой строки и j-го столбца . Таким образом, получим корреляционную таблицу.
Y X | ni. | ||||||||
n.j |
Последние строка и столбец содержат итоговые частоты по столбцам (n.j) и строкам (ni.). Сумма частот итоговой строки и столбца равны между собой и и равны объему выборки n = 15.
в) Для каждого значения Х вычислим средние значения Y, т.е. и запишем их в таблицу. Так, для
кг;
кг;
кг;
кг.
Х | ||||
60,6 | 64,8 | 66,5 | 70,7 |
г) Вычислим оценку парного коэффициента корреляции по корреляционной таблице
Итак, .
Для проверки гипотезы против альтернативы вычислим наблюдаемое значение критерия
.
По таблице распределения Стьюдента определим . Так как (7,53 > 2,16), то гипотеза Н0 отвергается, что было очевидно и без проверки гипотезы, т.к. rxy = 0,9.
д) Вычислим коэффициент детерминации
= 81%, т.е. изменение веса женщины на 81% зависит от роста, а на 19% зависит от других факторов, которыми могут быть наследственность, состояние здоровья и т.п.