Тема 12. Проверка значимости уравнения множественной регрессии
Индекс множественной корреляции оценивает тесноту совместного влияния факторов на результат и может быть найден по формулам:
.
При этом значение индекса множественной корреляции будет не меньше чем максимальное значение коэффициента парной корреляции .
Для линейной множественной регрессии справедлива следующая формула:
, где
- стандартизованные коэффициенты линейного уравнения множественной регрессии;
.- коэффициенты парной корреляции результативного признака с каждым из факторов .
Коэффициент множественной корреляции, вычисляемый по следующим формулам, называется линейным (совокупным) коэффициентом корреляции. Если в общем виде задано уравнение линейной множественной регрессии , то индекс множественной корреляции может быть определен по формулам:
, где
определитель матрицы коэффициентов парной регрессии находится:
,
а определитель получаем из предыдущего определителя - вычеркиванием первого столбца и первой строки.
Индекс множественной корреляции равен совокупному коэффициенту корреляции не только при линейной зависимости рассматриваемых признаков, но и при нелинейной зависимости, являющейся нелинейной по переменным. В случае нелинейной регрессии, являющейся нелинейной по параметрам индекс детерминации принято обозначать как «квази - », при чем он может быть найден по формуле
.
При этом «квази - » не совпадает с совокупным коэффициентом детерминации.
При определении индекса и коэффициента множественной корреляции используется остаточная дисперсия, которая имеет систематическую ошибку в сторону приуменьшения, т.е. если число параметров при переменных стремится к объему выборки , то остаточная дисперсия будет близка 0, и значения коэффициента или индекса корреляции будут стремиться к 1, даже при слабой связи факторов с результатом. Для того, чтобы не допустить преувеличение тесноты связи используют скорректированный коэффициент или индекс детерминации.
,
- объем выборки,
- число параметров перед факторами .
В данном случае чем больше , тем сильнее различия между индексом детерминации и скорректированным индексом детерминации .
Величина коэффициента (индекса) множественной корреляции позволяет оценить качество регрессионной модели. Низкое значение данного показателя означает, что в модель не включены существенные факторы и данная форма связи не отражает реальные отношения между переменными моделями, поэтому в таких случаях требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.