Влияние мультиколлинеарности

При наличии существенной мультиколлинеарности приведенная интерпретация коэффициентов уравнения множественной регрессии становится невозможной, поэтому при построении регрессионных моделей влияние мультиколлинеарности следует минимизировать, например, из каждой группы тесно связанных факторных признаков оставлять только один.

Основные результаты множественной регрессии

КОЭФФИЦИЕНТ МНОЖЕСТВЕННОЙ КОРРЕЛЯЦИИ R

СООТВЕТСТВУЮЩИЙ КОЭФФИЦИЕНТ ДЕТЕРМИНАЦИИ R 2

ЗНАЧИМОСТЬ РЕГРЕССИОННОЙ МОДЕЛИ

КОЭФФИЦИЕНТЫ РЕГРЕССИИ И УРОВНИ ИХ ЗНАЧИМОСТИ

ЧАСТНЫЕ КОЭФФИЦИЕНТЫ КОРРЕЛЯЦИИ

Коэффициент множественной корреляции

Коэффициент множественной корреляции R является обобщением коэффициента парной корреляции для случая, когда число независимых факторов, включенных в уравнение, больше одного.

R является величиной безразмерной.

R не меняется при изменении единиц измерения соответствующих признаков.

R принимает значения в интервале [0;1].

Коэффициент детерминации R 2

Чем больше R , тем сильнее линейная связь между совокупностью независимых факторов и результативным признаком.

Как и в случае парной зависимости, интерпретируется не сам коэффициент корреляции, а его квадрат – коэффициент детерминации.

Этот коэффициент является квадратом соответствующего коэффициента корреляции и выражается в процентах.

Смысл коэффициента детерминации R 2

Коэффициент детерминации R 2 показывает, насколько изменения зависимого признака (в процентах) объясняются изменениями совокупности независимых признаков . То есть, это доля дисперсии зависимого признака, объясняемая влиянием независимых признаков.

Значимость регрессионной модели

Если коэффициент множественной корреляции вычислен на основе выборочных данных, то возможно, что его значение не отражает реальной связи между признаками, а получено в данной выборке случайно (при этом в генеральной совокупности признаки независимы).

Значимость регрессионной модели

В основе проверки значимости регрессии лежит идея разложения дисперсии (разброса) результативного признака на факторную и остаточную дисперсии, т.е. объясненную (за счет независимых факторов) часть дисперсии и часть, оставшуюся необъясненной в рамках данной модели.

Значимость регрессионной модели

Мерой значимости регрессии служит значение т.н. F- критерия – отношения факторной дисперсии к остаточной .

Чем лучше регрессионная модель, тем выше доля факторной и ниже доля остаточной дисперсии.

Наши рекомендации