Выборочный коэффициент детерминации
Выборочный множественный коэффициент детерминации показывает качество подгонки регрессионной модели к наблюдаемым значениям и определяется выражением (в отличие от случая модели парной регрессии он обозначается ):
(25)
Свойства коэффициента :
1. Коэффициент служит для оценки значимости (качества) уравнения регрессии, является одной из наиболее эффективных оценок адекватности регрессионной модели, характеристикой её прогностической силы.
2. Коэффициент при выполнении 5-го условия КЛММР является состоятельной, но смещённой оценкой генерального коэффициента детерминации , с математическим ожиданием и дисперсией, приближённо определяемыми выражениями:
;
.
3. Коэффициент - безразмерная величина, лежащая в пределах 0 1.
4. При =0 вариация зависимой переменной полностью обусловлена воздействием неучтённых в модели переменных и линия регрессии не улучшает качество предсказания значений по сравнению с тривиальным предсказанием
5. При =1 осуществляется точная подгонка и все эмпирические точки удовлетворяют уравнению регрессии
6. Коэффициент может быть вычислен из матрицы парных коэффициентов корреляции по формуле:
, (26)
где - определитель симметричной квадратной матрицы выборочных парных коэффициентов корреляции - го порядка
= (27)
с элементами
, (28)
, (29)
где ; ; = , где
= . (30)
Выражение (26) определяет выборочный множественный коэффициент детерминации р-го порядка (по числу р объединяющих переменных). Множественные коэффициенты детерминации низших порядков определяются аналогичным образом из соответствующих подматриц матриц .
Так, выборочный множественный коэффициент детерминации 1-го порядка , равный квадрату парного коэффициента корреляции между результирующей и -ой объясняющей переменной , находится по формуле:
, (31)
где - определитель подматрицы , получаемый из матрицы путём вычёркивания всех строк и столбцов кроме тех, которые соответствуют переменным и (первые -е строка и столбец);
- алгебраическое дополнение 1-го элемента 1-й строки этой подматрицы.
Выборочный множественный коэффициент детерминации 2-го порядка для объясняемой и факторных переменных , определяется выражением:
, (32)
где - определитель подматрицы , которая находится из матрицы в результате вычёркивания всех строк и столбцов кроме тех, которые отвечают , и ; - алгебраическое дополнение 1-го элемента 1-й строки полученной подматрицы.
Выборочные множественные коэффициенты детерминации более высоких порядков находятся аналогичным образом.
7. Величина , вообще говоря, возрастает при добавлении новых регрессоров (поскольку растёт ), хотя это не обязательно означает улучшение качества регрессионной модели.
Поскольку присоединение в уравнение регрессии каждой новой предикторной переменной не может уменьшить величины коэффициента детерминации (независимо от порядка присоединения), множественные коэффициенты детерминации различных порядков удовлетворяют цепочке неравенств:
. (33)
Попыткой устранения эффекта, связанного с ростом при добавлении новых объясняющих переменных, является коррекция на число регрессоров.