Оценка качества уравнения множественной регрессии
В случае множественной регрессии оценка его качества включает в себя:
- оценку значимости уравнения регрессии в целом;
- оценку значимости параметров уравнения регрессии.
Качество модели множественной регрессии в целом оценивается с помощью показателя детерминации, определяемого как квадрат показателя множественной корреляции R2.
Значение показателя детерминации зависит от числа факторов, включенных в уравнение регрессии. Чем больше число факторов m, тем больше значение показателя детерминации R2 приближается к единице. Поэтому на практике, чтобы исключить возможное завышение тесноты связи при оценке качества уравнения регрессии, используют скорректированный показатель детерминации:
.
Низкое значение показателя детерминации означает, что в регрессионную модель не включены существенные факторы - с одной стороны, а с другой стороны - рассматриваемая форма связи не отражает реальные соотношения между переменными, включенными в модель. В этом случае требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической важности.
Значимость уравнения множественной регрессии в целом, также как и в парной регрессии, оценивается с помощью F-критерия Фишера:
или .
Во множественной регрессии часто оценивается значимость не только уравнения в целом, но и значимость фактора, дополнительно включенного в регрессионную модель. Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака. Кроме того, при наличии в модели нескольких факторов они могут вводится в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель. Мерой для оценки значимости включения фактора xi в регрессионную модель после того как в нее уже включены факторы x1, x2,..., xi-1, xi+1,...,xm служит частный критерий Фишера . Значение частного F-критерия определяется по формуле
,
где - показатель детерминации, определенный без включения в модель регрессии фактора xi.
Расчетные значения частных F-криетриев сравниваются с табличным значением при заданной доверительной вероятности p и числах степеней свободы k1=1 и k2=n-m-1. Если расчетное значение превышает табличное, то дополнительное включение фактора xi в модель статистически оправдано и коэффициент чистой регрессии bi при факторе xi статистически значим.
Таким образом, с помощью частных F-криериев можно проверить значимость всех коэффициентов регрессии с учетом предположения, что каждый соответствующий фактор xi вводится в уравнение множественной регрессии последним.
Частные F-критерии часто используются на стадии формирования уравнения регрессии.
На основе частных F-критериев могут определены расчетные значения t-криериев Стьюдента для оценки значимости коэффициентов чистой регрессии bi:
.
Оценка значимости коэффициентов множественной регрессии по критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как и в парной регрессии, используется формула
,
где - стандартная ошибка коэффициента регрессии bi.
Для линейного уравнения множественной регрессии стандартные ошибки коэффициентов чистой регрессии определяются по формуле:
.
Расчетные значения t-критерия Стьюдента сравниваются с табличным при заданном уровне значимости a и числе степеней свободы k=n-m-1. Если расчетное значение превышает табличное, то коэффициент регрессии bi является статистически значимым. т. е. существенно отличается от нуля.