Оценка качества модели множественной регрессии

Проверка качества модели множественной регрессии может быть осуществлена с помощью дисперсионного анализа.

Как уже было отмечено (см. 2.5), сумма квадратов отклонений от среднего в выборке равна сумме квадратов отклонений значений Оценка качества модели множественной регрессии - student2.ru , полученных по уравнению регрессии, от выборочного среднего Оценка качества модели множественной регрессии - student2.ru плюс сумма квадратов отклонений Y от линии регрессии Оценка качества модели множественной регрессии - student2.ru .

С учетом (3.21) получим таблицу дисперсионного анализа (табл. 3.4), аналог таблицы 2.3.

Проверка качества модели множественной регрессии в целом может быть осуществлена с помощью F-критерия Фишера. Для проверки гипотезы о том, что линейная связь между Оценка качества модели множественной регрессии - student2.ru и y отсутствует:

Оценка качества модели множественной регрессии - student2.ru ,

воспользуемся соотношением

Оценка качества модели множественной регрессии - student2.ru (3.23)

которое удовлетворяет F - распределению Фишера с (k, n-(k+1)) степенями свободы. Критические значения этой статистики Fe для уровня значимости e затабулированы.

Таблица 3.4

Таблица дисперсионного анализа

Источник вариации Сумма квадратов отклонений Число степеней свободы Дисперсия на одну степень свободы
Оценка качества модели множественной регрессии - student2.ru Оценка качества модели множественной регрессии - student2.ru k Оценка качества модели множественной регрессии - student2.ru
Остаток Оценка качества модели множественной регрессии - student2.ru n-k-1 Оценка качества модели множественной регрессии - student2.ru
Общая вариация Оценка качества модели множественной регрессии - student2.ru n-1  

Если F>Fe, то гипотеза об отсутствии связи между переменными Оценка качества модели множественной регрессии - student2.ru и y отклоняется, в противном случае гипотеза Н0 принимается и уравнение регрессии не значимо.

Пример (продолжение примера 1). Заполним таблицу дисперсионного анализа:

Таблица дисперсионного анализа

Источник вариации Сумма квадратов отклонений Число степеней свободы Дисперсия
Оценка качества модели множественной регрессии - student2.ru 5828,84 2914,42
Остаток 2049,54 120,56
Общая вариация 7878,38  

Получаем Оценка качества модели множественной регрессии - student2.ru , Оценка качества модели множественной регрессии - student2.ru .

В нашем примере F>Fe, следовательно, нулевая гипотеза отклоняется, и уравнение множественной регрессии значимо. Ñ

Помимо проверки значимости уравнения в целом, можно проверить статистическую значимость каждого из коэффициентов регрессии в отдельности.

Фактически это означает проверку одной из гипотез:

1) Оценка качества модели множественной регрессии - student2.ru ; …; k) Оценка качества модели множественной регрессии - student2.ru .

Статистическая значимость каждого из коэффициентов регрессии определяется при помощи t-критерия Стьюдента. Решение о том, что верна нулевая гипотеза, принимается в случае, когда |t|<te, иначе принимается альтернативная гипотеза.

Значение t-статистики Стьюдента в случае множественной регрессии определяется по формуле:

Оценка качества модели множественной регрессии - student2.ru , (3.24)

где Оценка качества модели множественной регрессии - student2.ru - стандартная ошибка коэффициента регрессии Оценка качества модели множественной регрессии - student2.ru , которая определяется по формуле

Оценка качества модели множественной регрессии - student2.ru , (3.25)

здесь Оценка качества модели множественной регрессии - student2.ru - стандартное отклонение y;

Оценка качества модели множественной регрессии - student2.ru - стандартное отклонение xi;

Оценка качества модели множественной регрессии - student2.ru - коэффициент детерминации для зависимости фактора xi от других факторов уравнения множественной регрессии.

Пример (продолжение примера 1). Проверим значимость коэффициентов регрессии. В случае, когда в уравнение регрессии включены две независимые переменные, формула (3.24) упрощается

Оценка качества модели множественной регрессии - student2.ru , Оценка качества модели множественной регрессии - student2.ru .

Таким образом:

Оценка качества модели множественной регрессии - student2.ru =4,69, Оценка качества модели множественной регрессии - student2.ru =4,50,

Оценка качества модели множественной регрессии - student2.ru .

Так как в обоих случаях Оценка качества модели множественной регрессии - student2.ru , то коэффициенты регрессии значимы, следовательно, и вес груза, и расстояние грузовой перевозки оказывают существенное, статистически значимое влияние на стоимость перевозки. Ñ

Наши рекомендации