Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru

где Dфакт – факторная сумма квадратов на одну степень свободы;

Dост – остаточная сумма квадратов на одну степень свободы;

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - коэффициент (индекс) множественной детерминации;

m – число параметров при переменных x (в линейной регрессии совпадает с числом включенных в модель факторов);

n – число наблюдений.

Оценка значимости уравнения множественной регрес­сии осуществляется путем проверки гипотезы: Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru (гипотеза о незначимости уравнения регрессии).

По таблицам распределения Фишера находят критическое значение F-критерия Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru . Для этого за­даются уровнем значимости Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru (обычно его берут равным 0,05) и двумя числами степеней свободы Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru и Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru . Здесь m – число параметров модели.

Сравнивают фактическое значение F-критерия Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru с табличным Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru .

Если Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru , то ги­потезу о незначимости уравнения регрессии не отвергают. Если Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru , то выдвинутую гипотезу отвер­гают и принимают альтернативную гипотезу о статистиче­ской значимости уравнения регрессии.

Частный F-критерий оценивает статистическую значимость присутствия каждого факторов в уравнении.Необходимость такой оценки вызвана тем, что не каждый фактор, вошедший в модель, может существенно увеличивать долю объясненной вариации результативно признака. Кроме того, при наличии в модели нескольких факторов они могут вводиться в модель в разной последовательности. Ввиду корреляции между факторами значимость одного и того же фактора может быть разной в зависимости от последовательности его введения в модель.

Частный F-критерий построен на сравнении прироста факторной дисперсии, обусловленного влиянием дополнительно включенного фактора, с остаточной дисперсией на однй степень свободы по регрессионной модели в целом. Предположим, что оцениваем значимость влияния Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru как дополнительно включенного в модель фактора. В общем виде для фактора Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru частный F-критерий определится как:

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru

где Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - коэффициент множественной детерминации для модели с полным набором факторов;

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - тот же показатель, но без включения в модель фактора Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru

n – число наблюдений;

m – число параметров в модели (без свободного члена) или число независимых переменных модели.

По таблицам распределения Фишера находят критическое значение F-критерия Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru . Для этого за­даются уровнем значимости Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru (обычно его берут равным 0,05) и двумя числами степеней свободы Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru и Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru . Здесь m – число параметров модели.

Сравнивают фактическое значение F-критерия Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru с табличным Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru .

Если Fкр меньше табличного, то включение в модель данного фактора x1 после введения в нее фактора x2 нецелесообразно, и наоборот.

Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значения:

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru

где bi - коэффициент чистой регрессии при факторе xi;

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - средняя квадратичная ошибка коэффициента регрессии bi.

Она может быть определена по следующей формуле:

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru

где Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - среднее квадратическое отклонение для фактора y;

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - среднее квадратическое отклонения для фактора xi;

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - коэффициент детерминации для уравнения множественной регрессии;

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru - коэффициент детерминации для зависимости фактора xi со всеми другими факторами уравнения множественной регрессии;

n-m-1 – число степеней свободы для остаточной суммы квадратов отклонений.

Далее находят табличное значение t-критерия Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru . Для этого за­даются уровнем значимости Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru (обычно его берут равным 0,05) и Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru . Здесь m – число параметров модели.

Сравнивают фактическое значение t-критерия с табличным Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru .

Если фактическое tbi меньше табличного, то коэффициент регрессии bi статистически незначим, и формируется преимущественно под влиянием случайных факторов; и наоборот.

Аналогично оценивается статистическая значимость индекса множественной корреляции:

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru (k – число независимых переменных модели).

Адекватность регрессионной модели оценим опять же с помощью средней ошибки аппроксимации – среднее отклонение расчетных значений от фактических:

Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru

Допустимый предел значений Оценка значимости уравнения множественной регрессии на основе коэффициента детерминации и результатов дисперсионного анализа - student2.ru – не более 8-10%.

Наши рекомендации