Оценка качества уравнения регрессии

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблю­даемым данным проводится на основе анализа остатков.

После построения уравнения регрессии мы можем разбить значение Y, в каждом наблюдении на две составляющих - Оценка качества уравнения регрессии - student2.ru и Оценка качества уравнения регрессии - student2.ru .

Оценка качества уравнения регрессии - student2.ru

Остаток Оценка качества уравнения регрессии - student2.ru представляет собой отклонение фактического зна­чения зависимой переменной от значения данной перемен­ной, полученное расчетным путем: Оценка качества уравнения регрессии - student2.ru ( Оценка качества уравнения регрессии - student2.ru ).

На практике, как правило, имеет место некоторое рассеива­ние точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от тео­ретических ( Оценка качества уравнения регрессии - student2.ru ). Величина этих отклонений и лежит в осно­ве расчета показателей качества (адекватности) уравнения.

При анализе качества модели регрессии используется основное положение дисперсионного анализа, согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения Оценка качества уравнения регрессии - student2.ru может быть разложе­на на две составляющие — объясненную и необъясненную уравнением регрессии дисперсии:

Оценка качества уравнения регрессии - student2.ru (4)

где Оценка качества уравнения регрессии - student2.ru - значения y, вычисленные по модели Оценка качества уравнения регрессии - student2.ru .

Разделив правую и левую часть (4) на Оценка качества уравнения регрессии - student2.ru

Оценка качества уравнения регрессии - student2.ru ,

получим

Оценка качества уравнения регрессии - student2.ru .

Коэффициент детерминации определяется следующим образом:

Оценка качества уравнения регрессии - student2.ru

Коэффициент детерминации показывает долю вариации результативного признака, находя­щегося под воздействием изучаемых факторов, т. е. определяет, ка­кая доля вариации признака Y учтена в модели и обусловлена влия­нием на него факторов.

Чем ближе Оценка качества уравнения регрессии - student2.ru к 1, тем выше качество модели.

Для оценки качества регрессионных моделей целесообразно также ис­пользовать коэффициент множественной корреляции (индекс корреляции) R

Данный коэффициент является универсальным, так как он отра­жает тесноту связи и точность модели, а также может использовать­ся при любой форме связи переменных.

При построении однофакторной модели он равен коэффициенту линейной корреляции Оценка качества уравнения регрессии - student2.ru.

Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным.

Также для оценки качества регрессионных моделей целесообразно ис­пользовать среднюю ошибку аппроксимации:

Оценка качества уравнения регрессии - student2.ru Оценка качества уравнения регрессии - student2.ru

Чем меньше рассеяние эмпирических точек вокруг теоре­тической линии регрессии, тем меньше средняя ошиб­ка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели.

После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров.

Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y

Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипо­тезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: Оценка качества уравнения регрессии - student2.ru . Альтернативная ей гипотеза о значимости уравне­ния — гипотеза о неравенстве нулю параметров регрессии.

Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несме­щенной дисперсии остаточной компоненты. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.

Для модели парной регрессии:

Оценка качества уравнения регрессии - student2.ru

В качестве меры точности применяют несмещенную оценку дис­персии остаточной компоненты, которая представляет собой отно­шение суммы квадратов уровней остаточной компоненты к величи­не (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины ( Оценка качества уравнения регрессии - student2.ru ) называется стандартной ошибкой: Оценка качества уравнения регрессии - student2.ru

Для модели парной регрессииОценка качества уравнения регрессии - student2.ru

Наши рекомендации