Отбор факторов в случае линейной множественной регрессии

Если факторы-аргументы не являются случайными величинами, то коэффициенты корреляции не могут быть использованы при построении уравнения регрессии, так как они не могут быть интерпретированы как показатели тесноты связи.

Существенность вводимых факторов в случае линейной множественной регрессии может быть проверена одновременно с существенностью коэффициентов регрессии.

Для проверки существенности вычисляется отношение

Отбор факторов в случае линейной множественной регрессии - student2.ru , Отбор факторов в случае линейной множественной регрессии - student2.ru (4.7)

где Отбор факторов в случае линейной множественной регрессии - student2.ru – коэффициент множественной регрессии; Отбор факторов в случае линейной множественной регрессии - student2.ru – среднее квадратическое отклонение этого коэффициента.

Если ti<tтабл, взятого по таблицам t-распределения Стьюдента, то с заданной вероятностью не отвергается гипотеза, что соответствующий коэффициент регрессии Отбор факторов в случае линейной множественной регрессии - student2.ru в генеральной совокупности (который не известен и который нужно оценить по данным выборки) равняется нулю. При этом i-ый фактор в таком случае признается несущественным для построенного уравнения регрессии.

При проведении исследования может оказаться, что вычисленные значения t для нескольких факторов не превышают tтабл. В этом случае несущественные факторы из уравнения регрессии исключаются поочередно, начиная с наименьшего по абсолютной величине t. Фактор соответствующий минимальному значению t, из уравнения регрессии исключается, и заново решается система нормальных уравнений. Затем вновь вычисляются значения t для всех оставшихся в уравнении коэффициентов, определяется минимальное значение t, которое сопоставляется с tтабл. Если окажется, что tmin<tтабл, то фактор, имеющий tmin, исключается.

Процесс исключения коэффициентов повторяется до тех пор, пока не будет выполняться соотношение tmin≥tтабл. В этом случае все оставшиеся в уравнении факторы существенны.

Проводить исключение из уравнения регрессии одновременно несколько факторов, имеющих t<tтабл, нецелесообразно, так как после исключения одного несущественного фактора коэффициенты регрессии других факторов меняются и несущественные факторы после пересчета могут оказаться существенными.

Аналогичный подход осуществляется и при наличии корреляционной зависимости, но на последней стадии отбора существенных факторов. Проверка значимости уравнения регрессии осуществляется по критерию Фишера

Отбор факторов в случае линейной множественной регрессии - student2.ru (4.8)

с числом степеней свободы Отбор факторов в случае линейной множественной регрессии - student2.ru

где

Отбор факторов в случае линейной множественной регрессии - student2.ru (4.9)

Отбор факторов в случае линейной множественной регрессии - student2.ru (4.10)

Отбор факторов в случае линейной множественной регрессии - student2.ru значения у, полученные по данным наблюдений; уi – расчетные значения у, полученные для соответствующих значений Отбор факторов в случае линейной множественной регрессии - student2.ru .

Полученное значение F сравнивается с Fтабл при выбранном уровне значимости. Если окажется F>Fтабл, то гипотеза о том, что не имеют существенного влияния на у , отвергается.

Если F>Fтабл, то следует ввести некоторые другие факторы, влияющие на показатель у, или перейти к построению нелинейной множественной регрессии.

При построении регрессионного уравнения весьма существенную информацию о модели может дать рассмотрение остатков Отбор факторов в случае линейной множественной регрессии - student2.ru .

Контрольные вопросы:

11. Какие требования предъявляются к объему наблюдений, необходимому для построения уравнения регрессии?

12. Какие требования предъявляются к факторам, включаемым в уравнение регрессии?

13. Что такое мультиколлинеарность факторов и как ее выявить?

14. Как вычисляются парные коэффициенты корреляции, частные коэффициенты корреляции?

15. Какова формула для вычисления коэффициента множественной детерминации?

16. Какой критерий используется для оценки значимости параметров уравнения регрессии?

Что понимают под значимостью модели регрессии в целом?

Наши рекомендации