Уравнение множественной регрессии
На практике изменение результативного признака зачастую зависит от действия нескольких факторных признаков . В этой связи изучение связи между тремя и более признаками носит название множественной (многофакторной) регрессии. Аналитическое выражение связи между результативным признаком и факторными признаками описывается функцией вида:
Уравнение множественной регрессии описывает математическую зависимость результативного признака от нескольких факторных признаков.
При построении уравнения множественной регрессии необходимо решить следующие задачи:
1) обосновать взаимосвязь результативного признака и факторных признаков;
2) определить тип уравнения регрессии.
3) количественно оценить тесноту связи между результативным признаком и факторами.
Построение моделей множественной регрессии включает три этапа:
§ выбор формы связи (уравнения регрессии);
§ отбор факторных признаков;
§ обеспечение достаточного объема совокупности.
Выбрать тип уравнения довольно сложно, так как для любой формы связи могут соответствовать несколько уравнений, описывающих эти связи.
Проблема отбора факторных признаков может быть решена на основе интуитивно-логических или многомерных математико-статистических методов. Наиболее приемлемым способом обора факторных признаков является шаговая регрессия. Она заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Если при включении нового фактора в уравнение коэффициенты регрессии меняют свои значения и знаки, а множественный коэффициент корреляции не возрастает, то данный факторный признак не рекомендуется включать в уравнение связи.
Многофакторные регрессионные модели делятся на линейные (относительно независимых переменных) и нелинейные.
Наиболее простым для построения и анализа является линейное уравнение множественной регрессии:
,
где - свободный член;
- коэффициенты регрессии (параметры модели);
- факторные признаки.
Параметры уравнения можно определить методом наименьших квадратов. Если связь между признаками является нелинейной, то выбранная для ее описания нелинейная многофакторная модель (показательная, степенная и т.д.) сводится к линейной путем линеаризации.
При использовании уравнения регрессии в решении конкретной задачи необходимо учитывать следующие условия построения уравнения регрессии:
§ исходные данные должны быть однородны;
§ число рассматриваемых переменных должно быть не слишком велико;
§ отсутствие дублирующих переменных.
Для проверки достоверности уравнения регрессии применяется соотношение:
,
где - стандартная ошибка регрессии; - число факторных признаков в уравнении регрессии.
Считается, что если значение величины не превысит 10 – 15 %, то уравнение регрессии достаточно хорошо отображает изучаемую совокупность.