Уравнения множественной регрессии
Парная регрессия может дать хороший результат при моделировании, если влиянием других факторов, воздействующих на объект исследования, можно пренебречь. Однако, производственные взаимосвязи, как правило, определяются большим числом одновременно и совокупно действующих факторов. Например, себестоимость продукции зависит от стоимости материала, основной зарплаты рабочих, премиальных, расходов на содержание оборудования и др. В связи с этим возникает задача исследования зависимости между факторными признаками (называемыми также регрессорами или предикторами) , , . . ., и результативным признаком . Для этого используется множественный регрессионный анализ, т.е. построение уравнений множественной регрессии:
, (1.79)
где - результативный признак (зависимая переменная),
– признаки-факторы (независимые, или объясняющие, переменные).
Основной целью множественной регрессии является построение модели с большим числом факторов и определение при этом влияния каждого из них в отдельности, а также совокупно на моделируемый показатель (результативный признак).
Построение уравнения множественной регрессии начинают с решения вопроса о спецификации модели, который включает в себя отбор признаков-факторов и выбор вида уравнения регрессии.
Включение в уравнение множественной регрессии определенного набора факторов связано, в первую очередь, с представлениями исследователя о природе взаимосвязи моделируемого показателя с другими социально-экономическими явлениями. Важно отметить, что факторы, которые включаются в уравнение множественной регрессии, должны объяснить вариацию зависимой переменной, т.е. результативного признака.
В случае, когда строится модель с набором факторов в первую очередь необходимо определить показатель детерминации , фиксирующий долю объясненной вариации результативного признака за счет рассматриваемых в регрессии факторов. Влияние не учтенных в регрессионной модели факторов, оценивается как (1-R2) с соответствующей величиной остаточной дисперсии S2.
Отбор факторов осуществляется в два тапа: на первом подбираются факторы исходя из сущности изучаемой проблемы; на втором – на основании матрицы показателей корреляции определяют статистики для параметров регрессии.
Коэффициенты корреляции между объясняющими переменными позволяют исключать из модели дублирующие факторы. Считают, что две переменные явно коллинеарны, т.е. находятся между собой в линейной зависимости, если . Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключать из регрессионной модели.
Предпочтение при этом отдается тому факторному признаку, который при достаточно тесной связи с результативным признаком имеет наименьшую тесноту связи с другими признаками-факторами. В этом требовании проявляется специфика использования множественной регрессии как метода исследования комплексного воздействия факторов в условиях их независимости друг от друга.
Следует отметить, что наибольшие сложности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторных признаков, когда имеет место совокупное воздействие факторов друг на друга, т.е. более чем два признака-фактора связаны между собой линейной зависимостью. В результате вариация в исходных данных перестает быть полностью независимой и поэтому невозможно оценить воздействие каждого фактора в отдельности. Включение в модель мультиколлинеарных факторных признаков нежелательно в силу следующих последствий:
1. Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде – в виду того, что факторы коррелированы параметры линейной регрессии теряют экономический смысл.
2. Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений не только по величине, но и по знаку - это делает модель непригодной для анализа и прогнозирования.
Отбор факторов, включаемых в регрессию, является одним из важнейших этапов практического использования методов регрессии. Подходы к отбору факторов на основе показателей корреляции могут быть разные. Наиболее широкое применение получили такие методы построения уравнения множественной регрессии как:
1. Метод исключения – отсев факторов из полного его набора.
2. Метод включения – дополнительное введение фактора.
3. Шаговый регрессионный анализ – исключение ранее введенного фактора.