Множественная (многофакторная) регрессия
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при использовании парной регрессии, т. е. требуется определить аналитическое выражение связи между результативным признаком у и факторными признаками , найти функцию:
Построение моделей множественной регрессии включает несколько этапов:
1) выбор формы связи (уравнения регрессии);
2) выбор факторных признаков;
3) обеспечение достаточного объема совокупности для получения несмещенных оценок.
Выбор формы связи затрудняется тем, что, используя математический аппарат, теоретически зависимость между признаками может быть выражена большим числом различных функций.
Выбор типа уравнения осложнен тем, что для любой формы зависимости выбирается целый ряд уравнений, которые в определенной степени будут описывать эти связи. Некоторые предпосылки для выбора уравнения регрессии получают на основе анализа предшествующих аналогичных исследований.
Наиболее приемлемым способом определения вида уравнения регрессии является метод перебора различных уравнений.
Сущность метода заключается в том, что большое число уравнений (моделей) регрессии реализуется на ЭВМ с помощью специально разработанного алгоритма перебора с последующей статистической проверкой, главным образом на основе t-критерия Стьюдента и F-кри-терия Фишера–Снедекора.
В практике построения многофакторных моделей взаимосвязи социально-экономических явлений используются пять типов моделей:
1) линейная:
(8.32)
2) степенная:
(8.33)
3) показательная:
(8.34)
4) параболическая:
(8.35)
5) гиперболическая:
(8.36)
Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации. Нелинейные формы зависимости приводятся к линейным путем линеаризации.
Проблема размерности модели связи, т. е. определение оптимального числа факторных признаков, является одной из основных проблем построения множественного уравнения регрессии. Модель размером более 100 факторных признаков сложно реализуема и требует больших затрат времени.
Существует несколько методов отбора факторных признаков для построения модели взаимосвязи. Один из методов – метод экспертных оценок – основан на интуитивно-логических предпосылках, содержательно-качественном анализе. Наиболее приемлемым способом отбора является шаговая регрессия. Сущность метода заключается в последовательном отборе факторов в уравнение регрессии и последующей проверке их значимости.
Сложность и взаимное переплетение отдельных факторов, обуславливающих исследуемое экономическое явление, могут проявляться в так называемой мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель. Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8 ( ) и др.
Устранение мультиколлинеарности может реализовываться через исключение из модели одного или нескольких линейно-связаных факторных признаков. На основе качественного и количественного анализов отбрасываются некоторые факторные признаки. Качество уравнения регрессии зависит от степени достоверности и надежности исходных данных и объема совокупности.
Пример.По данным табл. 8.6 о прибыли (y), затратах на 1 руб. произведенной продукции (х1) и стоимости основных фондов (х2) необходимо определить зависимость между признаками.
Таблица 8.6
№ п/п | Затраты на 1 руб. произ- веденной продукции, коп. x1 | Стоимость основных фондов млн. руб., x2 | При- быль, тыс. руб. y | yx1 | yx2 | ||||
3 | 5,9 5,9 4,9 4,3 3,9 4,3 | 1 070 1 001 | 5 929 5 929 6 561 6 724 7 921 9 216 | 454,3 454,3 396,3 352,6 347,1 412,8 | 82 390 77 077 63 909 63 878 53 934 21 216 | 34,81 34,81 24,01 18,49 15,21 18,49 | 6 313,0 5 905,9 3 866,1 3 349,7 2 363,4 950,3 | 1 012,8 1 012,8 854,7 817,8 530,8 237,1 | |
Итого | 29,2 | 4 466 | 42 280 | 2 418 | 362 404 | 145,82 | 22 748,4 | 4 466,0 |
|
Таким образом,
[1, 7–11].