Множественная или многофакторная регрессия
Изучение связи между 3-мя и более связанными между собой признаками называется множественной или многофакторной регрессией.
При исследовании зависимостей методами множественной регрессии задача формулируется так же, как и при парной регрессии, т.е. требуется определить аналитическое выражение связи между результативным признаком y и факторными признаками x1, x2, …, xn. и найти функцию у=f(x1, x2, …, xn).
Построение моделей множественной регрессии включает несколько этапов:
1. Выбор формы связи, т.е. уравнения регрессии;
2. Отбор факторных признаков;
3. Обеспечение достаточно большого объема совокупности для получения несмещенных оценок.
Наиболее приемлемым способом определения вида исходного уравнения регрессии является метод перебора различных уравнений. Сущность данного метода заключается в том, что большое чисто уравнений регрессии, отобранных для описания связей какого-либо социально-экономического явления или процесса, реализуется на ЭВМ с помощью специально разработанных алгоритмов перебора с последующей статистической проверкой на основе критерия Стьюдента и критерия Фишера.
Реально существующие зависимости между социально-экономическими явлениями можно описать, используя пять типов моделей:
1. Линейная
2. Степенная
3. Показательная
4. Параболическая
5. Гиперболическая
Проблема отбора факторных признаков для построения модели взаимосвязи может быть решена на основе эвристических или многомерных статистических методов анализа.
1. Метод экспертных оценок. Как эвристический метод анализа основных макроэкономических показателей. Основан на интуитивно-логических предпосылках и содержательно-качественном анализе. Анализ экспертной информации проводится на базе расчета и анализа непараметрических показателей связи.
2. Шаговая регрессия. Сущность данного метода заключается в последовательном включении факторов в уравнение регрессии и последующей проверке их значимости. Одновременно используется и обратный метод, т. е. исключение факторов, ставших незначимыми на основе t-критерия Стьюдента. Фактор является незначимым, если его включение в уравнение регрессии только изменяет значение коэффициентов регрессии, не уменьшая суммы квадратов остатков и не увеличивая их значения.
Сложность и взаимное переплетение отдельных факторов, обуславливающих исследуемое экономическое явление (процесс), могут проявляться в так называемой мультиколлинеарности. Под мультиколлинеарностью понимается тесная зависимость между факторными признаками, включенными в модель.
Одним из индикаторов определения наличия мультиколлинеарности между признаками является превышение парным коэффициентом корреляции величины 0,8.
Аналитическая форма выражения связи результативного признака и ряда факторных называется многофакторным (множественным) уравнением регрессии, или моделью связи. Уравнение линейной множественной регрессии имеет следующий вид:
где - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
x1, x2, …, xk – факторные признаки;
а1, а2, …, аk – параметры модели (коэффициенты регрессии).
Система нормальных уравнений с k-неизвестными по числу параметров . Имеет следующий вид:
Одним из способов построения множественных уравнений регрессии является построение модели связи в стандартизированном масштабе. Модель регрессии в таком масштабе предполагает, что все значения исследуемых признаков переводятся в стандарты по формуле:
где - значение признака в натуральном масштабе.