Множественная регрессия и корреляция
Теоретическая часть
Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики.
Уравнение множественной регрессии:
,
где y — зависимая переменная (результативный признак);
xi — независимые, или объясняющие, переменные (признаки-факторы).
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.
1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.
Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором m-факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии m-факторов. Влияние других, не учтенных в модели факторов, оценивается как 1 – R2 с соответствующей остаточной дисперсией S2.
При дополнительном включении в регрессию m + 1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:
и .
Если же этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор Xm+1 не улучшает модель и практически является лишним фактором.
Для нахождения параметров множественной регрессии также используют метод наименьших квадратов.
Система линейных нормальных уравнений для нахождения параметров линейного уравнения множественной регрессии имеет вид:
Метод наименьших квадратов применим и к уравнению множественной регрессии в стандартизированном масштабе:
,
где | — стандартизированные переменные , , для которых среднее значение равно нулю: , а среднее квадратическое отклонение равно единице ; |
bi | — стандартизированные коэффициенты регрессии. |
Стандартизованные коэффициенты регрессии показывают, на сколько единиц изменится в среднем результат, если соответствующий фактор изменится на одну единицу при неизменном среднем уровне других факторов.
Коэффициенты «чистой» регрессии bi связаны со стандартизованными коэффициентами регрессии bi следующим образом:
.
Средние по совокупности показатели эластичности рассчитываются по формуле
.
Они показывают, на сколько процентов в среднем изменится результат при изменении соответствующего фактора на 1%. Средние показатели эластичности можно сравнивать друг с другом и, соответственно, ранжировать факторы по силе их воздействия на результат.
Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата — показателя детерминации.
Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком или, иначе, оценивает тесноту совместного влияния факторов на результат.
Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:
,
где – общая дисперсия результативного признака; – остаточная дисперсия.
Границы изменения индекса множественной корреляции — от 0 до 1.
Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F‑критерия Фишера:
,