Множественная регрессия и корреляция

Теоретическая часть

Множественная регрессия широко используется в решении проблем спроса, доходности акций, при изучении функции издержек производства, в макроэкономических расчетах и целом ряде других вопросов эконометрики.

Уравнение множественной регрессии:

,

где y — зависимая переменная (результативный признак);

xi — независимые, или объясняющие, переменные (признаки-факторы).

Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели. Он включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.

Факторы, включаемые во множественную регрессию, должны отвечать следующим требованиям.

1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.

Включаемые во множественную регрессию факторы должны объяснить вариацию независимой переменной. Если строится модель с набором m-факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии m-факторов. Влияние других, не учтенных в модели факторов, оценивается как 1 – R2 с соответствующей остаточной дисперсией S2.

При дополнительном включении в регрессию m + 1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться:

и .

Если же этого не происходит и данные показатели практически не отличаются друг от друга, то включаемый в анализ фактор Xm+1 не улучшает модель и практически является лишним фактором.

Для нахождения параметров множественной регрессии также используют метод наименьших квадратов.

Система линейных нормальных уравнений для нахождения параметров линейного уравнения множественной регрессии имеет вид:

Метод наименьших квадратов применим и к уравнению множественной регрессии в стандартизированном масштабе:

,

где — стандартизированные переменные , , для которых среднее значение равно нулю: , а среднее квадратическое отклонение равно единице ;
bi — стандартизированные коэффициенты регрессии.

Стандартизованные коэффициенты регрессии показывают, на сколько единиц изменится в среднем результат, если соответствующий фактор изменится на одну единицу при неизменном среднем уровне других факторов.

Коэффициенты «чистой» регрессии bi связаны со стандартизованными коэффициентами регрессии bi следующим образом:

.

Средние по совокупности показатели эластичности рассчитываются по формуле

.

Они показывают, на сколько процентов в среднем изменится результат при изменении соответствующего фактора на 1%. Средние показатели эластичности можно сравнивать друг с другом и, соответственно, ранжировать факторы по силе их воздействия на результат.

Практическая значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата — показателя детерминации.

Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком или, иначе, оценивает тесноту совместного влияния факторов на результат.

Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции:

,

где – общая дисперсия результативного признака; – остаточная дисперсия.

Границы изменения индекса множественной корреляции — от 0 до 1.

Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F‑критерия Фишера:

,

Наши рекомендации