Множественная корреляция
Модульная единица 5.2. Множественная и частная корреляция. Предпосылки МНК.
Множественная корреляция.
Наиболее общим показателем тесноты связи всех входящих в уравнение регрессии факторов с результативным признаком является коэффициент множественной детерминации R2. Принципиальное содержание множественного коэффициента детерминации, как и парного, раскрывается формулой
(5.2.1.)
Это отношение части вариации результативного признака, объясняемой за счет вариации входящих в уравнение факторов к общей вариации результативного признака за счет всех факторов.
Для случая двухфакторной линейной связи коэффициент множественной детерминации можно вычислить из парных коэффициентов детерминации по формуле
(5.2.2.)
Кроме определения показателя общей тесноты связи результативного признака со всеми факторами, включенными в уравнение, множественный корреляционно-регрессионный анализ дает возможность измерить долю каждого фактора в общей вариации результативного признака. Для этого рассчитывают коэффициенты раздельной (частной) детерминации по одной из формул
1) , где (5.2.3)
2) (5.2.4)
Сумма коэффициентов раздельной детерминации дает множественный коэффициент детерминации
(5.2.5)
Качество уравнения множественной регрессии, а также его практическая значимость оценивается с помощью показателей множественной корреляции и детерминации, которые измеряют тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции, что предполагает решение уравнения множественной регрессии и определения на его основе остаточной дисперсии
(5.2.6)
Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции
(5.2.7)
При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от индекса парной корреляции. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем и далее знаках). Таким образом, сравнивая индексы множественной и парной корреляции, можно делать вывод о целесообразности включения в уравнение регрессии того или иного фактора.
При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением
(5.2.8)
где β – стандартизованные коэффициенты регрессии, а r - парные коэффициенты корреляции результата с каждым фактором.
При трех переменных для двухфакторного линейного уравнения регрессии величина множественного коэффициента корреляции может быть определена по формуле
(5.2.9)
Индекс множественной корреляции равен коэффициенту множественной корреляции в двух случаях:
1) при линейной зависимости рассматриваемых признаков;
2) при криволинейной зависимости, нелинейной по переменным, но линейной по параметрам.
Пример.
Модель прибыли для фирмы имеет вид
y = a + b1x1 + b2 loq x2 (5.2.10.)
где у – прибыль, х1 – расходы на рекламу, х2 – капитал фирмы. Тогда независимо от того, что фактор х1 задан линейно, а фактор х2 – как логарифм, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции. Так, если
бета-коэффициенты βх1 = - 0,4 и βх2= 0,5, а парные коэффициенты корреляции rух1 и rуloqx2 = 0,7, то коэффициент множественной детерминации окажется равным R2 yx1x2 = -0,4(-0,6) + 0,5 (0,7) = 0,59. Тот же результат даст и индекс множественной детерминации, определенный через соотношение воспроизведенной и общей дисперсии результативного признака.
Иначе обстоит дело с криволинейной регрессией, нелинейной по параметрам. Рассмотрим производственную функцию Кобба-Дугласа:
где
у - объем продукции;
х1 - затраты труда;
х2 - величина капитала.
Логарифмируя ее, получим линейное в логарифмах уравнение
loq y = loq a + b1loq x1 + b2loq x2
Определив параметры этого уравнения по МНК, можно найти теоретические значения объема продукции и соответственно остаточную сумму квадратов отклонений , которая используется в расчете индекса детерминации (корреляции).
Величина индекса множественной корреляции, определенная таким образом, не будет совпадать с линейным коэффициентом множественной корреляции, который может быть рассчитан для линейного в логарифмах уравнения регрессии. Это объясняется тем, что в данном случае МНК применяется не к исходным данным, а к их логарифмам, поэтому на факторную и остаточную сумму квадратов отклонений раскладывается не зависимая переменная, а ее логарифм.