Множественная корреляция

Модульная единица 5.2. Множественная и частная корреляция. Предпосылки МНК.

Множественная корреляция.

Наиболее общим показателем тесноты связи всех входящих в уравнение регрессии факторов с результативным признаком является коэффициент множественной детерминации R2. Принципиальное содержание множественного коэффициента детерминации, как и парного, раскрывается формулой

Множественная корреляция - student2.ru (5.2.1.)

Это отношение части вариации результативного признака, объясняемой за счет вариации входящих в уравнение факторов к общей вариации результативного признака за счет всех факторов.

Для случая двухфакторной линейной связи коэффициент множественной детерминации можно вычислить из парных коэффициентов детерминации по формуле

Множественная корреляция - student2.ru (5.2.2.)

Кроме определения показателя общей тесноты связи результативного признака со всеми факторами, включенными в уравнение, множественный корреляционно-регрессионный анализ дает возможность измерить долю каждого фактора в общей вариации результативного признака. Для этого рассчитывают коэффициенты раздельной (частной) детерминации по одной из формул

1) Множественная корреляция - student2.ru , где Множественная корреляция - student2.ru (5.2.3)

2) Множественная корреляция - student2.ru (5.2.4)

Сумма коэффициентов раздельной детерминации дает множественный коэффициент детерминации

Множественная корреляция - student2.ru (5.2.5)

Качество уравнения множественной регрессии, а также его практическая значимость оценивается с помощью показателей множественной корреляции и детерминации, которые измеряют тесноту совместного влияния факторов на результат. Независимо от формы связи показатель множественной корреляции может быть найден как индекс множественной корреляции, что предполагает решение уравнения множественной регрессии и определения на его основе остаточной дисперсии

Множественная корреляция - student2.ru (5.2.6)

Величина индекса множественной корреляции должна быть больше или равна максимальному парному индексу корреляции

Множественная корреляция - student2.ru (5.2.7)

При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от индекса парной корреляции. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции (различия в третьем и далее знаках). Таким образом, сравнивая индексы множественной и парной корреляции, можно делать вывод о целесообразности включения в уравнение регрессии того или иного фактора.

При линейной зависимости признаков формула индекса корреляции может быть представлена следующим выражением

Множественная корреляция - student2.ru (5.2.8)

где β – стандартизованные коэффициенты регрессии, а r - парные коэффициенты корреляции результата с каждым фактором.

При трех переменных для двухфакторного линейного уравнения регрессии величина множественного коэффициента корреляции может быть определена по формуле

Множественная корреляция - student2.ru (5.2.9)

Индекс множественной корреляции равен коэффициенту множественной корреляции в двух случаях:

1) при линейной зависимости рассматриваемых признаков;

2) при криволинейной зависимости, нелинейной по переменным, но линейной по параметрам.

Пример.

Модель прибыли для фирмы имеет вид

y = a + b1x1 + b2 loq x2 (5.2.10.)

где у – прибыль, х1 – расходы на рекламу, х2 – капитал фирмы. Тогда независимо от того, что фактор х1 задан линейно, а фактор х2 – как логарифм, оценка тесноты связи может быть произведена с помощью линейного коэффициента множественной корреляции. Так, если

бета-коэффициенты βх1 = - 0,4 и βх2= 0,5, а парные коэффициенты корреляции rух1 и rуloqx2 = 0,7, то коэффициент множественной детерминации окажется равным R2 yx1x2 = -0,4(-0,6) + 0,5 (0,7) = 0,59. Тот же результат даст и индекс множественной детерминации, определенный через соотношение воспроизведенной и общей дисперсии результативного признака.

Иначе обстоит дело с криволинейной регрессией, нелинейной по параметрам. Рассмотрим производственную функцию Кобба-Дугласа:

Множественная корреляция - student2.ru

где

у - объем продукции;

х1 - затраты труда;

х2 - величина капитала.

Логарифмируя ее, получим линейное в логарифмах уравнение

loq y = loq a + b1loq x1 + b2loq x2

Определив параметры этого уравнения по МНК, можно найти теоретические значения объема продукции Множественная корреляция - student2.ru и соответственно остаточную сумму квадратов отклонений Множественная корреляция - student2.ru , которая используется в расчете индекса детерминации (корреляции).

Величина индекса множественной корреляции, определенная таким образом, не будет совпадать с линейным коэффициентом множественной корреляции, который может быть рассчитан для линейного в логарифмах уравнения регрессии. Это объясняется тем, что в данном случае МНК применяется не к исходным данным, а к их логарифмам, поэтому на факторную и остаточную сумму квадратов отклонений раскладывается не зависимая переменная, а ее логарифм.

Наши рекомендации