Парные коэффициенты корреляции. Коэффициент множественной корреляции. Расчет частных коэффициентов детерминации модели
Парные коэффициенты корреляции используются для измерения тесноты связи между двумя переменными без учета их взаимодействия с другими переменными.
Например,
С помощью парного линейного коэффициента корреляции выявляется связь между двумя признаками, один из которых можно рассматривать как результативный, другой — как факторный. Но в действительности на результат воздействуют несколько факторов. В связи с этим возникают два типа задач: задачи измерения комплексного влияния на результативную переменную нескольких переменных и задачи определения тесноты связи между двумя переменными при фиксированных значениях остальных переменных. Задачи первого типа решаются с помощью множественных коэффициентов корреляции, задачи второго типа — с помощью частных коэффициентов корреляции.
Коэффициент множественной корреляции (R) характеризует тесноту связи между результативным показателем и набором факторных показателей:
где σ2— общая дисперсия эмпирического ряда, характеризующая общую вариацию результативного показателя (у) за счет факторов;
σост2— остаточная дисперсия в ряду у, отражающая влияния всех факторов, кроме х;
у — среднее значение результативного показателя, вычисленное по исходным наблюдениям;
s — среднее значение результативного показателя, вычисленное по уравнению регрессии.
Коэффициент множественной корреляции принимает только положительные значения в пределах от 0 до 1. Чем ближе значение коэффициента к 1, тем больше теснота связи. И, наоборот, чем ближе к 0, тем зависимость меньше. При значении R < 0,3 говорят о малой зависимости между величинами. При значении 0,3 < R < 0,6 говорят о средней тесноте связи. При R > 0,6 говорят о наличии существенной связи.
Квадрат коэффициента множественной корреляции называется коэффициентом детерминации (D): D = R2. Коэффициент детерминации показывает, какая доля вариации результативного показателя связана с вариацией факторных показателей. В основе расчета коэффициента детерминации и коэффициента множественной корреляции лежит правило сложения дисперсий, согласно которому общая дисперсия (σ2) равна сумме межгрупповой дисперсии (δ2) и средней из групповых дисперсий σi2):
σ2=δ2 + σi2.
Межгрупповая дисперсия характеризует колеблемость результативного показателя за счет изучаемого фактора, а средняя из групповых дисперсий отражает колеблемость результативного показателя за счет всех прочих факторов, кроме изучаемого.
Математические модели корреляционного анализа в форме коэффициентов имеют ограниченные аналитические возможности. Зная лишь направление ковариации показателей и тесноту связи, невозможно определить закономерности формирования уровня результативного показателя под влиянием исследуемых факторов, оценить интенсивность их влияния, классифицировать факторы на основные и второстепенные. Для этих целей используютсямодели регрессионного анализа. Линейная модель (уравнение) регрессионного анализа может быть представлена в виде
у = bo + b1x1+ b2x2 +... + bnxn,
где у — результативный показатель;
x1, x2, ..., xn — факторные модели;
b0, b1, b2, ..., bn — коэффициенты регрессии.
Частный коэффициент детерминации показывает, насколько процентов вариация результативного признака объясняется вариацией i-го признака, входящего в множественное уравнение регрессии. Он рассчитывается по формуле
Частный коэффициент детерминации - это Предельный (граничный) вклад Го регрессора в .Он показывает, на какую величину УменьшаетсяКоэффициент детерминации, если Й регрессор (и только он!) будет исключен из группы регрессоров.
Таким образом:
Здесь:
Коэффициент детерминации, который получается при включении всех регрессоров;
Квадрат вычисленного значения Статистики для Го регрессионного коэффициента;
Длина ряда наблюдений;
Количество регрессоров;
Число степеней свободы.
Расчетное значение Статистики для Го регрессионного коэффициента при может быть определено по формуле:
.