Измерение тесноты и силы корреляционной связи с использованием коэффициента детерминации и эмпирического корреляционного отношения
Эмпирический коэффициент детерминации оценивает силу связи, определяя, насколько вариация результативного признака Y объясняется вариацией фактора Х (остальная часть вариации Y объясняется вариацией прочих факторов). Показатель рассчитывается как доля межгрупповой дисперсии в общей дисперсии по формуле
, (9)
где – общая дисперсия признака Y,
– межгрупповая (факторная) дисперсия признака Y.
Значения показателя изменяются в пределах . При отсутствии корреляционной связи между признаками Х и Y имеет место равенство =0, а при наличии функциональной связи между ними - равенство =1.
Общая дисперсия характеризует вариацию результативного признака, сложившуюся под влиянием всех действующих на Y факторов (систематических и случайных). Этот показатель вычисляется по формуле
, (10)
где yi – индивидуальные значения результативного признака;
– общая средняя значений результативного признака;
n – число единиц совокупности.
Общая средняя вычисляется как средняя арифметическая простая по всем единицам совокупности:
(11)
или как средняя взвешенная по частоте групп интервального ряда:
(12)
Для вычисления удобно использовать формулу (11), т.к. в табл. 8 (графы 3 и 4 итоговой строки) имеются значения числителя и знаменателя формулы.
Расчет по формуле (11):
Для расчета общей дисперсии применяется вспомогательная таблица 12.
Таблица 12
Вспомогательная таблица для расчета общей дисперсии
Номер банка п/п | Прибыль, млн руб. | |||
Итого |
Расчет общей дисперсии по формуле (10):
Общая дисперсия может быть также рассчитана по формуле
,
где – средняя из квадратов значений результативного признака,
– квадрат средней величины значений результативного признака.
Для демонстрационного примера
Тогда
Межгрупповая дисперсия измеряет систематическую вариацию результативного признака, обусловленную влиянием признака-фактора Х (по которому произведена группировка). Воздействие фактора Х на результативный признак Y проявляется в отклонении групповых средних от общей средней . Показатель вычисляется по формуле
, (13)
где –групповые средние,
– общая средняя,
–число единиц в j-ой группе,
k – число групп.
Для расчета межгрупповой дисперсии строится вспомогательная таблица 13 При этом используются групповые средние значения из табл. 8 (графа 5).
Таблица 13
Вспомогательная таблица для расчета межгрупповой дисперсии
Группы банков по размеру кредитных вложений, млн руб. | Число банков, | Среднее значение в группе | ||
40 – 90 | ||||
90 – 140 | ||||
140 – 190 | ||||
190 – 240 | ||||
Итого |
Расчет межгрупповой дисперсии по формуле (11):
Расчет эмпирического коэффициента детерминации по формуле (9):
или %
Эмпирическое корреляционное отношение оценивает тесноту связи между факторным и результативным признаками и вычисляется по формуле
(14)
Значение показателя изменяются в пределах . Чем ближе значение к 1, тем теснее связь между признаками. Для качественной оценки тесноты связи на основе служит шкала Чэддока (табл. 14):
Таблица 14
Шкала Чэддока
h | 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
Характеристика силы связи | Слабая | Умеренная | Заметная | Тесная | Весьма тесная |
Расчет эмпирического корреляционного отношения по формуле (14):
3. Оценка статистической значимости коэффициента детерминации .
Для проверки значимости коэффициента детерминации служит дисперсионный F-критерий Фишера, который рассчитывается по формуле
,
где n – число единиц выборочной совокупности,
m – количество групп,
– межгрупповая дисперсия,
– дисперсия j-ой группы (j=1,2,…,m),
– средняя арифметическая групповых дисперсий.
Величина рассчитывается, исходя из правила сложения дисперсий:
,
где – общая дисперсия.
Фрагмент таблицы Фишера критических величин F-критерия для значений =0,05; k1=3,4,5; k2=24-35 представлен ниже:
k2 | ||||||||||||
k1 | ||||||||||||
3,01 | 2,99 | 2,98 | 2,96 | 2,95 | 2,93 | 2,92 | 2,91 | 2,90 | 2,89 | 2,88 | 2,87 | |
2,78 | 2,76 | 2,74 | 2,73 | 2,71 | 2,70 | 2,69 | 2,68 | 2,67 | 2,66 | 2,65 | 2,64 | |
2,62 | 2,60 | 2,59 | 2,57 | 2,56 | 2,55 | 2,53 | 2,52 | 2,51 | 2,50 | 2,49 | 2,48 |
Расчет дисперсионного F-критерия Фишера для оценки = , полученной при = , = :
Fрасч
Табличное значение F-критерия при = 0,05:
n | m | k1=m-1 | k2=n-m | Fтабл ( ,4, 26) |
Задание 3