Методика множественного корреляционного анализа. Анализ корреляционной зависимости (КА) переменных позволяет установить наличие связи между анализируемыми переменными
Анализ корреляционной зависимости (КА) переменных позволяет установить наличие связи между анализируемыми переменными, оценить ее тесноту и определить направление (прямая или обратная связь). Кроме того, в ходе КА происходит отбор существенных факторов, включаемых в уравнение регрессии.
В ходе множественного КА рассчитываются следующие характеристики:
- парные коэффициенты корреляции – оценки тесноты линейной корреляционной связи между всеми парами анализируемых признаков с учетом их взаимного влияния и взаимодействия. Совокупность парных коэффициентов корреляции, относящихся ко всем исследуемым признакам, может быть представлена в виде корреляционной матрицы R, которая рассчитывается по формуле
, (2.1)
где – матрица стандартизованных значений исходных переменных. Ее элементы рассчитываются по формуле
.
На главной диагонали матрицы R стоят единицы, т.е. дисперсии стандартизованных переменных, другие элементы — парные коэффициенты корреляции ;
- частные коэффициенты корреляции , характеризующие тесноту линейной корреляционной связи между парой анализируемых признаков ( и )без учета влияния на эту пару других переменных ( , , и т.д.). Эти коэффициенты характеризуют так называемую чистую корреляцию. В матричном виде формулу для расчета частных коэффициентов корреляции можно записать следующим образом:
, (2.2)
где , , – алгебраические дополнения соответствующих элементов матрицы парных корреляций R.
Знак частному коэффициенту корреляции присваивается такой же, как и у парного коэффициента корреляции;
-множественный коэффициент корреляции характеризует степень тесноты связи между результативным признаком (откликом) и всеми факторными признаками (предикторами – );
-множественный коэффициент детерминации характеризует долю дисперсии результативной переменной, обусловленную влиянием факторных переменных, участвующих в анализе. На основе корреляционной матрицы R множественный коэффициент корреляции и множественный коэффициент детерминации могут быть исчислены следующим образом:
; , (2.3)
где – определитель матрицы парных корреляций, – определитель матрицы парных корреляций, полученной после вычеркивания строки и столбца, представляющих связи зависимой переменной ( ).
Пример 1. По пяти промышленным предприятиям имеются следующие данные о фондовооруженности труда рабочих ( ), уровне производительности труда ( ), удельном весе потерь от брака ( ) (таблица 2.1).
Таблица 2.1
Номер предприятия | Фондовооруженность труда рабочего, тыс. ден. ед. | Месячная производительность труда рабочего, тыс. ден. ед. | Удельный вес потерь от брака, % |
3,9 | 7,0 | 2,4 | |
1,1 | 11,1 | 5,9 | |
1,8 | 10,2 | 6,2 | |
6,0 | 12,0 | 6,0 | |
5,4 | 10,0 | 11,0 | |
Определить:
1) матрицы парных и частных коэффициентов корреляции;
2) множественный коэффициент детерминации и множественный коэффициент корреляции при условии, что – зависимая переменная;
3) матрицу ковариаций.
Решение.
1 Парные коэффициенты корреляции рассчитываются следующим образом:
;
;
.
Матрица парных коэффициентов корреляции имеет вид
.
2 Частные коэффициенты корреляции рассчитываются по формуле
; ; ;
;
;
.
Матрица частных коэффициентов корреляции ( ) будет иметь вид
.
3 Множественный коэффициент корреляции определяется по формуле
; .
4. Элементы ковариационной матрицы определяются по формуле
.
В многомерном статистическом анализе ковариации принято иногда обозначать как (по аналогии с дисперсиями).
Рассчитаем последовательно все элементы ковариационной матрицы:
;
;
; ;
; .
Матрица ковариаций будет иметь следующий вид:
.
На основании матрицы ковариаций можно сравнить вариацию признаков в исследуемой статистической совокупности. Для этого рассчитаем коэффициенты ковариации по каждой переменной:
; ;
; .
Как показывают расчеты, исследуемая совокупность наиболее однородна по второй переменной – месячная производительность труда, а наименее однородна по переменной – фондовооруженность труда рабочего.
Используя элементы ковариационной матрицы, можно также проверить правильность расчета парных линейных коэффициентов корреляции
.
Например, коэффициент корреляции между переменными и будет равен
,
а в корреляционной матрице он равен 0,048, т.е. имеется небольшое расхождение за счет округлений.