Множественный коэффициент корреляции
является мерой линейной зависимости между одной переменной Хi и множеством переменных .
Вычисляется по формуле
,
где det R – определитель матрицы R.
Rii – алгебраическое дополнение к элементу rii корреляционной матрицы R.
Пусть m = 3, т.е. имеются три переменные Х1, Х2, Х3. Положим
i = 1, тогда , т.е. необходимо вычислить множественный коэффициент корреляции между Х1 и переменными Х2, Х3.
Множественный коэффициент корреляции изменяется от 0 до 1. Нулевое значение этого коэффициента указывает, что Xi не зависит линейно от множества переменных, входящих в Z. Чем ближе множественный коэффициент корреляции к единице, тем сильнее линейная зависимость, а значение, равное единице, указывает на функциональную линейную зависимость, например, .
По данным предыдущего примера вычислим множественный коэффициент корреляции
Итак, парный коэффициент корреляции между себестоимостью и зарплатой r21 = 0,92, а R2.13 = 0,959, т.е. зависимость себестоимости от зарплаты и оплаты за материалы близка к функциональной.
Вопросы для самопроверки
6.1. Какие виды зависимостей Вы знаете? В чем отличие функциональной зависимости от статистической?
6.2. Какие задачи решает корреляционный анализ?
6.3. Дайте определение корреляционной зависимости.
6.4. Как визуально определить существование корреляционной зависимости?
6.5. Постройте корреляционную таблицу по выборке объема n.
6.6. Укажите формулы, по которым вычисляется коэффициент корреляции по выборке объема n: а) n мало; б) n велико.
6.7. Укажите свойства выборочного коэффициента корреляции.
6.8. Как проверяется значимость коэффициента корреляции?
6.9. Объясните смысл коэффициента детерминации.
6.10. Запишите корреляционную матрицу R и объясните смысл ее элементов.
6.11. Как вычисляется частный коэффициент корреляции? Объясните его смысл.
6.12. Объясните смысл множественного коэффициента корреляции и приведите формулу для его вычисления по корреляционной матрице.
Задачи
7.1. Предприятие имеет большое число филиалов. В табл. 4.2 приведены данные о годовом доходе (Y в миллионах рублей) и торговой площади (Х в тыс. кв. м) по 12 филиалам.
Таблица 4.2
№ филиала | Y | X |
2,93 | 0,31 | |
5,27 | 0,98 | |
6,85 | 1,21 | |
7,01 | 1,29 | |
7,02 | 1,12 | |
8,35 | 1,49 | |
4,33 | 0,78 | |
5,77 | 0,94 | |
7,68 | 1,29 | |
3,16 | 0,48 | |
1,52 | 0,24 | |
3,15 | 0,55 |
1. Построить диаграмму рассеяния переменных Y, Х и по ней определить, существует ли линейная зависимость между торговой площадью и годовым доходом.
2. Вычислить выборочный коэффициент корреляции между
Y и Х и проверить гипотезу о его значимости на уровне значимости
a = 0,10.
Таблица 4.3. | |||
Х | Y | ||
8,9 | 4,4 | ||
8,4 | 4,2 | ||
7,4 | 4,2 | ||
7,2 | 4,1 | ||
7,0 | 3,8 | ||
6,1 | 3,8 | ||
5,9 | 3,6 | ||
5,8 | 3,5 | ||
5,5 | 3,3 | ||
4,8 | 3,2 |
7.2. Данные, приведенные ниже (табл. 4.3), представляют собой объем продажи (в тысячах миллионов усл. ед.) Х и чистый доход Y (в миллионах усл. ед.) 20 фирм. Будет ли объем продажи определять доход?
1. Нарисуйте диаграмму рассеяния и визуально определите по ней, существует ли линейная зависимость между Х и Y.
2. С помощью парного коэффициента корреляции измерьте тесноту связи между Х и Y. Проверьте, совпало ли Ваше предположение в п.1 с полученным результатом.
3. Проверьте на уровне значимости a = 0,05 гипотезу о равенстве нулю коэффициента корреляции .
4. Найдите коэффициент детерминации и объясните его смысл.
7.3. В таблице 4.4 приведены данные относительно среднего дохода Х и потребления Y для нескольких профессиональных групп (ПГ). Данные дифференцированы для жителей городов и сельской местности.
Таблица 4.4
ПГ | Город | Сельская местность | ||
Х | Y | Х | Y | |
198,46 | 191,42 | 118,18 | 114,13 | |
483,31 | 507,18 | 291,95 | 287,85 | |
278,07 | 277,60 | 272,76 | 272,41 | |
234,25 | 230,60 | 170,67 | 173,60 | |
163,05 | 162,45 | 109,88 | 107,16 | |
112,83 | 113,50 | 127,75 | 130,24 | |
202,05 | 210,75 | 160,10 | 154,35 | |
148,05 | 143,04 | 138,27 | 136,78 | |
148,59 | 145,46 | 116,66 | 115,07 | |
131,57 | 127,43 | 119,48 | 118,25 |
1. Вычислите парные коэффициенты корреляции для города и сельской местности в отдельности и общий. Сравните их.
2. Проверьте на уровне значимости a = 0,20 гипотезу о некоррелированности Х и Y для коэффициентов корреляции из п.1.
3. Вычислите коэффициенты детерминации и объясните их смысл.
7.4. Зависимость выпуска валовой продукции (Y) от объема основных фондов (Х) легкой промышленности задана таблицей 4.5. (в условных единицах)
Таблица 4.5
Y Х | 0,00–0,62 | 0,62–1,24 | 1,24–1,86 | 1,86–2,48 | 2,48–3,10 |
0,0 - 1,4 | |||||
1,4 - 2,8 | |||||
2,8 - 4,2 | |||||
4,2 - 5,6 | |||||
5,6 - 7,0 |
1. Определить визуально, существует ли линейная зависимость между объемом основных фондов и валовой продукцией.
2. Найти парный коэффициент корреляции rxy и проверить его значимость на уровне a = 0,10. Указание.
7.5. Дана корреляционная матрица
.
Найти частные коэффициенты корреляции r12.3, r13.2, r23.1 и множественный коэффициент корреляции R1.23. Объясните смысл полученных коэффициентов.