Методы выявления мультиколлениарности
На практике, для идентификации мультиколлениарности, наиболее часто прибегают к анализу матрицы парных коэффициентов корреляции. В паккете STATISTICA 6.0. данную процедуру можно реализовать двумя способами:
Первый способ:
Шаг 1.Выберем в главном меню Statistics ® Basic Statistics/Tables (Статистика ® Основные статистики и таблицы).
Шаг 2. В окне Basic Statistics and Tables выбреем пункт Correlation matrices (Корреляционная матрица) и нажмем кнопку ОК.
Шаг 3.В окне Moment and Partial Correlations выберем кнопку One variables listи выделим переменные для анализа Y, X1-X5, далее нажмем Summary (Итоги).
Таблица 4.1 – Матрица коэффициентов корреляции (первый способ)
Y | X1 | X2 | X3 | X4 | X5 | |
Y | 1,000 | -0,194 | 0,737 | -0,070 | 0,792 | -0,165 |
X1 | -0,194 | 1,000 | -0,123 | 0,666 | -0,154 | 0,566 |
X2 | 0,737 | -0,123 | 1,000 | -0,189 | 0,678 | -0,264 |
X3 | -0,070 | 0,666 | -0,189 | 1,000 | -0,152 | 0,313 |
X4 | 0,792 | -0,154 | 0,678 | -0,152 | 1,000 | -0,160 |
X5 | -0,165 | 0,566 | -0,264 | 0,313 | -0,160 | 1,000 |
Второй способ:
Шаг 1. В главном меню выберем Statistics ® Multiple Regression в окне Multiple Linear Regressions нажмем кнопку Variables (Зависимая переменная – Y, не зависимые – X1, X2, X3, X4, X5)
Шаг 2. Установим флажок напротив опции Review descriptive statistics, correlation matrix и нажмем кнопку ОК.
Шаг 3. В окне Review descriptive statistics (во вкладке Advanced) выберем кнопку Correlations (Корреляция).
Согласно данным, приведенным в таблице 4.2 (таблица 4.1), между переменными X2 и X4, а также X1 и X3, X5 наблюдается сильная взаимосвязь (0,678, 0,666 и 0,566 соответственно), что свидетельствует о наличии мультиколлениарности. В связи с этим при оценке модели с переменными X2 и X4 (оказывают сильное воздействие на Y) невозможно разделить влияние данных переменных на зависимую переменную, т.е. мы не можем одновременно включить переменную в модель.
Таблица 4.2 - Матрица коэффициентов корреляции (второй способ)
X1 | X2 | X3 | X4 | X5 | Y | |
X1 | 1,000 | -0,123 | 0,666 | -0,154 | 0,566 | -0,194 |
X2 | -0,123 | 1,000 | -0,189 | 0,678 | -0,264 | 0,737 |
X3 | 0,666 | -0,189 | 1,000 | -0,152 | 0,313 | -0,070 |
X4 | -0,154 | 0,678 | -0,152 | 1,000 | -0,160 | 0,792 |
X5 | 0,566 | -0,264 | 0,313 | -0,160 | 1,000 | -0,165 |
Y | -0,194 | 0,737 | -0,070 | 0,792 | -0,165 | 1,000 |
Еще одни распространенным способом выявления наличия мультиколлениарности является расчет показателей детерминации, для этого последовательно необходимо оценить пять уравнений регрессии.
В этом случае зависимая переменная Y исключается из рассмотрения, и уравнение принимает вид -
Воспользуемся модулем Multiple Regression получим следующие результаты:
Таблица 4.3 - Показатели адекватности множественного уравнения регрессии влияния независимых переменных на фактор X1
Value | |
Multiple R | 0,776 |
Multiple R? | 0,602 |
Adjusted R? | 0,549 |
F(4,30) | 11,329 |
p | 0,000 |
Std.Err. of Estimate | 1984,209 |
Согласно данным, приведенным в таблице 4.3, получаем значение коэффициента детерминации R2 X1 | X2, X3, X4, X5 равное 0,602.
Оценивая оставшиеся четыре регрессионных уравнения, получаем следующие результаты:
R2 X1 | X2, X3, X4, X5 = 0,602
R2 X2 | X1, X3, X4, X5 = 0,506
R2 X3 | X1, X2, X4, X5 = 0,469
R2 X4 | X1, X2, X3, X5 = 0,472
R2 X5 | X1, X2, X3, X4 = 0,380
Анализируя коэффициенты можно сделать вывод, что значимая связь наблюдается между всеми показателями (кроме X5) и остальными независимыми показателями, т.е. в очередной раз подтверждается наличие в имеющихся данных мультиколлениарности.