Оценка парных коэффициентов корреляции
Лабораторная работа
По теме «Корреляционный анализ»
Пусть изучается случайный вектор и -совместный закон распределения случайного вектора .
Нас будут интересовать связи между компонентами случайного вектора .
Связи между случайными величинами
На практике стохастическая связь встречается чаще, чем функциональная.
Случайные величины и стахостически независимы, если их совместная плотность распределения представляется в виде произведения их частных плотностей:
Если эти условия выполняются, то случайные величины независимы, иначе, между ними есть связь, проверка этих равенств трудна даже в теории, не говоря уже о практике, поэтому для приближенной характеристики стахостически зависимых случайных величин и обычно используют:
- ковариацию cov( , )
- коэффициент корреляции
- функц.регрессии
- корреляционные отношения
Помимо аналитических способов отображения взаимосвязи признаков используется и графический анализ.
Графический анализ взаимосвязи признаков
Строим графики разброса Х-Y.А именно, исследуем связь между х1 и всеми остальными переменными попарно(х1 выберем в качестве оси Y)
И получаем следующий график (рис. 1)
Рисунок 1 – Графики разброса для переменной х1 и остальных переменных.
Из графика видно, что между признаками х1 и х2, х1 и х3, х1 и х4,x1 и х5 возможно, существует положительная связь – об этом говорит вытянутость их корреляционных полей;
Из наличия корреляции между и ,не следует, что является причиной в общем случае. Нужны дополнительные исследования. Проведем оценку парных и частных коэффициентов корреляции.
Оценка парных коэффициентов корреляции
Выдвигаем нулевую и альтернативную гипотезу :
Оценка корреляционной матрицы находится с помощью программы Gretl (рис.2):
Рисунок 2 – Вид окна Gretl с оценкой корреляционной матрицы.
Проверку значимости коэффициента корреляции мы выполняем на основе статистики Стьюдента:
Если ,то Но-отвергается и связь есть.
Также проверку можно выполнить на основе сравнения рассчитанной оценки коэффициента с критическим значением: если оценка коэффициента по модулю больше критического значения, то нулевая гипотеза о незначимости коэффициента отвергается, связь между анализируемыми признаками есть.
В нашем случае, для всех рассчитанных оценок коэффициента корреляции наблюдается наличие сильной положительной связи, т.к ,где =0,4329.Рассмотрим, например, .Это означает, что чем больше [х1 – антидемпинговая пошлина], тем больше [х2 –компенсационная пошлина], и наоборот. Так аналогично для всех.
На связь и могут оказывать влияние другие переменные, искажая её, поэтому для анализа следует использовать также частный коэффициент корреляции, характеризующий, очищенную от других переменных, взаимосвязь.