Проверка значимости парных коэффициентов корреляции
Исходные данные
объект | наблюдаемые признаки | ||
X -средняя продолжительность жизни женщин | Y -уровень рождаемости (число родившихся на 1000 жителей) | Z -уровень смертности (число умерших на 1000 жителей) | |
Беларусь | 76 | 13 | 11 |
Босния | 78 | 14 | 6 |
Болгария | 75 | 13 | 12 |
Хорватия | 77 | 11 | 11 |
Чехия | 77 | 13 | 11 |
Эстония | 76 | 14 | 12 |
Грузия | 76 | 16 | 9 |
Венгрия | 76 | 12 | 12 |
Латвия | 75 | 14 | 10 |
Литва | 77 | 15 | 10 |
Польша | 77 | 14 | 10 |
Румыния | 75 | 14 | 10 |
Россия | 74 | 13 | 11 |
Украина | 75 | 12 | 13 |
I. Корреляционный анализ
Постановка задачи
Требуется на основании указанных в приведенной таблице статистических данных для n=14 стран, отобранных случайным образом, исследовать стохастическую зависимость между социальными показателями X, Y, Z, полагая, что их совместное распределение подчинено трехмерному нормальному закону.
К вопросам анализа относятся:
- оценка тесноты связи между произвольными двумя наблюдаемыми признаками при фиксировании или исключении влияния третьего признака;
- оценка тесноты связи каждого из рассматриваемых признаков с совокупностью остальных признаков;
- проверка значимости коэффициентов связи;
- интервальное оценивание коэффициентов связи.
- построение модели корреляционной зависимости между признаками.
Определение точечных оценок параметров совместного распределения признаков. Формирование выборочной корреляционной матрицы
Признаки X, Y, Z образуют трехмерную нормально распределенную генеральную совокупность, которая определяется девятью параметрами:
• тремя математическими ожиданиями MX, MY, MZ;
• тремя дисперсиями DX, DY, DZ;
• тремя парными коэффициентами корреляции ρxy; ρxz; ρyz.
Выборочные средние
Выборочные средние квадратические отклонения
Выборочные парные коэффициенты корреляции
Матрица выборочных парных коэффициентов корреляции
q3= |
|
Исследование парных коэффициентов корреляции
Парный коэффициент корреляции численно характеризует тесноту связи между произвольными двумя признаками, выбранными из совокупности рассматриваемых показателей, на фоне влияния третьего показателя, введенного в корреляционный анализ.
Проверка значимости парных коэффициентов корреляции
(при уровне значимости применяемого статистического критерия α=0,05)
Проверяемые гипотезы:
H0: ρxy=0 | H0: ρxz=0 | H0: ρyz=0 |
Наблюдаемые значения статистики критерия:
Нахождение tкр - граничного значения области отвержения гипотезы
Способы:
Ø или из статистической таблицы 2 (Значения функции , где случайная величина Т распределена по закону Стьюдента с числом степеней свободы, равным ν) на основании уравнения:
,
Ø или с помощью статистической функции Microsoft Excel СТЬЮДРАСПОБР(вероятность;степени_свободы):
tкр=СТЬЮДРАСПОБР(α;n-2).
В данном случае
tкр=2,1788.
Условие отвержения гипотезы
о незначимости коэффициента корреляции
.
Результаты проверки гипотез:
v гипотеза H0: ρxy=0не отвергается, парный коэффициент корреляции между X и Y не значим;
v гипотеза H0: ρxz=0не отвергается, парный коэффициент корреляции между X и Z не значим;
v гипотеза H0: ρyz=0отвергается, парный коэффициент корреляции между Y и Z значим.
Вывод
Между признаками Y, Z существует значимая обратная умеренная корреляционная зависимость.