Глава 9. коэффициент корреляции
Задача №1 Расчет коэффициента корреляции методом квадратов (метод Пирсона).
На основании приведенных данных требуется:
1. Вычислить коэффициент корреляции;
2. Определить характер и силу связи между соответствующими признаками.
3. Определить достоверность коэффициента корреляции.
Длина и масса тела у десяти мальчиков в возрасте 7 лет:
Длина тела, см (X) | масса тела, кг (Y) |
Решение:
Для решения данной задачи используем формулу Пирсона:
1). Определяем средние арифметические в обеих группах:
Длина
Масса
2). Определяем отклонения каждой варианты от среднего арифметического значения. d = V – M;
Таблица 1
Длина тела, см (V) | d(x) | масса тела, кг (V) | d(y) |
-8,5 | -1,3 | ||
-10,5 | -2,3 | ||
-5,5 | -1,3 | ||
4,5 | 2,7 | ||
2,5 | -0,3 | ||
-2,5 | -1,3 | ||
6,5 | -0,3 | ||
1,5 | -1,3 | ||
3,5 | 0,7 | ||
8,5 | 4,7 | ||
M=103,5 | M=16,3 |
3). Находим сумму произведений соответствующих отклонений:
dx1*dy1 + dx2*dy2 +….. (см. таб. 2).
4). Находим сумму квадратов отклонений отдельно по каждому столбику:
dx12 + dx22 +….. (см. таб.2).
Таблица 1
Длина тела, см | dx | dx2 | масса тела, кг | dy | dy2 | dx*dy | |
-8,5 | 72,25 | -1,3 | 1,69 | 11,05 | |||
-10,5 | 110,25 | -2,3 | 5,29 | 24,15 | |||
-5,5 | 30,25 | -1,3 | 1,69 | 7,15 | |||
4,5 | 20,25 | 2,7 | 7,29 | 12,15 | |||
2,5 | 6,25 | -0,3 | 0,09 | -0,75 | |||
-2,5 | 6,25 | -1,3 | 1,69 | 3,25 | |||
6,5 | 42,25 | -0,3 | 0,09 | -1,95 | |||
1,5 | 2,25 | -1,3 | 1,69 | -1,95 | |||
3,5 | 12,25 | 0,7 | 0,49 | 2,45 | |||
8,5 | 72,25 | 4,7 | 22,09 | 39,95 | |||
M=103,5 | ∑=374,5 | . | M=16,3 | ∑=42,1 | ∑=95,5 |
Коэффициент корреляции равный +0,76 свидетельствует о наличии прямой сильной связи между ростом 7-летних детей и массой их тела.
Определяем достоверность коэффициента корреляции:
А) вычисляем его ошибку
Б) определяем доверительный коэффициент (t) и степень вероятности безошибочного прогноза (p):
достоверность коэффициента корреляции определяется по формуле:
Критерий достоверности (t) должен быть равен или больше 2, что соответствует вероятности безошибочного прогноза (p) ≥ 95%/
Задача №2 Расчет коэффициента корреляции методом рангов (метод Спирмена).
На основании приведенных данных требуется:
1. Вычислить коэффициент корреляции;
2. Определить характер и силу связи между соответствующими признаками.
3. Определить достоверность коэффициента корреляции.
Экспертами оценивались вкусовые качества разных вин.
Суммарные оценки получены следующие:
Марка вина | Оценка в баллах | Цена, в у.е. |
1.57 | ||
1.60 | ||
2.00 | ||
2.10 | ||
1.70 | ||
1.85 | ||
1.80 | ||
1.15 | ||
2.30 | ||
2.40 |
Согласуется ли оценка вина с его ценой. Проверьте эту гипотезу методами ранговой корреляции.
Решение:
Для оценки тесноты связи применим коэффициент Спирмена.
Формула:
где: - квадрат разности между рангами взаимосвязанных признаков X и Y;
n – число пар рангов.
Ранжировать оба признака необходимо в одном и том же направлении: либо от меньших значений к большим, либо наоборот.
Если среди значений признаков X и Y встречается несколько одинаковых, образуются связанные ранги, т.е. одинаковые средние номера. Например, вместо одинаковых по порядку третьего и четвертого значений признака X будут два ранга по 3.5.
Расчет показателей взаимосвязи цены и качества вина:
Марка вина | Ранг | Разность рангов | ||
Ранг оценки в баллах | Ранг цены в у.е. | |||
-2 | ||||
3.5 | -0.5 | 0.25 | ||
3.5 | -2.5 | 6.25 | ||
Итого | - | - | - | 23.5 |
Коэффициент Спирмена =
Таким образом, величина рангового коэффициента корреляции Спирмена свидетельствует о прямой, довольно тесной связи между рассматриваемыми показателями.
А) вычисляем его ошибку
Б) определяем доверительный коэффициент (t) и степень вероятности безошибочного прогноза (p):
достоверность коэффициента корреляции определяется по формуле:
Критерий достоверности (t) должен быть равен или больше 2, что соответствует доверительной вероятности безошибочного прогноза ≥ 95% (уровень значимости p≤0,05).
Задания для самостоятельной работы
Вариант №1
На основании приведенных данных требуется:
· Вычислить коэффициент корреляции по методу квадратов (метод Пирсона).
· Определить характер и силу связи между соответствующими признаками.
Длина и масса тела у десяти мальчиков в возрасте 7 лет:
Длина тела, см | масса тела, кг |
Вариант №2
На основании приведенных данных требуется:
· Вычислить коэффициент ранговой корреляции (метод Спирмена).
· Определить характер и силу связи между соответствующими признаками.
Возраст матери и количество сцеженного грудного молока:
Возраст матери | Кол-во сцеженного молока |
Вариант №3
На основании приведенных данных требуется вычислить:
· Вычислить коэффициент ранговой корреляции (метод Спирмена).
· Определить характер и силу связи между соответствующими признаками.
Длина и масса тела у десяти новорожденных:
Длина тела, см | масса тела, кг |
4,5 | |
3,6 | |
4,1 | |
3,2 | |
3,8 | |
3,9 | |
3,9 | |
4,3 |
Вариант №4
На основании приведенных данных требуется:
· Вычислить коэффициент ранговой корреляции (метод Спирмена).
· Определить характер и силу связи между соответствующими признаками.
Результаты измерения систолического и диастолического давления у десяти здоровых девушек в возрасте 15 лет:
Уровень систолического давления | Уровень диастолического давления |
Вариант №5
На основании приведенных данных требуется:
· Вычислить коэффициент корреляции по методу квадратов (метод Пирсона).
· Определить характер и силу связи между соответствующими признаками.
Длина и масса тела у десяти девочек в возрасте 5,5 лет
Длина тела, см | масса тела, кг |
Вариант №6
На основании приведенных данных требуется:
· Вычислить коэффициент корреляции по методу квадратов (метод Пирсона).
· Определить характер и силу связи между соответствующими признаками.
Вероятность летального исхода от сосудистых нарушений мозгового кровообращения:
Возраст | Вероятность смерти от СНМК |
5,6 | |
5,7 | |
5,7 | |
5,6 | |
7,6 | |
7,7 | |
9,3 | |
10,7 | |
10,5 |
Вариант №7
На основании приведенных данных требуется:
· Вычислить коэффициент корреляции по методу квадратов (метод Пирсона).
· Определить характер и силу связи между соответствующими признаками.
Результаты измерения роста и массы десяти девушек в возрасте 21 год:
Длина тела, см | масса тела, кг |
Вариант №8
На основании приведенных данных требуется:
· Вычислить коэффициент ранговой корреляции (метод Спирмена).
· Определить характер и силу связи между соответствующими признаками.
Частота раннего прикорма и заболеваемость желудочно-кишечными заболеваниями на 100 детей в возрасте до одного года по десяти районам области соответственно:
Частота раннего прикорма | Желудочно-кишечные заболевания |
Вариант №9
На основании приведенных данных требуется:
· Вычислить коэффициент корреляции по методу квадратов (метод Пирсона).
· Определить характер и силу связи между соответствующими признаками.
Зависимость заболеваемости гриппом на 10000 населения от вакцинации по районам города Новосибирска.
Районы города Новосибирска | Процент населения, охваченных вакцинацией от гриппа | Заболеваемость гриппом на 10000 населения |
Центральный | ||
Калининский | ||
Октябрьский | ||
Железнодорожн. | ||
Заельцовский | ||
Советский | ||
Дзержинский | ||
Ленинский | ||
Кировский | ||
Первомайский |
Вариант №10
На основании приведенных данных требуется:
· Вычислить коэффициент ранговой корреляции (метод Спирмена).
· Определить характер и силу связи между соответствующими признаками.
Результаты измерения систолического и диастолического давления у десяти больных артериальной гипертонией.
Уровень систолического давления | Уровень диастолического давления |
Вариант №11
На основании приведенных данных требуется:
· Вычислить коэффициент корреляции по методу квадратов (метод Пирсона).
· Определить характер и силу связи между соответствующими признаками.
Смертность от рака молочной железы и рака шейки матки в 10 районах области.
Смертность от рака молочной железы | Смертность от рака шейки матки |
29,3 | 15,6 |
24,5 | 17,9 |
21,1 | 5,9 |
17,3 | 8,7 |
18,9 | 13,2 |
9,5 | 17,4 |
19,7 | 21,5 |
31,4 | 16,2 |
17,3 | 18,9 |
15,0 | 21,0 |
Вариант №12
На основании приведенных данных требуется вычислить:
· Вычислить коэффициент ранговой корреляции (метод Спирмена).
· Определить характер и силу связи между соответствующими признаками.
Длина и масса тела у десяти студентов
Длина тела, см | масса тела, кг |