Корреляционно регрессионный анализ
Корреляция– понятие, которое означает взаимосвязь между признаками.
Различают две формы проявления количественных связей между явлениями и процессами: функциональную и корреляционную.
Под функциональной понимают такую связь, при которой значению одного признака отвечает конкретное значение другого (радиусу круга отвечает соответствующая площадь круга). Функциональная связь характерна для физико-химических процессов.
В социально гигиенических исследованиях, а также в клинической медицине и биологии зависимость между явлениями носит другой характер – характер корреляционной связи. При корреляционной связи значению каждой средней величины одного признака отвечает несколько значений другого взаимосвязанного с ней признака ( например, в группе лиц с одинаковым ростом наблюдаются разные колебания массы тела ).
Коэффициент корреляции (rху) одним числом измеряет силу связи между явлениями, которые изучаются и его направление.
По направлению связь может быть прямым (+) и обратном (-). При прямой связи с увеличением значений одного признака растет среднее значение другого признака (например, повышение температуры тела увеличивает частоту пульса). При обратной связи с увеличением одного признака уменьшается среднее значение другого признака (например, чем низшая температура воздуха в осенний период, тем высшая заболеваемость детей острым бронхитом ).
По силе связи коэффициент корреляции колеблется от единицы (полная связь) к нулю (отсутствует связь).
Сила связи | Прямой ( + ) | Обратной ( - ) |
Полный | + 1,0 | - 1,0 |
Сильный | Вот + 1,0 к + 0,7 | Вот – 1,0 к – 0,7 |
Средний | » + 0,7 » + 0,3 | » - 0,7 » - 0,3 |
Слабый | » + 0,3 » + 0,1 | » - 0,3 » - 0,1 |
Отсутствует связь |
При небольшом количестве наблюдений (n < 30), коэффициент линейной корреляции (Пирсона) определяется за следующей формулой:
r xy = В d x х dу
Ö å d2х x d2у
где х и в – переменные варианты співставних варіаційих рядов, dx и dy – отклонение каждой переменной ( варианты ) от средней арифметической.
Ошибка коэффициента корреляции. Для того, чтобы удостовериться в том, что коэффициент, высчитанный по данным выборочного исследования, будет отвечать размеру связи в генеральной совокупности, необходимо определить среднюю ошибку коэффициента корреляции и критерий t, который оценивается за таблицей критерия Стьюдента (t):
m = ± 1 – r2 ; t = r xy
Ön mr
В некоторых случаях измерение направления силы связи можно осуществлять с помощью коэффициента ранговой корреляции( r ).
Коэффициент ранговой корреляции (Спирмена) используют при следующих условиях:
1) при небольшом количестве единиц наблюдений (не больше 30) парных величин;
2) когда нет необходимости в точных расчетах уровня силы связи, а нужны лишь ориентировочные данные;
3) когда признаки имеют не только количественные, но и качественные значения.
Формула расчета:
r = 1 - 6 х В d 2
n (n2 - 1)
где r-коэффициент ранговой корреляции, d – разница рангов, n – число пар.
Коэффициенты корреляции имеют большое значение в медицине и здравоохранении. Они используются для выявления разнообразных связей между явлениями и процессами, необходимые при оценке физического развития индивидуума и коллектива, для определения влияния на здоровье отдельных групп населения как благоприятных, так и неблагоприятных факторов окружающей среды.
Рассмотрен коэффициент корреляции указывает лишь на направление силы связи между двумя переменными величинами, но не дает возможности судить о том, как количественно изменится величина одной по мере изменения величины другого признака. Ответ на этот вопрос дает использование методу регрессии.
Регрессия– это функция, которая позволяет за величиной одного признака (х) определить среднюю величину другого признака (у).
Коэффициент регрессии – это абсолютная величина, на которую в среднем изменяется признак при изменении другого признака на единицу (например, при увеличении среднего роста 9-ти годовых девочек на 1 см средняя масса увеличится на 0,43 кг).
Формула коэффициенту регрессии:
Rxy = rху x sв
sx
где Rxy –коэффициент регрессии, rху – коэффициент корреляции, sx и sв – средние квадратичные отклонения для ряда х и в.