Корреляционный анализ

Корреляция – понятие, которое означает взаимосвязь между признаками. Различают функциональную и корреляционную связи.

Под функциональной понимают такую связь, при которой изменение величины одного признака неизбежно вызывает совершенно определенные изменения величины другого признака. Данный вид связи характерен для физико-химических процессов: радиусу круга соответствует определенная площадь круга, а скорость свободно падающего тела определяется величиной ускорения силы тяжести и времени падения.

В социальной медицине, биологии и клинической медицине зависимости между явлениями носят иной характер и поэтому приходится иметь дело с иной связью. Это связано с тем, что одной и той же величине одного признака соответствует ряд варьирующих значений другого признака, обусловленного чрезвычайным многообразием взаимодействия различных явлений живой природы. Такого рода связь носит название корреляционной (соответственной, соотносительной).

Функциональная связь имеет место в каждом отдельном наблюдении, в то время как корреляционная связь проявляется только при многочисленном сопоставлении признаков, т.е. совокупности.

Корреляция может быть представлена в виде таблицы, графика и коэффициента корреляции. Таблицы и графики дают лишь представление о наличии и направлении связи, однако измерить и оценить статистическую достоверность этой связи можно лишь при помощи специального коэффициента корреляции (rxy) и его средней ошибки (mr).

Коэффициент корреляции (rxy) одним числом измеряет силу связи между изучаемыми явлениями и дает представление о ее направлении.

По ее направлению связь между явлениями может быть прямой (положительной), когда с увеличением (уменьшением) значения одного признака увеличивается (уменьшается) значение другого, т.е. когда признаки меняются в одном направлении и обратной (отрицательной), когда с увеличением значений одного признака значения другого уменьшаются и наоборот, т.е. изменение признаков – разнонаправлены.

По силе связи коэффициенты корреляции колеблются от 1 (полная, функциональная связь) до 0 (отсутствие связи). Сила связи коэффициентов корреляции рассчитывается по формуле:

Корреляционный анализ - student2.ru , где

х, у – переменные варианты сопоставляемых вариационных рядов;

dx, dy – отклонение каждой переменной (варианты) от своей средней арифметической (Mx, My)

Таким образом, чем больше среднему значению одного признаку соответствует значение другого признака, тем выше сила связи между ними (табл. 18).

Таблица 18

Схема оценки силы и направленности корреляционной связи по коэффициенту корреляции (rxy).

Теснота связи Величина коэффициента корреляции (rxy)
При прямой связи (+) При обратной связи (-)
Связь отсутствует Связь слабая Связь умеренная Связь сильная Связь полная (функциональная) от 0 до + 0,3 от +0,3 до +0,7 от +0,7 до +1,0 +1,0 от 0 до - 0,3 от -0,3 до -0,7 от -0,7 до -1,0 -1,0

Для того чтобы убедиться в том, что полученный при вычислении коэффициент корреляции соответствует размеру связи генеральной совокупности, необходимо определить его среднюю ошибку (mr) и критерий t.

Средняя ошибка коэффициента корреляции определяется по формуле:

Корреляционный анализ - student2.ru

n – число парных наблюдений больше 100.

В том случае, когда число наблюдений меньше 100 но больше 30, средняя ошибка коэффициента корреляции определяется по формуле:

Корреляционный анализ - student2.ru

О достаточности для медицинских исследований надежности наличия той или иной степени связи можно говорить только тогда, когда величина коэффициента корреляции превышает или равняется величине трех своих ошибок

(rx y³3mr). Это отношение коэффициента корреляции rxy к его средней ошибке (mr) обозначается буквой t и называется критерием достоверности:

Корреляционный анализ - student2.ru

Если Корреляционный анализ - student2.ru , то коэффициент корреляции можно считать достоверным.

Коэффициенты корреляции имеют большое значение в медицине и здравоохранении. Они применяются: для выявления разнообразных связей между явлениями и процессами; при оценке физического состояния индивидуума и коллектива; для определения влияния на здоровье отдельных групп населения как благоприятных, так и неблагоприятных факторов окружающей среды (табл. 19).

Таблица 19.

Показатели множественной корреляции длины и массы тела школьников с различными факторами риска.

  Комплексы факторов Длина тела Масса тела
школьника при рождении школьника при рождении
1.   2.     3.   4.   5.     6.   7.     8. Наследственные (длина и масса тела родителей) Биологические (возраст матери, отца, порядковый номер при рождении, состояние здоровья родителей) Факторы беременности и родов (осложнения беременности и нарушения в родах, нарушения в состоянии ребенка при рождении) Уровень благосостояния (материльное положение, образование родителей, число детей в семье, полезная площадь на одного человека) Питание (особенности белкового, углеводного, жирового питания, калорийность) Вредности (бытовые вредности родителей: курение, злоупотребление алкоголем; профессиональные вредности родителей) Психологический климат семьи (взаимоотношения между членами семьи) Особенности первого года жизни ребенка (психомоторное развитие, заболеваемость) 0,7   0,45     0,35   0,3   0,4     0,5   0,5     0,5 0,4   0,3     0,2   —   —     0,2   —     — 0,13   0,3     0,13   0,2   0,2     0,4   0,3     0,2 0,4   0,4     0,4   —   —     0,2   —     ––

Дисперсионный анализ в статистике позволяет дать общую характеристику трем и более средним величинам или показателям, что дает возможность измерить силу влияния, оценить разность частных средних или показателей, определить достоверность разности частных средних или показателей.

Различают следующие виды дисперсионного анализа: однофакторный, двухфакторный и многофакторный. Изучение действия факторов производится путем сравнения средних значений наблюдаемого признака, полученных в результате воздействия каждого из имеющихся факторов при разном их сочетании.

Таким образом, дисперсионный анализ показывает степень рассеивания вариации (дисперсии) измеряемых признаков вокруг среднего типичного уровня, что дает возможность изучить действие на конечный результат исследования нескольких факторов вместе, роль каждого из них и сравнить действие отдельных факторов между собой.

Наши рекомендации