По характеру связь может быть функциональной или корреляционной (статистической)
Функциональная зависимость – такой вид зависимости, когда каждому значению одного признака соответствует точное значение другого (зависимость может быть задана функцией). Например: взаимосвязь радиуса и длины окружности. Такую зависимость можно считать полной (исчерпывающей). Она полностью объясняет изменение одного признака изменением другого. Этот вид связи характерен для объектов, являющихся точкой приложения точных наук. В медико-биологических исследованиях сталкиваться с функциональной связью приходится крайне редко, поскольку объекты исследований имеют большую индивидуальную изменчивость. С другой стороны, характеристики биологических объектов зависят, как правило, от комплекса большого числа сложных взаимосвязей и не могут быть сведены к отношению двух или трех факторов.
Корреляционная зависимость – существует в том случае, когда при изменении величины одного признака наблюдается тенденция соответствующего изменения значений другого признака.
Например, при изменении роста человека меняется и масса тела. Однако, эта зависимость не является полной, т.е. функциональной. У людей с одинаковым ростом может быть разная масса тела, поскольку на нее влияют и многие другие факторы (питание, здоровье и т.п.). При оценке статистических связей можно говорить только о тенденции, когда возрастание одного признака вызывает тенденцию возрастания или уменьшения другого признака.
Корреляционная связь описывается с помощью различных статистических характеристик. Выбор характеристики для определения взаимосвязи обусловлен видом исследуемых признаков, способами их группировки и предполагаемым характером связи. Подчас, для выявления реально существующих взаимосвязей достаточно правильно составить статистическую таблицу распределения или построить наглядный график этого распределения.
Корреляционный анализ занимается измерением степени связи между двумя переменными (х и у). Вначале предполагаем, что как х, так и у — количественные величины, например, рост и вес.
Предположим, что есть пара величин (х, у), измеренных у каждого из пациентов в выборке. Мы можем отметить точку, соответствующую паре величин каждого пациента, на двухмерном графике рассеяния точек (рис 1,2,3). Обычно переменную х располагают на горизонтальной оси, а у — на вертикальной в той же диаграмме. Размещая точки для всех пациентов, получаем график рассеяния точек (корреляционное поле), который говорит о взаимосвязи между этими двумя переменными.
В результате могут возникнуть следующие ситуации:
Рисунок 1. Положительная (прямая) корреляционная связь
Рисунок 2. Отрицательная (обратная) корреляционная связь
Рисунок 3. Корреляционная связь отсутствует
Если на графике рассеяния точек построить прямую линию, наилучшим образом описывающую изображенные данные (расстояния от точек до прямой минимальны), то полученная прямая является линией регрессии. Расчет коэффициентов корреляции дает численную характеристику того, насколько близко находятся наблюдения к линии регрессии. Основными коэффициентами корреляции являются коэффициент корреляции Пирсона и коэффициент корреляции Спирмэна.
Свойства коэффициентовкорреляции:
• Значения коэффициента корреляции изменяются в пределах от -1 до +1.
• Знак коэффициента корреляции показывает направление связи, увеличивается (положительный r, прямая связь)или уменьшается (отрицательный r, обратная связь)одна переменная, по мере того как увеличивается другая.
• Величина коэффициента корреляции указывает, как близко расположены точки к прямой линии. В частности, если r=+1 или r=-1, то имеется абсолютная (функциональная) корреляция по всем точкам, лежащим на линии (рис 1, рис. 2); если r=0, то линейной корреляции нет (рис. 3). Чем ближе r к крайним точкам (±1), тем больше степень линейной связи.
• Коэффициент корреляции безразмерен, т.е. не имеет единиц измерения.
• Величина коэффициента корреляции действительна только в диапазоне значений х и у в выборке. Невозможно заключить, что коэффициент будет иметь ту же величину при рассмотрении значений х или у, значительно больших, чем в выборке.
• Неважно, какой из признаков обозначить за х, а какой за у; х и у могут заменять друг друга, не влияя на величину r (rху~rух).
• Корреляция между х и унеобязательно означает соотношение «причины и следствия».
Следует отметить, что в случае биологических факторов тот или иной характер связи сохраняется, как правило, только в определенном интервале изменений признаков. За пределами этого интервала связь может ослабнуть, стать прямо противоположной по направлению либо совсем исчезнуть.
Например, при увеличении возраста ребенка сила скелетной мускулатуры увеличивается. В зрелом возрасте такой связи уже нет. А в старших возрастных группах тенденция становится обратной.
Сила корреляционной связи между признаками оценивается по величине коэффициента корреляции согласно Таблице 1:
Таблица 1
Распределение значений коэффициента линейной корреляции
|
Случаи, в которых не следует рассчитывать коэффициент линейной корреляции:
• получено нелинейное соотношение между признаками, например, квадратичное соотношение (рис. 4,а);
• данные включают более одного наблюдения по каждому пациенту;
• присутствуют аномальные значения (рис. 4,б);
• данные содержат подгруппы пациентов, для которых средние уровни наблюдений, по крайней мере, по одной из переменных, отличаются (рис. 4,в).
Рисунок 4. Диаграммы, показывающие, когда не следует рассчитывать коэффициент корреляции, (а)- соотношение нелинейно, (б)- при наличии выброса (выбросов), (в)- данные состоят из подгрупп.
Коэффициент корреляции Пирсона
Коэффициент корреляции Пирсона( )определяет силу и направление связи только для количественных данных (x, y – значения исследуемых признаков, n–количество пар данных):
Условия для расчета коэффициента корреляции Пирсона:
· исследуемые признаки являются количественными;
· выборка состоит из независимых пар величин х и у;
· по крайней мере, одна из этих двух переменных нормально распределена.
Достоверность коэффициента корреляции устанавливается по величине средней ошибки. Поскольку коэффициент корреляции в клинических исследованиях рассчитывается обычно для ограниченного числа наблюдений, нередко возникает вопрос о надежности полученного коэффициента. С этой целью определяют среднюю ошибку коэффициента корреляции. При достаточно большом числе наблюдений (больше 100)средняя ошибка коэффициента корреляции ( )вычисляется по формуле:
n – число наблюдений.
В том случае, если число наблюдений меньше 100 точнее определять среднюю ошибку коэффициента корреляции, по формуле:
С достаточной для медицинских исследований надежностью о наличии той или иной степени связи можно утверждать только тогда, когда величина коэффициента корреляции превышает или равняется величине трех своих ошибок (r ≥3mr). Обычно это отношение коэффициента корреляции (r) к его средней ошибке (mr)обозначают буквой tr:
Если tr≥3, то коэффициент корреляции является статистически значимым.