Метод определения коэффициента ранговой корреляции
или метод рангов, или метод Спирмена (по автору)
Последовательность расчета:
1. Составить ряды из парных признаков (X и Y).
2. Каждой величине признака X и Y определить номер ранга. В тех случаях, когда имеется несколько одинаковых по величине чисел, порядковый номер обозначают средним числом из суммы очередных порядковых номеров.
3. Определение разности рангов d = X1–Y1
4. Разность рангов возвести в квадрат d2
5. Получить сумму квадратов разности å d2
6. Определить коэффициент ранговой корреляции по формуле:
Р = 1 – 6 ∑d 2
n(n2 - 1)
где р- коэффициент ранговой корреляции, n – число пар корреляционных рядов, ∑d 2 - сумма квадратов разности между рангами двух корреляционных рядов; 6 – постоянный коэффициент.
7. Определить направление связи.
8. Определить ошибку mp и оценить достоверность p.
9.Сделать выводы.
Метод квадратов (Пирсона) вычисления коэффициента корреляции
Последовательность расчета:
1. Построить вариационные ряды двух парных признаков (X и Y).
2. Определить их средние величины Мx и Мy.
3. Найти отклонение d каждой варианты от средней для ряда X и ряда Y.
4. Полученные отклонения перемножить и суммировать.
5. Каждое отклонение каждой варианты в ряду X и Y возвести в квадрат и
суммировать по ряду.
6. Определить произведение å d2x* å d2y и из произведения извлечь квадратный корень Ö å d2x* å d2y
7. Определение ошибки по формуле:
Mrxy= ± √1 – r2xy
n - 2
8. Определение достоверности. Коэффициент корреляции будет достоверен лишь в том случае, когда он превышает свою ошибку в 3 – 4 раза.
Этот метод применяется, когда число парных вариант не превышает 30, а числовые значения коррелирующих признаков не велики, по формуле:
rxy = å d xd y
√å d2x* å d2y
где rxy- коэффициент линейной корреляции между двумя признаками х и у;
d – отклонения от средних арифметических данных х и ряда у.
Этот метод более точен.
Достоверность коэффициента корреляции определяется по таблице критических значений коэффициентов корреляции Пирсона (приложение 2).
Коэффициент считается представительным или достоверным, если полученная величина его превышает критическое значение при p = 0,05 и числе наблюдений ( n ).
В нашем примере 0,7 при n – 11 превышает 0,6, значит связь достоверна.
Коэффициенты корреляции, определяя силу и форму связи, не дают возможности судить о том, как количественно меняется величина признака по мере изменения другой величины. Ответ на этот вопрос можно получить, применяя метод регрессии.
Определяя коэффициенты корреляции разными методами нельзя забывать и о том, что это методы измерения, а не установления связи изучаемых явлений. По этому поводу Энгельс говорил: «Нельзя конструировать связи и вносить их в факты, а надо извлекать их из фактов и, найдя, доказывать их, насколько это возможно, опытным путем».
В практической работе часто необходимо сравнивать между собой полученные при выполнении медико-статистического исследования показатели. Как правило, эти общие показатели бывают получены в качественно неоднородных по составу группах, за исключением специально подобранных качественно однородных групп (так называемый метод «копий-пара» ). Как известно, неоднородность составов групп оказывает влияние на величину показателей заболеваемости, травматизма, инвалидизации, рождаемости, общей смертности в разных странах, регионах, областях, населенных пунктах, имеющих разный состав населения как по возрасту, так и по полу. Показатели, например общей смертности в 2 населенных пунктах, имеющих разный возрастной состав, в таком виде как они получены, сравнивать нельзя. Но это не означает, что их сравнивать между собой вообще невозможно и нельзя сделать никаких выводов.
Для сравнения общих показателей, вычисленных из неоднородных по своему составу совокупностей, применяется специальный метод – метод стандартизации.
Метод стандартизации
Это метод расчета условных (стандартизированных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за несопоставимости состава групп. Полученные при помощи использования метода стандартизации показатели условны, т.к. они, устраняя влияние того или иного фактора на истинные показатели, указывают, какими были бы эти показатели, если бы влияние данного фактора отсутствовало. Таким образом, стандартизированные показатели могут быть использованы только с целью сравнения.
Существуют 3 метода стандартизации:
1. Прямой
2. Косвенный
3. Обратный
Наиболее распространенным является прямой метод стандартизации показателей. Его суть в вычислении показателей, которые имели бы место, если бы состав совокупностей был одинаковым (по полу, возрасту, стажу работы или другому признаку).
Метод прямой стандартизации показателей состоит из 5 этапов:
1 этап: расчет общих и специальных интенсивных показателей или средних
величин для 2 или нескольких сравниваемых совокупностей.
2 этап: выбор и расчет стандарта.
3 этап: расчет «ожидаемых величин» для каждой группы стандарта.
4 этап: определение стандартизированных показателей.
5 этап: сравнение групп по общим интенсивным (или средним) и
стандартизированным показателям.