Критические значения коэффициента корреляции rxy
Число коррелируемых пар (n) | Уровень значимости (Р) | Число коррелируемых пар (n) | Уровень значимости (Р) | ||
0,05 | 0,01 | 0,05 | 0,01 | ||
0,997 | 0,99988 | ||||
Коэффициент корреляции признается статистически значимым с вероятностью ошибки <0,05, если r > r05 и с вероятностью ошибки <0,01, если r > r01.
Пример 2: Определение влияния количества проданных овощей и фруктов в г. Перми за У1 – У111 месяц 2014 года на заболеваемость дизентерией методом квадратов (Пирсона).
№ п/п | Кол-во больных дизентер. (x) | Кол-во проданых овощей в тоннах (y) | Отклонение от средней | dx *dy | d2*x | d2y | |
dx | dy | ||||||
1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. | -42 -81 -85 -39 -18 +64 +101 +185 +290 +184 | -1377 -966 -936 -1330 -1267 +603 +1069 +414 +2080 +2758 | 1,896,129 1,605,289 1142,761 |
Достоверность коэффициента корреляции определяется по таблице критических значений коэффициентов корреляции Пирсона (приложение 2).
Коэффициент считается представительным или достоверным, если полученная величина его превышает критическое значение при p = 0,05 и числе наблюдений ( n ).
В нашем примере 0,7 при n – 11 превышает 0,6, значит связь достоверна.
Рассчитать и оценить стандартизованные показатели.
Пример №3. Необходимо сравнить летальность в больницах А и Б. Известно, что в больнице А за год пролечено в терапевтическом отделении 600 больных, из них 30 умерло, в хирургическом отделении соответственно 300 и 6, в инфекционном – 100 и 4.
В больнице Б в терапевтическом отделении пролечено 200 больных из них умерло 12, в хирургическом соответственно 70 и 21, в инфекционном 100 и 5.
При решении этой задачи целесообразно расчетные операции и этапы стандартизации оформлять в виде таблицы.
1 этап: расчет интенсивных показателей летальности в больницах А и Б.
Таблица 1. Распределение больных и умерших по отделениям больниц А и Б.
Отделение | Больница А | Больница Б | ||
число про- шедших больных | из них умерло | число про- шедших больных | из них умерло | |
Терапевтическое Хирургическое Инфекционное ВСЕГО: |
Летальность рассчитываем на 100 больных в стационаре.
Следовательно, если в терапевтическом отделении больницы А пролечено 600 больных и из них 30 умерло, то летальность равна
(30 х 100) :600 = 5,0 (и так далее по всем отделениям больниц А и Б и по больницам в целом).
Таблица 2. Показатели летальности по отделениям и по больницам А и Бв целом (отношение к общему числу больных).
Отделение | Больница А | Больница Б |
Терапевтическое Хирургическое Инфекционное По больнице в целом | 5,0 2,0 4,0 4,0 | 6,0 3,0 5,0 3,8 |
2 этап: отделение стандарта.
За стандарт следует принимать тот состав совокупностей, в котором отразились бы все особенности состава сравниваемых групп. В данном случае за стандарт принимаем полусумму больных по каждому отделению больниц А и Б.
Таблица 3. Расчет стандарта.
Отделение | Стандарт (число больных) |
Терапевтическое Хирургическое Инфекционное | 600 (больница А) + 200 (б – ца Б) : 2 = 400 (300 + 700) : 2 = 500 (100 + 100) : 2 = 100 |
ВСЕГО: (1000 + 1000) : 2 = 1000
3 этап: расчет «ожидаемых величин», в данном случае числа умерших в каждой группе стандарта. Если из 600 терапевтических больных в больнице А умерло 30, то сколько бы их умерло если бы число прошедших через терапевтическое отделение было 400 при той же летальности?
И так далее по всем отделениям и по больницам А и Б в целом.
Таблица 4. Расчет ожидаемых величин (числа умерших) в каждой группе (по отделениям и больницам А и Б в целом) стандарта.
Отделение | Ожидаемое число умерших | |
больница А | больница Б | |
Терапевтическое Хирургическое Инфекционное | X = 20 X = 10 X = 4 | X= 24 X = 15 X = 5 |
Всего 20 + 10 +4 = 34 24 + 15 + 5 = 44
4 этап: расчет стандартизированных показателей, при условии, что в каждой больнице число прошедших больных составило 1000, рассуждаем следующим образом: из 1000 прошедших больных в больнице А ожидаемое число умерших составляет 34, следовательно, показатель летальности вычисляется на основе пропорции:
В больнице А: 1000 – 34
100 - х
X = 3,4
В больнице Б: 1000 – 44
100 - х; X = 4,4 случаев на 100 пролеченных больных;
Таким образом, получены стандартизированные показатели летальности в больницах А и Б, вычисленные при условии, что состав больных в каждой из больниц одинаковый (стандартный).
5 этап: - сравнение групп (в данном случае больниц А и Б) по общим интенсивным и стандартизированным показателям.
Анализ летальности в больницах А и Б выявил следующее:
1. Показатель летальности по больнице А в целом выше, чем по больнице Б
(4,0% и 3,8%)
2. Показатель летальности по отделениям в больнице Б выше, чем в больнице А (терапевтического отделения 5,0% 6,0%. X.% - 2,0% 3,0%; инфекционное 4,0% 5,0%).
3. Более высокий показатель летальности в больнице А объясняется преобладанием в ней больных терапевтического профиля, имеющих самую высокую летальность, а более низкий показатель летальности в больнице Б обусловлен пребыванием в ней большего количества, чем в больнице А больных хирургического профиля, имеющих низкую летальность.
4.Стандартизированный показатель летальности выше в больнице Б. Таким образом, если бы составы больных в больницах А и Б были бы одинаковыми, то летальность была бы выше в больнице Б.
ПРИМЕР 4. Стандартизированные показатели показывают, каков был бы уровень травматизма в сравниваемых коллективах, если бы их состав был одинаков.
Вычисление стандартизированных показателей делится на несколько этапов.
1 этап: Вычисление интенсивных показателей (по возрасту, полу, профессии и пр.)
Цех 1 | Цех 2 | |||||
число работ | число травм | показатель на 100 работ-х | число работ | число травм | показа- тель на 100 раб-х | |
Муж. Жен. ВСЕГО: | 16,0 7,0 10,0 | 12,0 8,0 11,0 |
Вычисленные интенсивные показатели записываются в 4 и 7 графу
2 этап. Определение стандарта.
За стандарт принимается состав одного из сравниваемых коллективов (цеха №1 или цеха №2) или средний состав обоих коллективов. В данном примере за стандарт принят средний состав работающих по полу в обоих цехах.
Стандарт
Состав | Сумма рабочих (цех №1 + цех №2) | Средний состав рабочих (в %) |
Мужчины Женщины | ||
Всего: 1400 100 |
3 этап: Вычисление числа заболеваний (травм) по стандарту и стандартизированных показателей.
состав | Цех 1 | Цех 2 | |||
Стандарт в % | число травм на 100 работ | число травм по стандарту | число травм на 100 работ | число травм по стандарту | |
Мужчины Женщины | 16,0 7,0 | 9,12 3,01 | 12,0 8,0 | 6,74 3,44 | |
Всего: 100 10,0 12,13 11,0 10,18 |
Числа в графе 4 и 6 получены следующим образом:
В цехе №1 у мужчин показатель травматизма на 100 рабочих составил 16,0, а в цехе №2 – 12%, тогда на 57 рабочих – по стандарту (число травм в цехе №1 составит: 0,12 случаев на 100 мужчин, а в цехе №2 – 6,74).
Также определяются числа и другой стройки (для женщин при стандарте 43):
Цех №1 – 7,0, цех №2 – 8,0 случаев на 100 женщин, а при стандартизации соответственно 3,04; 3,44.
Сложив числа в графах 4 и 6, получим стандартизированные показатели для каждого цеха.
Пример заключения по стандартизированным показателям.
Первоначальные общие показатели травматизма дают представление о том, что цех №2 более неблагополучен по сравнению с цехом №1. Более высокий уровень травматизма в цехе №2 (11,0 случаев против 10,0) может быть обусловлен или плохим состоянием техники безопасности, или значительным преобладанием мужчин в числе работающих (600 человек из 800 работающих)
Стандартизацией состава установлено, что если бы состав работающих по полу в обоих цехах был одинаков, то в цехе №2 число травм было бы ниже (10,18 случаев против 12,13). Следовательно, состояние техники безопасности хуже в цехе №1, а первоначально высокие показатели в цехе №2 обусловлены большим числом мужчин в числе работающих, так как мужчины дают более высокие показатели травматизма (графы 3 и 5).
· тестовые задания для самоконтроля:
Обведите кружком номер правильного ответа:
1. По характеру существующих связей между признаками в широком
понимании связи подразделяются на:
1. Прямые и обратные
2. Статистические и функциональные
2. Все существующее в живой природе зависимости между признаками
изучаются преимущественно:
1. Точными физико-математическими науками
2. Статистикой
3. Для решения элементарной задачи по определению зависимости между
признаками и ее направленности рациональнее использовать:
1. Корреляционный анализ
2. Дисперсионный анализ
3. Аналитические группировки
4. Для полной характеристики статистических связей необходимо применять:
1. Дисперсионный анализ данных
2. Вычисление различных коэффициентов корреляции
3. Регрессионный анализ
5. Корреляционная связь характеризуется как связь, при которой:
1. Выявляется полная характеристика особенностей взаимозависимости
двух сравниваемых признаков
2. Любому значению одного из признаков соответствует только одно
значение другого признака
3. Значению каждой величины одного признака может соответствовать
несколько значений другого признака
6. Корреляционный анализ используется с целью:
1. Характеристики 1У группового свойства статистической совокупности –
репрезентативности данных
2. Оценки распределения изучаемого признака в любой статистической
совокупности
3. Установления наличия связей между признаками и ее направленности
4. Изучения взаимозависимости между признаками по форме, направленности,
силе и достоверности
7. Степень выраженности корреляции характеризуют коэффициенты:
1. Соотношения 5. Стандартизованные
2. Вариации 6. Корреляции Пирсона
3. Регрессии 7. Стьюдента
4. Наглядности 8. Ранговой корреляции Спирмена
Дополните:
8. По характеру связь между независимыми признаками может быть полной
или____________________, и статистической или______________________.
9.По направленности изменений изучаемых данных зависимость между
сравниваемыми признаками может быть двух видов:_________и__________
10.По форме все корреляционные связи подразделяются на _________________
и__________________________.
11.Наиболее простым методом определения силы связи является метод
__________________________________.
12.Наиболее точным способом определения степени связи между признаками
является метод ___________________________.
13.Какой метод дает возможность определить наличие связи между
признаками без определения ее силы ___________________________.
14.Коэффициент корреляции при функциональной связи равен
__________________________.
15. Коэффициент корреляции при отсутствии связи равен_____________
16. По силе корреляционные связи подразделяются на
____________________________________________________.
Эталоны ответов:
1. 2 9. Прямая, обратная
2. 2 10. Прямолинейные, криволинейные
3. 3 11. Спирмена
4. 1 12. Пирсона
5. 3 13. x
6. 3 14. 1
7. 3.6.8. 15. 0
8. Функциональной, корреляционной 16. Слабые, средние, сильные.
· рекомендованная литература: обязательная, дополнительная, блок информации, разработанный на кафедре:
ОСНОВНАЯ
1. Медик В.А., Лисицин В.И., Токмачев М.С. Общественное здоровье и здравоохранение: руководство к практическим занятиям: учеб. пособие / В.А. Медик, В.И.Лисицин, Токмачев М.С. - М.: ГОЭТАР - Медиа, 2012. -400 с.
2. Общественное здоровье и здравоохранение, экономика здравоохранения: учебник: в 2 томах / Под ред. Кучеренко В.З. - М.: ГОЭТАР - Медиа 2013. – Т.1._ 688 с.
3. Лисицын Ю.П., Улумбекова Г.Э. Общественное здоровье и здравоохранение: учебник / Лисицын Ю.П., Улумбекова Г.Э. – 3-е изд., М.: ГОЭТАР – Медиа, 2011. – 544 с.
ДОПОЛНИТЕЛЬНАЯ:
Учебно-методическое пособие к практическим занятиям по курсу дисциплины общественное здоровье и здравоохранение Березинская З.П., Окунева Г.Ю., Говязина Т.Н. и др.– 2004, Пермь.
· блок информации, разработанный на кафедре:
Корреляция
Все явления в природе и обществе находятся во взаимной связи. Различают две формы связи: функциональную и корреляционную.
Функциональная связь означает строгую зависимость явлений. При функциональной связи изменение какого либо одного явления вызывает обязательно строго определенные по величине изменения другого явления. Такого рода связь чаще наблюдается в физико-химических явлениях.
В области биологических и общественных явлений чаще встречаются взаимосвязи иного характера. Такого рода связи называют статистическими, или корреляционными. Корреляция - латинское слово – означает соотношение, взаимосвязь между признаками.
При корреляционной связи значению каждой средней величины одного признака соответствует несколько значений другого взаимосвязанного с ним признака.
Всем известно, что уровень антитоксина в крови и заболеваемость дифтерией взаимосвязаны между собой. При одинаковом уровне антитоксина в разных группах детей встречается разное количество заболевших.
В качестве примеров корреляционной связи можно указать на связь между количеством проведенных профилактических прививок и размерами заболеваемости, между размерами заболеваемости и смертности, между сроками изоляции инфекционных больных и частотой вторичных заболеваний в очаге, между качеством питьевой воды и заболеваемостью острыми кишечными инфекциями и т.д.
Параллельное изменение признаков двух явлений само по себе еще не говорит (хотя и наводит на мысль) о наличии связи между ними, так как может быть обусловлено случайным совпадением многих обстоятельств, не связанных друг с другом.
Измерение связи методами статистики целесообразно только тогда, когда наличие и материальная природа связи хотя бы предположительно установлена специальными методами данной науки.
При наличии действительной связи, установленной на основе конкретного анализа материальной природы изучаемых явлений, статистика дает возможность измерить размер (тесноту, силу) этой связи и установить степень зависимости между изучаемыми явлениями.
Измерение связи заключается в определении ее размеров (тесноты, силы). Под теснотой связи понимается степень сопряженности связанных признаков, широта варьирования каждого из них при изменении средней величины другого. Помимо тесноты связи, статистические методы позволяют вскрыть форму этой связи.
По силе связи корреляция колеблется от 0 до 1:от 0 до 0,3 – слабая, от 0,3 до 0,69 – средняя, от 0,7 до 1 – сильная. При силе связи равной 1 выявлена полная связь (функциональная связь). Сила связи измеряется коэффициентами корреляции.
По характеру связь может быть прямой и обозначается (+) и обратной (-). Прямая связь – это такая связь, когда изменение одного признака влечет за собой изменение другого в том же направлении. Обратная связь – один признак увеличивается, другой уменьшается.
По форме (или направленности) корреляционные связи подразделяются на прямолинейные, когда наблюдается пропорциональное изменение одного признака в зависимости от изменения другого (графически это выражается в виде прямой линии), и криволинейные, когда одна величина признака изменяется непропорционально изменению другой (на графике эти связи изображаются параболами или иной кривой линией).
Методы сравнения наблюдений, которые независимо от вида распределения называют ранговыми или непараметрическими, т.е. независящие от формы распределения признаков в генеральной совокупности. Их применение в медико-биологических исследованиях более оправдано хотя бы потому, что они менее трудоемкие по сравнению с другими. Наиболее часто в этом случае используется метод определения коэффициента корреляции рангов (Спирмена). Этот коэффициент целесообразно использовать, при наличии небольшого числа наблюдений в случаях, когда сопоставляемые данные носят приближенный характер, а форма связи – криволинейна.
При наличии прямолинейной связи между взаимосвязанными компонентными признаками, особенно при большом числе наблюдений, рациональнее прибегать к параметрическим методам оценки, которые требуют вычисления определенных параметров средней величины, среднеквадратического отклонения, средней ошибки. При этом вычисление связи проводится при числе наблюдений 30 и менее сравниваемых пар по методу квадратов (К. Пирсона).