Хабаровск - 1999
Министерство здравоохранения Российской Федерации
Дальневосточный государственный
Медицинский университет
Кафедра социальной медицины,
Экономики и организации здравоохранения
Относительные величины
в медицинской статистике
(методические рекомендации для студентов)
Хабаровск - 1999
Цель данных методических рекомендаций - научить правильно применять абсолютные и относительные величины в медицинской практике. Освоить методику преобразования абсолютных величин в относительные показатели, оценку их достоверности. Знать методику построения и уметь анализировать динамические ряды.
После изучения данной темы студент должен:
Знать:
1. виды относительных показателей
2. методы оценки достоверности относительного показателя
3. методы оценки достоверности разности относительных показателей показатели динамического ряда
4. показатели динамического ряда
5. виды графических изображений, применяемых в медицинской статистике
Уметь:
1. рассчитывать и оценивать относительные показатели
2. определять достоверность относительных величин
3. определять достоверность разности относительных показателей оценивать показатели динамического ряда
4. рассчитывать и оценивать показатели динамического ряда
5. изображать относительные величины и показатели динамического ряда графически.
Относительные величины в медицинской статистике.
При проведении любых статистических исследований в конечном итоге получаются абсолютные величины.
Абсолютная величина - это результат подсчета общего числа единиц изучаемой совокупности в целом или по отдельным его группам. Например, при подсчете числа врачей в нашей стране можно получить общую суммарную численность врачей и численность отдельных групп врачей в зависимости от их специальности.
Получение и практическое использование абсолютных величин является основой статистики, но сами по себе они имеют довольно ограниченное познавательное значение.
Характеризуя абсолютные размеры изучаемого явления и составляющих его частей, абсолютные величины не могут быть применены при сравнении аналогичных явлений между собой или при оценке изменения какого-либо одного явления во времени. Поясним это на таком примере: за год в районе А. родилось 3800 человек, а в районе Б. - 2500 человек. Можно ли сделать вывод о том, в каком из районов рождаемость выше? Конечно, нет, так как для характеристики такого явления как рождаемость, необходимо знать численность населения данных районов (т.е. еще одну абсолютную величину). Поэтому для сравнения - главной цели статистического анализа - применяется производные величины.
Одной из разновидностей производных величин являются относительные величины, в практике часто называемые коэффициентами или относительными показателями (Р).
Относительная величина получается в результате деления одной абсолютной величины (а) на другую (в):
а Р = ------------ х 100 (1000; 10 000и т.д.) в |
Так как в результате деления одного целого числа на другое как правило получается дробное число, то его принято умножать на 100, 1000, 10000 , соответственно полученный результат будет измеряться в процентах ( % ), промилле ( ‰ ), продецимилле ( ‰ ).
Вернемся к нашему примеру. Зная численность населения каждого из районов, мы можем рассчитать относительные показатели - показатели рождаемости в районе А. и районе Б. Среднегодовая численность населения района А. составила 250000 человек, а района Б. - 130000 человек. Следовательно, показатель рождаемости (число родившихся живыми за год на 1000 населения) в районе А. составит:
3800 х 1000
Р А = ---------------------- = 15,2 ‰
в районе Б:
2500 х 1000
Р Б = ---------------------- = 19,2 ‰
Если бы мы для оценки рождаемости сопоставляли между собой абсолютные величины, то сделали бы ошибочный вывод, так как абсолютное число рождений в районе А. выше. В действительности же, проведя расчет рождений на каждую тысячу населения получаем обратный вывод: рождаемость выше в районе Б.
Виды и методика расчета относительных величин.
В медицинской статистике выделяют 4 вида относительных величин:
· Экстенсивные показатели
· Интенсивные показатели
· Показатели соотношения
· Показатели наглядности
Отдельную группу составляют показатели динамического ряда.
Наиболее часто в работе практического врача используются экстенсивные и интенсивные показатели, значительно реже - показатели соотношения. еще реже - показатели наглядности.
Вместе с тем показатели наглядности находят широкое применение в санитарно-просветительной работе.
1. ЭКСТЕНСИВНЫЕ ПОКАЗАТЕЛИ (показатели распределения, структуры) показывают:
- как распределяется изучаемое явление на свои составные части
- как велика доля данного явления по отношению ко всей его величине
Другими словами, они характеризуют удельный вес части в целом. Методика расчета проста: для этого целое принимается за 100 (%) или 1000 (‰), затем по правилам пропорции рассчитывается доля части в целом.
абсолютная численность
части явления
Общая формула = ------------------------------------ х 100%
расчета абс. численность
явления в целом
Например:
В поселке Н. зарегистрировано в течение года всех первичных заболеваний 1500, в том числе:
грипп сердечно-сосудистые заболевания травмы болезни органов пищеварения болезни органов дыхания прочие болезни | - 500 - 400 - 300 - 175 - 75 - 50 |
Рассчитаем экстенсивные показатели, т.е. показатели структуры заболеваемости:
1) грипп 1500 - 100 % 500 х 100
500 - х х = ---------------- = 33,3 %
2) сердечно-сосу- 1500 - 100 % 400 х 100
дистые заболе- 400 - х х = ---------------- = 26,7 %
вания 1500
3) травмы 1500 - 100 % 300 х 100
300 - х х = ---------------- = 20,0 %
и так далее.
Как правило, результаты расчетов экстенсивных показателей сводятся в таблицу с расположением показателей либо по возрастанию, либо по убыванию.
Диагноз заболевания | Зарегистрировано заболеваний | Показатель структуры заболеваемости |
Грипп Сердечно-сосудистые заболевания Травмы Болезни органов дыхания Болезни органов пищеварения Прочие болезни | 33,3% 26,7% 20,0% 11,6% 5,0% 3,4% | |
Всего | 100,0% |
Экстенсивные показатели находят широкое применение в деятельности каждого врача. Они используются и при определении лейкоцитарной формулы, и при расчете структуры населения или больных по полу, возрасту, профессии и т.п., и при расчете показателей структуры коечного фонда стационара, распределения врачей по специальностям, при расчете структуры заболеваемости и смертности и во многих других случаях.
Таким образом, экстенсивные показатели - это относительные величины, полученные путем соотношения двух одноименных связанных друг с другом абсолютных величин (одна из которых является частью другой) и выраженные чаще всего в процентах.
При применении экстенсивных показателей следует помнить, что:
· их нельзя применять для характеристики изменения какого-либо явления во времени, т.е. динамики явления
· их нельзя применять для характеристики частоты (интенсивности) показателя.
Нарушение данных ограничений нередко приводит медицинских работников к грубым ошибкам. Поясним на примере: допустим, что в районе А. в 1995 году умерло 50 человек, в том числе:
от инфаркта миокарда | - 10 человек | - 20 % |
от онкологических заб-ий | - 5 человек | - 10 % |
от прочих болезней | - 35 человек | - 70 % |
ВСЕГО: | - 50 человек | - 100 % |
За 1996 год в этом же районе умерло 45 человек, в том числе:
от инфаркта миокарда | - 5 человек | - 11,1 % |
от онкологических заб-ий | - 5 человек | - 11,1 % |
от прочих болезней | - 35 человек | - 77,8 % |
ВСЕГО: | - 45 человек | - 100 % |
Если сравнить только структуру смертности, то можно сделать ошибочный вывод, что при уменьшении смертности от инфаркта миокарда произошло увеличение смертности от онкологических заболеваний и прочих болезней. В действительности же увеличение смертности от онкологических заболеваний и прочих болезней не произошло, так как абсолютные числа умерших от данных причин не изменились.
2. ИНТЕНСИВНЫЕ ПОКАЗАТЕЛИ (показатели частоты явления) характеризуют распространенность какого-либо явления в среде, продуцирующей данное явление.
Общей формулой для расчета интенсивных показателей является:
абсолютная численность
явления
------------------------------------------------- х 1000 (10000 и т.д.)
абсолютная численность среды,
продуцирующей данное явление
Таким образом, с помощью интенсивных показателей можно определить, насколько часто встречается интересующее нас явление в данной среде.
Наиболее часто в практике врача применяются следующие интенсивные показатели: показатели рождаемости, смертности, заболеваемости населения, частота осложнений различных заболеваний и т.д.
Например, в городе Н. родилось за год живыми 1200 детей, среднегодовая численность населения в том же году составила 100 000 человек. Тогда показатель рождаемости (число рождений на 1000 населения) мы сможем рассчитать следующим образом:
1200 х 1000
Показатель рождаемости = ----------------------- = 12 ‰
100 000
(т.е. 12 родившихся на 1000 населения)
Теперь вернемся к примеру по распределению причин смертности населения, который мы начали при разборе экстенсивных величин, и дополнительно рассчитаем интенсивные показатели смертности, приняв численность населения района за изучаемые периоды за 5000 человек.
1995 год | 1996 год | |||||
Причины смерти | абс. число | п-ль струк туры | показатель смертности на 1000 населения | абс. число | п-ль струк- туры | показатель смертности на 1000 населения |
инфаркт миокарда | 20 % | 10 х 1000 ------------ = 2 | 11,1 % | 5 х 1000 ----------- = 1 | ||
онкологические заболевания | 10 % | 5 х 1000 ------------ = 1 | 11,1 % | 5 х 1000 ----------- = 1 | ||
прочие заболевания | 70 % | 35 х 1000 ------------ = 7 | 77,8 % | 35 х 1000 ------------ = 7 | ||
В с е г о | 100 % | 50 х 1000 ------------ = 10 | 100 % | 45 х 1000 ------------ = 9 |
3. ПОКАЗАТЕЛИ СООТНОШЕНИЯ- это относительные показатели, полученные путем соотношения абсолютной величины явления и абсолютного размера среды, не продуцирующей данное явление. Отличие этого вида показателей от интенсивных состоит в том, что интенсивные показатели мы получаем при соотношении абсолютных величин, связанных друг с другом, а показатели соотношения - при соотношении величин, не связанных друг с другом.
Общая формула для расчета:
абсолютный размер явления
----------------------------------------------- х 100 (1000, 10000 и т.д.)
абсолютный размер среды, не
продуцирующей данное явление
Показатели соотношения широко используются при определении обеспеченности населения врачами, средним медицинским персоналом, больничными койками и т.д.
Имея, например, данные о численности врачей и численности населения, можно рассчитать показатель соотношения. Если численность района составила 500000 человек, а численность врачей - 650, то показатель обеспеченности врачами будет равен:
650 х 10000
------------------ = 13,0 врачей на 10000 населения
4. ПОКАЗАТЕЛИ НАГЛЯДНОСТИ используются для преобразования абсолютных или относительных величин в наглядную форму, для того, чтобы показать изменение этих величин в динамике, не называя действительных их размеров.
При расчете показателей наглядности одна из сравниваемых величин принимается за 100 или 1, а другие по правилам расчета пропорций сопоставляются с ней:
явление
Показатель = -------------------------------------- х 100 ( или 1 )
соотношения такое же по характеру
явление из ряда сравнива-
емых, принятое за 100 или 1
Например, в городе Н. заболеваемость дизентерией в 1994 году составила 54 ‰, в 1995 году - 47 ‰, в 1996 году - 40 ‰. Для того, чтобы наглядно представить динамику заболеваемости дизентерией с 1994 по 1996 год, уровень 1994 года необходимо принять за 100 %.
54 - 100 % 47 х 100
47 - х % х = -------------- = 87 %
54 - 100 % 40 х 100
40 - х % х = -------------- = 74 %
Таким образом, видно, что уровень заболеваемости дизентерией снизился и составил в 1995 году 87 % от уровня 1994 года, в 1996 году - 74 % от уровня 1994 года.
ПОКАЗАТЕЛИ ДИНАМИЧЕСКОГО РЯДА. МЕТОДИКА РАСЧЕТА.
Динамический ряд - это ряд статистических величин, показывающих изменение их во времени, расположенных в хронологическом порядке через определенные промежутки времени.
Динамические ряды могут быть моментными, когда величины ряда характеризуют явление на какой-то определенный момент времени (штаты, койки, вновь выявленные больные при медосмотрах и т.д.) и интервальными, когда явление рассматривается за определенный период (число родившихся и умерших за год, число поступивших больных в стационар, число бытовых травм за месяц и др.).
Величины, из которых состоит динамический ряд, называются уровнями ряда. Если динамический ряд состоит из абсолютных чисел, то он называется простым, если из относительных или средних величин - то сложным или производным.
Для характеристики динамического ряда используют 3 основных показателя:
· абсолютный прирост (убыль) - разность между последующим и предыдущим уровнем
· темп прироста - процентное отношение абсолютного прироста (убыли) к предыдущему уровню
· темп роста - процентное отношение последующего уровня к предыдущему уровню.
Рассмотрим методику анализа динамического ряда на примере изменения показателя общей смертности в России с 1940 по 1995 годы:
Годы | Уровень смертности, ‰ | Абсолютный прирост (убыль) | Темп роста, % | Темп прироста, % |
20,6 7,4 8,7 11,0 11,2 15,0 | - - 13,2 1,3 2,3 0,2 3,8 | - 35,9 117,6 126,4 101,8 133,9 | - - 64,1 17,6 26,4 1,8 33,9 |
Пример расчета:
1) абсолютный прирост (убыль) = последующий уровень - предыдущий уровень
1940-1960 гг. = 7,4 - 20,6 = - 13,2
1970-1960 гг. = 8,7 - 7,4 = 1,3
1980-1970 гг. = 11,0 - 8,7 = 2,3
и т.д.
2) Темп роста = последующий уровень х 100% / предыдущий уровень
1940-1960 гг. = 7,4 х 100 / 20,6 = 35,9%
1970-1960 гг. = 8,7 х 100 / 7,4 = 117,6%
1980-1970 гг. = 11 х 100 / 8,7 = 126,4%
и т.д.
3) Темп прироста = абс. прирост х 100 / предыдущий уровень
1940-1960 гг. = - 13,2 х 100 / 20,6 = - 64,1
1970-1960 гг. = 1,3 х 100 / 7,4 = 17,6
1980-1970 гг. = 2,3 х 100 / 8,7 = 26,4
и т.д.
Многочисленные наблюдения за длительный промежуток времени не всегда позволяют выявить определенную тенденцию в динамике. Такую возможность дает применение методов выравнивания динамических рядов. К ним относятся:
1. Приведение рядов к одному основанию путем вычисления показателей наглядности. Динамика в этом случае выразится наиболее ярко.
2. Укрупнение интервалов, которое заключается в суммировании данных за ряд периодов. В результате получаются итоги за более продолжительные отрезки времени и тем самым сглаживаются случайные колебания и более четко определяется характер динамики.
3. Сглаживание путем групповой и скользящей средней. Периоды времени укрупняются и для них вычисляется средняя величина, характеризующая укрупненный период. Этим достигается большая ясность изменений во времени.
Интересен метод скользящей средней, который часто применяется для характеристики сезонных колебаний. Для этого каждый уровень ряда заменяется средней из данного уровня и соседних с ним. Обычно суммируются последовательно три члена ряда, но можно брать и больше. Важно, что средняя получается для каждого уровня динамического ряда.
ОПРЕДЕЛЕНИЕ ДОСТОВЕРНОСТИ
ОТНОСИТЕЛЬНЫХ ВЕЛИЧИН.
Величина результатов, получаемых при любых вычислениях всегда отклоняется от их математической вероятности в силу недостаточно большого числа проводимых наблюдений, поскольку абсолютно достоверный результат может быть получен лишь при бесконечно большом числе наблюдений. Другими словами, результаты вычислений всегда имеют свою ошибку и чем больше число наблюдений, тем точнее результат вычислений, меньше размер ошибки.
Одной из особенностей биологических и медицинских исследований является относительно небольшое число наблюдений. Нередки случаи единичных наблюдений, результаты которых также должны подвергаться статистической обработке.
Существует три основных метода определения достоверности относительных величин: вычисление ошибки относительной величины, определение достоверности разности двух относительных величин и метод доверительных интервалов.
1. Вычисление ошибки относительной величины.
Ошибка относительной величины обозначается знаком ( m ) и рассчитывается по следующей формуле:
m =
где Р - относительная величина,
q - альтернатива (величина, противоположная по значению Р)
q = 1 - Р Если показатель выражен в процентах,
то q = 100 - Р, если в промилле - то q = 1000 - Р и т.д.
n - число наблюдений.
Данная формула используется для определения ошибки относительного показателя при числе наблюдений n>30 (большая выборка). Если же мы имеем дело с малой выборкой (n<30), ошибка относительного показателя должна рассчитываться следующим образом:
m =
Произведем расчет ошибки для какого-либо относительного показателя:
В районе А. с населением 10000 жителей зарегистрировано 500 случаев заболевания гриппом. Интенсивный показатель заболеваемости населения гриппом будет равен:
500 х 1000
Р = -------------------- = 50 ‰
(50 случаев заболевания на каждую 1000 населения), следовательно, q = 1000 - 50 = 950
Ошибка этого показателя равна: m = = = ± 2,2 ‰
Ошибка относительного показателя всегда имеет знак ( ± ) и наименование, соответственно тому показателю, для которого она рассчитывается.
Существует следующее правило: ошибка показателя должна быть в три раза меньше величины самого показателя. Т.е., например, если мы имеем относительный показатель, равный 2,0%, а его ошибка равна ± 0,8%, то такому показателю нельзя доверять, т.к. 0,8 х 3 = 2,4 и 2,0 < 2,4. В нашем примере ошибка в 3 раза меньше полученного показателя, следовательно, ему можно доверять.
Достоверность относительного показателя с помощью ошибки определяется путем расчета доверительного интервала по следующей формуле:
P = Pв ± t m
где:
t- доверительный коэффициент, который может принимать значения 1, 2, 3.
Pв - показатель выборочной совокупности.
Если доверительный коэффициент равен 1, т.е. интервал P = Pв ± m, то вероятность того, что при повторных исследованиях показатель не выйдет за пределы данного интервала составляет 0,68 (68%).
Если доверительный коэффициент равен 2, т.е. интервал P = Pв ± 2m, то вероятность того, что при повторных исследованиях показатель не выйдет за пределы данного интервала составляет 0,95 (95%).
Если доверительный коэффициент равен 3, т.е. интервал P = Pв ± 3m, то вероятность того, что при повторных исследованиях показатель не выйдет за пределы данного интервала составляет 0,997 (99,7%).
Какие из этих интервалов можно назвать доверительными?
Из теории вероятностей известно, что вероятность, которой можно доверять, или доверительная вероятность, равная 0,95, считается достаточной для суждения о достоверности полученных результатов опыта. Вероятность, равная 0,997 считается еще более надежным критерием достоверности.
Следовательно, интервалы колеблемости показателя P = Pв ± 2m и P = Pв ± 3m являются доверительными интервалами показателя.
Произведем расчеты интервалов колеблемости показателя в нашем примере: Р = 50 ‰, m = ± 2,2 ‰
P ± m = 50 ± 2,2 = 47,8 - 52,2
P ± 2m = 50 ± 2 2,2 = 45,6 - 54,4
P ± 3m = 50 ± 3 2,2 = 43,4 - 56,6
Таким образом, мы можем утверждать, что показатель заболеваемости населения гриппом в районе А. фактически может приобретать любые значения в интервале 45,6 - 54,4 ‰ с достоверностью 0,95, и в интервале 43,4 - 56,6 ‰ с достоверностью 0,997. То есть, если при повторных изучениях заболеваемости населения гриппом мы будем получать значения, входящие в эти интервалы, все они будут достоверными.
Таким образом, при анализе любого статистического материала, рассчитав какой-либо относительный показатель, нельзя сразу делать заключение о величине исследуемого явления. Необходимо, рассчитав ошибку этого показателя, обязательно рассчитать один из доверительных интервалов (как минимум P ± 2m) и только тогда делать заключение о величине исследуемого явления.
Так, в нашем примере мы не можем утверждать, что показатель заболеваемости населения гриппом в районе А. составил 50 ‰, мы должны сделать заключение, что он с вероятностью 0,95 колеблется в пределах от 45,6 ‰ до 54,4 ‰ и любое значение этого же показателя в этом интервале, полученное при повторных исследованиях, будет достоверно.
Особый интерес представляет методика расчета ошибки относительного показателя при его значениях, равных 0% и 100%. Действительно, при расчете ошибки показателя по уже представленной форме получаем:
а) Р = 0% ; n = 125 ; m = = = 0
б) Р = 100% ; n = 125 ; m = =
В таких случаях можно сделать ошибочный вывод о том, что у относительной величины нет ошибки, т.е. она абсолютно достоверна. Однако это противоречит закону больших чисел, поскольку эти результаты могут быть получены и на малом числе наблюдений и даже на единичных наблюдениях, следовательно, они обязательно должны отклоняться от математически достоверных величин, т.е. иметь ошибку.
Для таких случаев предложена другая методика расчета ошибки относительной величины:
m =
где t- доверительный коэффициент
n - число наблюдений.
Приведем пример расчета ошибки относительного показателя, имеющего величину 100%.
В терапевтическом отделении для лечения 100 больных применили новое лекарственное средство, оказавшееся эффективным во всех случаях, т.е. в 100%. Возникает вопрос: действительно ли эффективен этот препарат во всех случаях?
Для того, чтобы ответить на этот вопрос, необходимо рассчитать ошибку полученного показателя:
Р = 100 % ; n = 100
m = ; при t = 2 получим m = = 3,8 %
Это означает, что при дальнейшем увеличении числа наблюдений в 95% случаев (т.к. t = 2) препарат будет неэффективен у 3,8% лечившихся больных.
При применении данной формулы ошибка не имеет знака (±), т.к. отклонение показателя может быть только в одну сторону - при 0% в большую, при 100% в меньшую. Кроме того, при определении доверительного интервала нет необходимости удваивать или утраивать ошибку, т.к. введя в формулу величину t мы сразу задаем необходимую его точность.