Метод стандартизации показателей
Сущность применения метода стандартизации заключается в том, что при сравнении общих показателей необходимо иметь ввиду, что на их уровни может оказывать влияние неоднородность составов сравниваемых совокупностей по ряду признаков. Во многих медико-социальных исследованиях, а также в клинических работах исключена возможность получения однородных групп для сравнения тех или иных показателей. Это касается прежде всего показателей заболеваемости, рождаемости, общей смертности по странам, городам, областям, районам имеющим разный состав населения как по возрасту так и по полу.
Для сравнения общих показателей, вычисленных из неоднородных по своему составу совокупностей, применяется метод стандартизации. Таким образом, стандартизация – это метод расчета условных (стандартизованных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за несопоставимости состава групп.
Стандартизованные показатели условны, потому что они, устраняя влияние того или иного фактора на истинные показатели, указывают, какими были бы эти показатели, если бы влияние данного фактора отсутствовало. Следовательно, стандартизованные показатели могут быть использованы только с целью сравнения.
Существует три метода стандартизации: прямой (наиболее распространенный), косвенный и обратный (Керриджа).
Прямой метод стандартизации предполагает пять последовательных этапов.
1 этап – расчет общих и специальных (по каждой группе – половой, возрастной и др.) интенсивных показателей (или средних величин) для двух сравниваемых совокупностей.
2 этап – выбор и расчет стандарта.
3 этап – расчет «ожидаемых величин» для каждой группы стандарта.
4 этап – определение стандартизованных показателей.
5 этап – сравнение групп по общим интенсивным (или средним) и стандартизованным показателям, и делаются выводы.
Прямой метод стандартизации применяется при:
1) значительных различиях в уровнях групповых показателей (разные уровни заболеваемости мужчин и женщин, разные уровни летальности по отделениям больниц, различная средняя длительность лечения по заболеваниям и т.д.);
2) значительной неоднородности составов сравниваемых совокупностей.
Косвенный метод стандартизации применяется, если специальные коэффициенты в сравниваемых группах не известны или известны, но мало достоверны. В исследованиях это наблюдается, например, когда числа заболевших очень малы и, следовательно, вычисляемые коэффициенты будут существенно меняться в зависимости от прибавления одного или нескольких случаев заболеваний.
Стандартизованные коэффициенты косвенным способом вычисляются тремя этапами:
1 этап – выбор стандарта. Так как обычно бывают неизвестны специальные коэффициенты сравниваемых групп, то за стандарт берутся коэффициенты какого-то хорошо изученного коллектива (группы).
2 этап – вычисление «ожидаемых» чисел (величин) в каждой возрастной группе.
3 этап – вычисление стандартизованных коэффициентов (показателей). Для этого действительное число явления (признака) относят к суммарному «ожидаемому» числу, а результат умножают на общий коэффициент стандарта явления (признака):
Обратный метод стандартизации (Керридж, 1958) применяется при отсутствии данных о составе населения (возрастном), когда имеются лишь сведения об аналогичном составе населения (больных, умерших), т.е. данные обратные тем, что использовались при косвенном методе.
Рассматриваемый метод дает менее точные результаты. Они будут тем точнее, чем более дробные интервалы (возраста) применяются при стандартизации. Возможно также выбрать подходящий, близкий к свариваемым контингентам, стандарт. Стандартом могут служить, например, возрастные коэффициенты смертности или заболеваемости.
Расчет стандартизованных показателей обратным методом производится в три этапа:
1 этап – состоит из выбора стандарта, т.е. коэффициентов ранее определенных с достаточной точностью.
2 этап – включает в себя вычисление «ожидаемой» величины изучаемого признака (явления). Для чего делим число имеющегося признака в каждой возрастной группе на соответствующие повозрастные коэффициенты данного явления (признака) принятого за стандарт населения и результат умножаем на 100000.
3 этап – предусматривает устранение различий между «ожидаемыми» и фактическими числами результата. Для этого делим «ожидаемое» число на фактическое и умножаем на принятый за стандарт коэффициент явления (заболеваемости, смертности).
Таким образом, стандартизация позволяет сделать правильный вывод о том, имеется ли действительно разница общих интенсивных коэффициентов в сравниваемых группах (коллективах) или эти различия зависят только от неодинаковой структуры сравниваемых совокупностей.
В заключении необходимо еще раз подчеркнуть, что выбор конкретного метода стандартизации зависит от того, насколько полный статистический материал имеется в наличии. Прямой метод дает более надежные результаты, но в случае невозможности его применения следует использовать косвенный или обратный метод стандартизации: они достаточно точны для практического применения.
Контрольные вопросы.
1. В каких формах может проявляться связь между различными признаками?
2. Что такое корреляция?
3. Что включает в себя понятие «функциональная связь»?
4. Какая связь называется корреляционной?
5. Какой по направлению может быть корреляционная связь?
6. Как рассчитывается сила связи коэффициентов корреляции?
7. В каких пределах может колебаться сила связи коэффициентов корреляции?
8. Как определить соответствует ли полученный при вычислении коэффициент корреляции размеру связи в генеральной совокупности?
9. Какое значение имеют коэффициенты корреляции для медицины и здравоохранения?
10. Что позволяет охарактеризовать дисперсионный анализ в статистике?
11. Какие Вы знаете виды дисперсионного анализа?
12. С какой целью применяется метод стандартизации показателей?
13. Дать определение понятию «стандартизация»
14. Сколько и какие методы стандартизации применяются в медицинской статистике?
15. Охарактеризуйте прямой метод стандартизации
16. Когда применяется косвенный метод стандартизации? Охарактеризуйте данный метод
17. В каких случаях используется обратный метод стандартизации? Какие этапы расчета стандартизованных показателей включает данный метод?
18. В чем проявляется значение использования методов стандартизации несмотря на то, что они условны?
19. Дать характеристику коэффициента корреляции гинекологической заболеваемости в зависимости от возраста:
Возраст (лет) | Заболеваемость в %0 | Коэффициент корреляции |
0,8 2,7 18,3 23,0 18,7 7,6 | 0,1 0,25 0,75 0,85 0,76 0,45 |
20. Охарактеризуйте заболеваемость гепатитом в цехе А и цехе Б по фактическому и «ожидаемому» числу больных в группе стандарта:
Пол | Цех А | Цех Б | Стандарт (сумма работающих в А и Б) | «Ожидаемое» число больных в группе стандарта | |||
Число рабочих | Из них больных | Число рабочих | Из них больных | Цех А | Цех Б | ||
Муж Жен | 4,4 11,5 | 5,06 23,0 | |||||
Итого | 15,9 | 28,06 |
Глава 19. Динамические ряды. Графическое изображение в статистике.
В медицине и здравоохранении изучение здоровья населения, а также характера и объема деятельности ЛПУ должно проводиться с учетом их изменений во времени, т.е. в динамике. Для этого необходимо уметь составлять динамические ряды различных типов, уметь их выравнивать и анализировать.
Динамическим рядом называется совокупность однородных статистических величин, показывающих изменение какого-либо явления на протяжении определенного промежутка времени.
Величины, составляющие динамический ряд, называются уровнями ряда. Уровни ряда могут быть представлены абсолютными, относительными или средними величинами. Ряды могут быть простыми (из абсолютных величин) и сложными (из относительных или средних величин). Простой динамический ряд бывает двух типов: моментный и интервальный.
Моментный динамический ряд состоит из величин, характеризующих явление на какой-то определенный момент (дату). Например, каждый уровень может характеризовать численность населения, численность врачей и т.д. на конец какого-то года (статистическая форма №30 годового отчета ЛПУ). Уровни моментного ряда не подлежат дроблению (табл. 20)
Таблица 20
Динамика среднегодовой численности населения РФ (моментальный динамический ряд).
Годы | Численность населения (в млн.) | Годы | Численность населения (в млн.) |
141,1 147,4 148,0 148,5 148,3 148,3 | 148,0 147,9 147,6 147,1 146,7 146,3 |
Интервальный динамический ряд состоит из величин, характеризующих явление за определенный промежуток времени (интервал). Например, каждый уровень такого ряда может характеризовать смертность, рождаемость, заболеваемость, среднегодовую занятость койки за какой-то год (табл. 21). В отличие от моментального ряда, интервальный динамический ряд можно разделить на более дробные периоды, или можно укрупнить интервалы.
Таблица 21
Динамика рождаемости в РФ (интервальный динамический ряд).
/Данные Госкомстата России/
Годы | Число родившихся (на 1000 человек населения) | Годы | Число родившихся (на 1000 человек населения) |
17,2 17,2 16,0 14,6 13,4 12,1 10,7 | 9,4 9,6 9,3 8,9 8,6 8,8 8,3 |
Выбор величины периода для интервального ряда (год, месяц, день, час и т.д.) в известной мере определяется степенью изменчивости явления (смертность, заболеваемость, рождаемость и т.д.). Чем медленнее изменяется явление во времени, тем крупнее могут быть периоды наблюдения.
Сложные ряды строятся из простых как моментных, так и интервальных. Состоят они из средних величин (средняя длительность лечения, среднегодовое число коек за несколько лет) или из относительных величин (заболеваемость, смертность, рождаемость, также за несколько лет).
Иногда динамика изучаемого явления бывает представлена не в виде непрерывно меняющегося в одном направлении явления, а скачкообразными изменениями, что затрудняет возможность проследить основную закономерность, свойственную явлению в наблюдаемый период. В таких случаях рекомендуется произвести выравнивание ряда.
Существует несколько способов выравнивания динамического ряда:
1. укрупнение интервалов;
2. расчет групповой средней;
3. расчет скользящей средней;
4. метод наименьших квадратов.
Укрупнение интервала производится путем суммирования данных за ряд смежных периодов (за квартал, за один, два, три года и т.д.). Например, если помесячные числа заболеваний острым тонзиллитом могут увеличиваться, или уменьшатся, то после укрупнения интервалов по кварталам года можно увидеть определенную закономерность сезонного колебания с наибольшим числом заболеваний в летне-осеннем периоде.
Вычисление групповой средней для каждого укрупненного периода производится следующим образом: суммируются смежные уровни соседних периодов, а затем полученная сумма делится на число слагаемых. Выравнивание ряда путем вычисления групповой средней позволяет получить данные, иллюстрирующие довольно четкую, без резких волнообразных колебаний, тенденцию к постепенному снижению или увеличению показателя исследуемого явления (признака).
Влияние случайных колебаний на уровни динамического ряда может быть устранено и с помощью скользящей средней. Вычисление скользящей средней позволяет каждый уровень заменить на среднюю величину из данного уровня и двух соседних с ним, т.е. при расчете используются интервалы, включающие три хронологических периода. Скользящая средняя является простейшим способом выравнивания ряда. Однако этот метод исключает из анализа средние величины первого и последнего уровня. Поэтому, для более точного определения тенденции изучаемого явления, лучше производить расчет скользящих средних с учетом крайних уровней по формуле Урбаха:
, где
ССУ1 – определяемая скользящая средняя крайнего (первого) уровня;
у1 – средний показатель первого уровня;
у2 – средний показатель второго уровня;
у3 – средний показатель третьего уровня;
Для вычисления скользящей средней последнего (n) крайнего уровня пользуются формулой:
, где
ССУn – определяемая скользящая средняя крайнего (последнего) уровня;
yn – средний показатель последнего уровня ;
уn-1 – средний показатель предыдущего к последнему уровня;
уn-2 – средний показатель предшествующий предыдущему к последнему уровню;
Но наиболее точно выравнивать тенденции изучаемого явления позволяет только метод наименьших квадратов. Он позволяет рассчитать точки происхождения такой прямой линии, от которой имеющаяся эмпирическая находится на расстоянии наименьших квадратов от других возможных линий.
Динамический ряд, в случае применения данного метода, должен иметь не менее пяти хронометрических дат, количество их должно быть нечетным, а интервалы между ними – одинаковыми. Даты искомой прямой линии округляются по следующей формуле :
y1=a0 +a1x, где
a0- хронологическая средняя ( значение центральной хронологической даты ), которая в свою очередь вычисляется по формуле :
, где
S - сумма хронологических дат (периодов);
- сумма всех значений изучаемого явления;
a1 - коэффициент поправки искомого расстояния, определяемого по формуле:
, где
x - порядковый номер (расстояние) хронологических дат от центральной, принятой за “ноль”.
Сумма произведений xy определяется с учетом алгебраических знаков (+ или - ).
Зная, величины a0 и a1, подставляем их в уравнение: y1=a0 +a1x и, придавая последовательные значения чисел ряда x, получим выравненный динамический ряд изучаемого явления.
Таким образом, выравнивание уравнений динамических рядов дает возможность проследить основную закономерность, свойственную явлению в наблюдаемый период, а также получить наглядность характеристики того или иного явления.
Для проведения анализа динамических рядов используются следующие показатели:
1) абсолютный прирост (убыль);
2) темп прироста (убыли);
3) темп роста (снижения);
4) абсолютное значение одного процента прироста (убыли).
Методика расчета показателей:
Абсолютный прирост – разность между последующим и предыдущим уровнем. Измеряется в тех же единицах, в которых представлены уровни ряда.
Темп прироста отношение абсолютного прироста каждого последующего уровня к предыдущему, принятому за 100%.
Темп роста отношение каждого последующего уровня к предыдущему, принятому за 100%.
Если показатель роста (убыли) показывает сколько процентов от предыдущего уровня составляет последующий уровень, то темп прироста показывает на сколько процентов увеличился (снизился) последующий уровень по сравнению с предыдущим.
Поэтому, темп прироста можно рассчитать по формуле:
ТП=ПР-100%, где
ТП- темп прироста;
ПР- показатель роста;
Абсолютное значение одного процента прироста – отношение абсолютного прироста (убыли) к темпу прироста (убыли).
Динамические ряды и их показатели можно представить в виде таблицы (табл. 22) и графического изображения (рис. 3).
Рис. 3 Динамика и темп убыли численности больничных коек в стационарах К-ой области.
Таблица 22
Динамика численности больничных коек в стационарах К-ой области.
Годы | Число больничных коек, (тыс.) | Абсолютный прирост (убыль), (тыс.) | Показатель наглядности, % | Показатель роста (убыль), % | Темп прироста (убыли), % |
58,5 53,9 51,1 49,3 47,8 | — -4,6 -2,8 -1,8 -1,5 | 92,1 87,4 84,3 81,7 | — 92,1 94,8 96,5 97,0 | — -7,9 -5,2 -3,5 -3,0 |
Как видно из приведенной таблицы, рассчитанные показатели динамического ряда свидетельствуют об убыли числа больничных коек в К-ой области, однако темп их убыли в рассматриваемый период снижается.
Для наглядного представления различных статистических величин, а также для их анализа широко используются графические изображения.
Графиками в статистике называются условные изображения числовых величин и их соотношений в виде различных геометрических образов - точек, линий, плоских фигур, объемных изображений и т. д. Применение графического метода в статистическом исследовании не только делает изучаемые показатели более наглядными, доступными для понимания, но и позволяет глубже их проанализировать.
Графические изображения могут быть построены как по абсолютным, так и по относительным величинам. В статистике различают графики: аналитический (взаимосвязи, сравнения) и изобразительный.
График взаимосвязи показывает полноту и форму зависимости между явлениями. Классическая форма графика взаимосвязи – график корреляционного поля (рис.4), дающий общее представление о наличии и характере зависимости между явлениями.
Рис. 4 Зависимость числа заболеваний бронхитом от температуры воздуха.
Как видно из рисунка, между температурой воздуха и числом случаев бронхита существует корреляционная связь. При этом с повышением температуры воздуха число бронхитов уменьшается.
Графики корреляции (сравнения) дают представление не только о наличии, но и о направлении связи. Если точки по полю графика распределены равномерно, то связи нет. Если они группируются по одной из диагоналей, когда точки расположены от левого нижнего угла к правому верхнему – существует прямая связь; когда точки распложены от левого верхнего угла к правому нижнему - связь называется обратной.
При применении графического метода важно знать, что содержание каждого показателя должно строго соответствовать виду графического изображения.
Статистические графики делятся по следующим признакам: способу построения, характеру графического образа, назначению (содержанию).
По способу построения графики делятся на: диаграммы, картограммы и картодиаграммы.
По характеру графического образа графики бывают: точечные, линейные, плоскостные (столбиковые, полосовые или ленточные, квадратные, круговые, секторные, фигурные) и объемные.
По назначению (содержанию) выделяют графики: различных относительных величин (структуры, динамики), сравнения в пространстве, размещения по территории, вариационных рядов, взаимосвязанных показателей.
В тоже время, возможны комбинации этих графиков.
В медицинской статистике принято выделять виды графических изображений и виды диаграмм.
Виды графических изображений: диаграммы, картограммы и картодиаграммы.
Диаграммой называется изображение статистических данных в виде точек, линий, плоскостей и фигур.
Диаграммы бывают:
1) Линейные (арифметические, полулогарифмические, полигон, гистограмма и радиальные);
2) Плоскостные (столбиковые, внутри столбиковые, ленточные, секторные и круговые);
3) Объемные (параллелепипед, куб, шар);
4) Фигурные (койки, люди и т.д.)
Картограммами называются статистические данные изображенные на географической карте.
Картодиаграммы – это статистические данные, изображенные в виде диаграммы на географической карте.
Вид графического изображения выбирается в зависимости от статистической величины.
Абсолютные величины, характеризующие статику явления можно изобразить в виде:
1) Диаграмм – плоскостной, столбиковой, объемной, фигурной (рис. 5)
2) Картограмм;
3) Картодиаграмм
Рис. 5. Виды диаграмм.
Относительные величины (экстенсивный, интенсивный показатели, показатель соотношения и наглядности) характеризуют распределение признаков в совокупности и их сравнение в ходе анализа. Графически они могут быть изображены следующим образом (рис 6).
Рис.6 Виды графического изображения относительных величин.
1) Экстенсивные показатели, характеризующие структуру явления, изображаются в виде плоскостных диаграмм (секторной или внутристолбиковой);
2) Интенсивные показатели, характеризующие частоту явления, изображаются в виде диаграмм (линейной, плоскостной столбиковой или ленточной, объемной, фигурной);
3) Показатели соотношения, характеризующие отношение между двумя самостоятельными совокупностями, представляют в виде тех же графических изображений, что и интенсивные показатели;
4) Показатели наглядности, получающиеся из отношения ряда сравниваемых величин к одной из них, принятой за 100, графически изображаются так же, как интенсивные показатели.
При выборе графического изображения следует иметь в виду, что оно должно строго соответствовать сущности изображаемых показателей. Любой график включает следующие элементы: графический образ, показывающий размер изображаемого явления или процесса, масштабы и масштабные шкалы, указание единиц измерения, пояснение условных обозначений в окраске, штриховке, расположении фигур, линий.