Вариационный ряд. средние величины.
При изучении общественного здоровья (например, показателей физического развития), анализе деятельности учреждений здравоохранения за год (длительность пребывания больных на койке и др.), оценке работы медицинского персонала (нагрузка врача на приеме и др.) часто возникает необходимость получить представление о размерах изучаемого признака в совокупности для выявления его основной закономерности.
Оценить размер признака в совокупности, изменяющегося по своей величине, позволяет лишь его обобщающая характеристика, называемая средней величиной.
Для более детального анализа изучаемой совокупности по какому-либо признаку помимо средней величины необходимо также вычислить критерии разнообразия признака, которые позволяют оценить, насколько типична для данной совокупности ее обобщающая характеристика.
ЦЕЛЬ ИЗУЧЕНИЯ ТЕМЫ: уметь использовать метод вариационной статистики для оценки и анализа статистической совокупности при изучении общественного здоровья и деятельности медицинских учреждений.
По окончании изучения данной темы студент должен:
Уметь:
• выявлять основную закономерность изучаемого признака путем вычисления средней величины;
• обосновывать методику применения критериев разнообразия вариационного ряда;
• давать характеристику разнообразия вариационного ряда;
• делать выводы о типичности обобщающей характеристики признака в изучаемой совокупности, используя критерии разнообразия вариационного ряда.
Для этого студент должен знать:
• основные понятия темы (вариационного ряда, средней величины, среднеквадратического отклонения, коэффициента вариации и др.);
• методику расчета средних величин и критериев разнообразия вариационного ряда (σ, Сv);
• методику анализа средних величин: значение среднеквадратического отклонения и коэффициента разнообразия для оценки вариабельности изучаемого признака и типичности средней величины;
• нормальное распределение вариационного ряда и его значение для оценки общественного здоровья и организации медицинской помощи;
• область применения характеристик вариационного ряда (М, σ, Сv).
ЗАДАНИЯ ДЛЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ СТУДЕНТА
1. Изучить материалы обязательной и рекомендуемой литературы, данного раздела учебного пособия.
2. Разобрать задачу-эталон.
3. Ответить на контрольные вопросы и тестовые задания в данном учебном пособии.
4. Решить ситуационные задачи.
Вариационный ряд – это ряд числовых измерений определенного признака, отличающихся друг от друга по величине, расположенных в определенном порядке. Вариационный ряд состоит из вариант (V) и соответствующих им частот (Р).
Варианта (V) – это каждое числовое значение изучаемого признака. Частота (Р) – это абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.
Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n.
Вариационный ряд, в котором каждая варианта встречается только один раз (т.е. все Р = 1) называется простым. Если варианты встречаются более одного раза, такой ряд называется взвешенным.
При большом числе наблюдений (более 30) вариационный ряд рекомендуется группировать. Для выбора количества групп в вариационном ряду необходимо учитывать число наблюдений, а также разность между максимальным и минимальным значениями вариант.
Построение из индивидуальных данных вариационного ряда – это только первый шаг к осмысливанию особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака. В медицинской статистике широко используются средние величины. Они применяются для характеристики здоровья населения: рождаемости, заболеваемости, инвалидности, смертности, в описании симптомов и течения различных болезней, физического развития отдельных контингентов, при обобщении результатов научных экспериментов. При характеристике организации амбулаторно-поликлинической помощи населению используются такие понятия, как среднее число врачебных посещений на одного жителя в год, средняя численность населения на терапевтическом и педиатрическом участке и т.д. Таким образом, средние величины чрезвычайно широко используются в медицинской статистике.
Средняя - это величина, которая одним числовым значением дает представление обо всей статистической совокупности. Средние величины следует вычислять только на качественно однородном материале. Так, например, при характеристике физического развития новорожденных в исследуемую группу должны быть отобраны младенцы одного пола. Во-вторых, при определении средних величин должно быть достаточное число наблюдений в выборочной совокупности.
Различают несколько видов средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, мода, медиана и др.
Из этих характеристик в медицинской статистике наиболее часто пользуются средними арифметическими величинами. Средние арифметические величины, в свою очередь, в зависимости от метода расчета делятся на:
· среднюю арифметическую простую,
· среднюю арифметическую взвешенную,
· среднюю арифметическую способом моментов,
· среднюю арифметическую в сгруппированном (интервальном) ряду.
Для расчета средней арифметической величины, прежде всего числовые значения (варианты) располагают в возрастающем или, напротив, в убывающем порядке, т.е. составляют вариационный ряд.
Пример 1. Вычисление средней арифметической простой:
Vcм | P |
n=9 |
В простом вариационном ряду средняя арифметическая простая определяется по формуле
cм
Когда отдельные значения вариант начинают повторяться, нужно указать частоту встречаемости (Р) каждой варианты (взвешенный вариационный ряд).
Во взвешенном вариационном ряду среднюю арифметическую можно определить двумя методами: средняя арифметическая «взвешенная» и по способу моментов.
Пример 2. Вычисление средней арифметической «взвешенной».
Vcм | P | V·P |
n=73 |
Средняя арифметическая взвешенная определяется по формуле:
cм
Этот способ определения средней величины является неудобным ввиду необходимости проведения больших расчетов и применяется, в основном, при наличии счетной техники.
Следующий способ (способ моментов) более удобен для расчета.
Пример 3. Вычисление средней арифметической способом моментов:
Vcм | P | а·(V- М1) | а·Р |
-9 | - 9 | ||
-7 | -28 | ||
-6 | -42 | ||
-4 | -32 | ||
-3 | -30 | ||
125 | |||
n =73 |
В вариационном ряду выбирается варианта, которая наиболее часто встречается (мода) и её принимают за условную среднюю величину (М1). В нашем примере 125. Находим отклонения всех других вариант от условной средней, затем сумму произведений отклонений всех вариант ( ) делим на общее число наблюдений ( момент первой степени).
Момент первой степени и является той величиной, которая показывает, насколько условная средняя варианта отличается от фактической или истинной средней. Напишем формулу:
cм
При большом количестве наблюдений число встречающихся размеров вариант может быть очень большим; тогда рекомендуются варианты объединять в группы, причем каждая группа должна иметь равное число значений вариант (иметь равный интервал) 2, 3 .... и т.д.
Пример 4. Вычисление средней арифметической в сгруппированном вариационном ряду.
V1 -V2 (cм) | P | ai | ai·P |
110-112 | -4 | - 4 | |
113-115 | -3 | -15 | |
116-118 | -2 | -22 | |
119-121 | -1 | -12 | |
122-124 | |||
125-127 | |||
128-130 | |||
131-133 | |||
n=73 |
Условной средней (M1) в сгруппированном вариационном ряду является середина наиболее часто встречающейся группы (122-124), которая определяется в зависимости от изучаемого признака двумя способами:
1. В непрерывном вариационном ряду, когда числовые значения изучаемого признака могут выражаться дробными числами (рост, вес, масса тела, содержание в крови и мочи их ингредиентов и т.д.) как полусумма первых значений смежных (соседних) групп.
2. В дискретном вариационном ряду, когда признаки выражены целыми числами (частота дыхания, пульс, артериальное давление и т.д.) - как полусумма начала и конца наиболее часто встречающейся группы, взятой за условную среднюю.
Наш вариационный ряд непрерывный (рост восьмилетних мальчиков). Поэтому середина равняется М1 = см
Отклонения (ai) в сгруппированном вариационном ряду определяем как условные, выраженные в интервальных значениях (при определении отклонения пренебрегаем интервалом).
Для расчета интервал (разница между значениями групп) i используем формулу:
i = Vmax - Vmin , где n1 – число групп
n1
В нашем примере интервал i = 3 см:
i = 133 - 110 = 2,8 ≈ 3 (года)
Напишем формулу:
см
Таким образом, мы рассмотрели четыре способа определения средней арифметической величины: среднюю арифметическую в простом вариационном ряду, во взвешенном вариационном ряду - среднюю арифметическую «взвешенную» и по способу моментов и среднюю арифметическую в сгруппированном вариационном ряду.
Кроме средней арифметической величины в медицинской статистике пользуются модой и медианой.
Модой в вариационном ряду называется варианта, которая среди других встречается наиболее часто. Практическое значение моды заключается в том, что, не проводя порой достаточно сложных расчетов, а, ориентируясь на моду, можно знать примерное значение средней величины.
Медианой называется варианта, делящая вариационный ряд пополам. Практическое значение медианы заключается в том, что в симметричном вариационном ряду, котором в обе стороны от середины находится равное число вариант, она по своему значению наиболее близка к средней величине.
Средние величины, взятые сами по себе без соответствующей оценки колеблемости вариационных рядов, из которых они вычислены, имеют ограниченное значение. Поясним на примере двух вариационных рядов:
V1 | P1 | V2 | P2 |
1 | |||
n=5 | n=5 |
В первой группе разность или колеблемость вариант незначительна, чем во второй группе. Следовательно, средняя арифметическая, равная в обоих случаях 10-ти, более типична для первого вариационного ряда.
Приближенно о варьировании (колеблемости) можно судить по:
· лимиты вариационного ряда (Vmax и Vmin)
· амплитуда вариационного ряда - разности между максимальным и минимальным размерами вариант.
А = Vmax - Vmin
· среднее квадратическое отклонение ( ) - наиболее точно характеризует степень варьирования.
· коэффициент вариации (СV)
Пример 5.Расчет среднего квадратического отклонения в простом вариационном ряду:
Vcм | P | d(V-M) | d2 |
-6,9 | 47,6 | ||
-4,9 | 24,0 | ||
-3,9 | 15,2 | ||
-1,9 | 3,6 | ||
-0,9 | 0,8 | ||
2,1 | 4,4 | ||
4,1 | 16,8 | ||
5,1 | 26,0 | ||
7,1 | 50,4 | ||
n=9 |
Последовательность расчета:
1. Находим отклонение (d) каждой варианты от истинной средней (V-M). Для данного вариационного ряда М = 122,9 (пример 1).
2. Отклонение возводим в квадрат (d2).
3. Находим сумму квадратов отклонений ( ).
4. Сумму квадратов отклонений делим на число наблюдений и извлекаем корень квадратный.
Напишем формулу:
При числе наблюдений n < 30 формула следующая:
см
Пример 6. Расчет среднего квадратичного отклонения во взвешенном вариационном ряду (способ среднеарифметический):
Vсм | P | d | d2 | d2P |
-8 | ||||
-6 | ||||
-5 | ||||
-3 | ||||
-2 | ||||
n=73 |
Последовательность расчета:
1. Находим отклонения вариант от истинной средней М=124,02 (пример 2). Для упрощения расчетов возьмем М =124 см.
2. Отклонения возводим в квадрат (d2).
3. Квадрат отклонений умножаем на частоту (d2P).
4. Находим сумму квадратов отклонений ( ).
5. Сумму квадратов отклонений делим на число наблюдений и извлекаем корень квадратный.
Напишем формулу:
см
Если средняя арифметическая рассчитывалась по способу моментов. То среднее квадратичное отклонение определяется по следующей методике.
Пример 7. Расчет среднего квадратического отклонения во взвешенном вариационном ряду моментов.
Vсм | P | a | aP | a2 | a2P |
-9 | -9 | ||||
-7 | -28 | ||||
-6 | -42 | ||||
-4 | -32 | ||||
-3 | -30 | ||||
125 | |||||
n=73 |
Последовательность расчета:
Находим отклонения (а) вариант от условной средней (М1=125).
Отклонения умножаем на частоту встречаемости вариант (аP).
3.Находим сумму отклонений ( ) и делим на число наблюдений ( ) - момент первой степени.
4.Отклонения возводим в квадрат (а2).
5.Квадрат отклонений умножаем на частоту (а2P).
6.Находим сумму квадратов отклонений ( ) и делим на число наблюдений ( ) - момент второй степени.
7.Из момента второй степени вычитаем момент первой степени, возведенный в квадрат, извлекаем корень квадратный.
Напишем формулу и определим сигму:
cм
При определении средней арифметической величины в сгруппированном вариационном ряду отклонения (а) определяются в условных интервальных отклонениях (пример 4.) Формула расчета среднего квадратичного отклонения в этом случае следующая:
, где
i - интервальное отклонение.
В целях экономии времени, затрачиваемого на расчеты, среднее квадратичное отклонение можно найти упрощенным способом:
, где
К- специальный коэффициент, величина которого определяется числом наблюдений по таблице С.И. Ермолаевой.
Значение К для вычисления квадратичного отклонения ( ) по амплитуде
- | - | 1,13 | 1,69 | 2,06 | 2,33 | 2,53 | 2,70 | 2,85 | 2,97 | |
3,08 | 3,17 | 3,26 | 3,34 | 3,41 | 3,47 | 3,53 | 3,59 | 3,64 | 3,69 | |
3,73 | 3,78 | 3,82 | 3,86 | 3,90 | 3,93 | 3,96 | 4,00 | 4,03 | 4,06 | |
4,09 | 4,11 | 4,14 | 4,16 | 4,19 | 4,21 | 4,24 | 4,26 | 4,28 | 4,30 | |
4,32 | 4,34 | 4,36 | 4,38 | 4,40 | 4,42 | 4,43 | 4,45 | 4,47 | 4,48 | |
4,50 | 4,51 | 4,53 | 4,54 | 4,56 | 4,57 | 4,59 | 4,60 | 4,61 | 4,63 | |
4,64 | 4,65 | 4,66 | 4,68 | 4,69 | 4,70 | 4,71 | 4,72 | 4,73 | 4,74 | |
4,75 | 4,77 | 4,78 | 4,79 | 4,80 | 4,81 | 4,82 | 4,83 | 4,83 | 4,84 | |
4,85 | 4,86 | 4,87 | 4,88 | 4,89 | 4,90 | 4,91 | 4,91 | 4,92 | 4,93 | |
4,94 | 4,95 | 4,96 | 4,96 | 4,97 | 4,98 | 4,99 | 4,99 | 5,00 | 5,01 | |
5,02 | 5,49 | 5,76 | 5,94 | 6,07 | 6,18 | 6,28 | 6,35 | 6,42 | 6,48 |
Для нашего примера среднее квадратичное отклонение упрощенным методом: см