Анализ вариационного ряда. Оценка достоверности результатов статистического исследования.
МЕТОДИЧЕСКИЕ УКАЗАНИЯ ДЛЯ СТУДЕНТОВ
к практическому занятию на тему:
Подготовка к выполнению практических приемов по теме занятия.
Материалы для контроля уровня освоения темы(тесты, ситуационные задачи прилагаются)
Место проведения самоподготовки: читальный зал, учебная комната для самостоятельной внеаудиторной работы студентов по освоению практических навыков, оснащенная необходимыми учебно-методическими материалами, модуль практических навыков, компьютерный класс.
Учебно-исследовательская работа студентов работа с основной и дополнительной литературой.
САМОСТОЯТЕЛЬНАЯ АУДИТОРНАЯ РАБОТА СТУДЕНТОВ
Тестовые задания для контроля исходного уровня знаний
Выберите один или несколько правильных ответов
1. ВАРИАЦИОННЫЙ РЯД - ЭТО:
1) ряд любых измерений
2) измерения, расположенные в ранговом порядке
3) однородные показатели, изменяющиеся во времени
4) ряд отвлеченных величин
5) ряд элементов статистической совокупности
2. ДОСТОВЕРНОСТЬ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ ВЕЛИЧИНЫ ЗАВИСИТ ОТ СЛЕДУЮЩИХ ЭЛЕМЕНТОВ (ВЕРНО ВСЕ, КРОМЕ ОДНОГО):
1. колеблемость ряда
2. условная средняя
3. её ошибка
4. среднее квадратическое отклонение
3. РАЗНОСТЬ ПОКАЗАТЕЛЕЙ ЯВЛЯЕТСЯ СТАТИСТИЧЕСКИ ЗНАЧИМОЙ, ЕСЛИ ВЕЛИЧИНА «р» РАВНА:
1) 0,15
2) 0,1
3) 0,05
4) 0,01
5) 0,001
4. ДОСТОИНСТВО СРЕДНЕЙ ВЕЛИЧИНЫ СОСТОИТ В ТОМ, ЧТО ОНА ПОЗВОЛЯЕТ
1) анализировать большое число наблюдений
2) выявить закономерности при малом числе наблюдений и большом разбросе показателей
3) с помощью одного числа получить представление о совокупности массовых явлений
5. МЕРИЛОМ ДОСТОВЕРНОСТИ СРЕДНЕЙ И ОТНОСИТЕЛЬНОЙ ВЕЛИЧИНЫ ЯВЛЯЕТСЯ
1) среднее квадратическое отклонение
2) размах вариации
3) ошибка репрезентативности
4) коэффициент вариации
6. МОДА-ЭТО:
1) расчетная величина
2) варианта, чаще других встречающаяся
3) варианта, делящая вариационный ряд на две равные части
4) модальный показатель
5) условная средняя
7. МЕДИАНА - ЭТО:
1) наибольшее значение и делящая вариационный ряд на
две равные части
2) варианта, делящая вариационный ряд на две равные части
3) условная средняя, делящая вариационный ряд на две равные части
4) средняя, делящая вариационный ряд на две равные части
5) модальный показатель
8.ПРИ ПОЛЬЗОВАНИИ ТАБЛИЦЕЙ СТЬЮДЕНТА НЕОБХОДИМО ЗНАТЬ:
1) объем наблюдений
2) среднеквадратическое отклонение
3) уровень вероятности безошибочного прогноза
4) величина ошибки
9. ПРОЦЕНТНОЕ ОТНОШЕНИЕ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ К СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ – ЭТО
1) ошибка репрезентативности
2) условная средняя
3) доверительный коэффициент
4) коэффициент вариации
5) критерий достоверности разности
10. РАЗНОСТЬ СРАВНИВАЕМЫХ ВЕЛИЧИН СУЩЕСТВЕННА, ЕСЛИ
1) t >=1
2) t >=2
3) t <=2
11. ДЛЯ МЕДИЦИНСКИХ ИССЛЕДОВАНИЙ ДОСТАТОЧНОЙ СТЕПЕНЬЮ ВЕРОЯТНОСТИ ЯВЛЯЕТСЯ (%)
1) 75
2) 99,9
3) 95,0
4) 68
12. ГРАНИЦА ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПРИ ЗАДАННОЙ СТЕПЕНИ ВЕРОЯТНОСТИ ХАРАКТЕРИЗУЕТ
1) среднее квадратическое отклонение
2) степень вариации
3) доверительный коэффициент
4) ошибка
5) доверительный интервал
Задания для самостоятельной аудиторной работы студентов
Тема: Вариационный анализ. Оценка достоверности результатов статистического исследования
Вариант -1
1. При измерении роста (см) 327 семнадцатилетних юношей материал распределился следующим образом: 154-156 (45 чел), 157-159 (60 чел), 160-162 (83 чел), 163-165 (80 чел), 166-168 (53 чел), 169-171 (6 чел).
На основе имеющихся данных рассчитать:
1) среднюю арифметическую сгруппированного ряда по способу моментов;
2) среднее квадратическое отклонение;
3) ошибку средней арифметической;
4) используя таблицу Стьюдента, доверительный интервал с 95% вероятностью.
Сделать заключение.
2. При изучении белкового обмена у женщин с пороком сердца получены следующие данные содержания общего белка в материнском молоке в зависимости от состояния кровообращения:
в стадии компенсации М1 ± m1 = 8,29 ± 0,29% /35 чел/.
в стадии декомпенсации М2 ± m2 = 7,81 ± 0,24% /22 чел/.
Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента. Можно ли на основании этих данных сделать вывод, что в стадии декомпенсации отмечается снижение общего белка в материнском молоке?
3. Число осложнений при оперативных вмешательствах в больнице "А" было 97 среди 2886 оперированных больных, а в больнице "В" - 46 осложнений среди 1623 оперированных больных (распределение оперированных больных по видам оперативных вмешательств в этих больницах было примерно одинаковое).
Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента. Можно ли сделать вывод о действительной разнице в числе осложнений в одной больнице по сравнению с другой?
Вариант -2
1.При изучении веса 326 призывников (в кг) материал распределился следующим образом: 50-53,9 (8 чел), 54-57,9 (32 чел), 58-61,9 (49 чел), 62-65,9 (65 чел), 66-69,9 (62 чел), 70-73,9 (48 чел), 74-77,9 (19 чел), 78-81,9 (16 чел), 82-85,9 (14 чел), 86-89,9 (8 чел), 90-93,9 (5 чел).
На основе имеющихся данных рассчитать:
1) среднюю арифметическую сгруппированного ряда по способу моментов;
2) среднее квадратическое отклонение;
3) ошибку средней арифметической;
4) используя таблицу Стьюдента, исчислить доверительные интервалы с 95% вероятностью. Сделать заключение.
2. Изучалось изменение показателей функций внешнего дыхания у 42 больных с хронической пневмонией до и после лечения. Частота дыхания в минуту до лечения была 21,5 ± 1,0 (М1 ± m1), а после лечения 18,2 ± 0,8 (М2 ± m2). Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента.
3. Изучалось качество диагностики и лечебной тактики при язвенной болезни у подростков за ряд лет и получены следующие данные:
За 2001-2006 гг. из 130 больных было прооперировано 12, за 2006-2012 гг. из 205 больных прооперировано 6. Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента.
Есть ли на самом деле снижение частоты операций?
Вариант -3
1.При измерении веса 331 новорожденных материал распределился следующим образом: 2600 (11 чел), 2800 (27 чел), 3000 (35 чел), 3200 (64 чел), 3400 (57 чел), 3600 (26 чел), 3800 (69 чел), 4000 (27 чел), 4200 (13 чел), 4400 (2 чел).
На основе имеющихся данных рассчитать:
1) среднюю арифметическую не сгруппированного ряда по способу моментов;
2) среднее квадратическое отклонение;
3) ошибку средней арифметической;
4) используя таблицу Стьюдента, исчислить доверительные интервалы с 95 % вероятностью. Сделать заключение.
2. У 200 больных с пароксизмальной аритмией определялось содержание свободного холестерина в сыворотки крови, которое составило во время пароксизма 100,0 ± 5,0 (М1 ± m1) мг., а вне пароксизма 78,0 ± 3,0 мг. (М2 ± m2). Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента. Сделать заключение.
m2
3. Изучалась трудоспособность больных с синусовым ритмом и мерцательной аритмией. В первой группе больных из 100 человек стали инвалидами 42, а во второй - из 137 человек - 87. Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента.
Вариант -4
1.При измерении уровня максимального кровяного давления (мм.рт.ст.) у 182 мужчин в возрасте 50 лет материал распределился следующим образом: 120-129 (21 чел), 130-139 (32 чел), 140-149 (62 чел), 150-159 (33 чел), 160-169 (19 чел), 170-179 (15 чел).
На основе имеющихся данных рассчитать:
1) среднюю арифметическую сгруппированного ряда по способу моментов;
2) среднее квадратическое отклонение;
3) ошибку средней арифметической;
4) используя таблицу Стьюдента, исчислить доверительные интервалы с 95% вероятностью. Сделать заключение.
2.При оценке эффективности применения ангинина в лечении диабетической микроангиопатии у 45 больных с пониженной клубочковой фильтрацией был определен ее уровень до лечения 125,0 ± 13,7 мл/мин. (М1+ m1) и после лечения 128,0 ± 11,7 мл/мин. (М2 + m2). Рассчитать коэффициент достоверности, оценить по таблице Стьюдента. Повлияло ли лечение на нормализацию клубочковой фильтрации?
3. В больнице А из 3700 больных умерло 40, а в больнице Б из 4200 умерло 48 (распределение больных по возрасту и нозологическим формам в этих больницах было примерно одинаковым). Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента. Имеется ли действительная разница в летальности в двух больницах?
Вариант -5
1.При измерении окружности грудной клетки 311 призывников (в см.) материал распределился следующим образом: 74-75,9 (19 чел), 76-77,9 (34 чел), 78-79,9 (40 чел), 80-81,9 (65 чел), 82-83,9 (62 чел), 84-85,9 (35 чел), 86-87,9 (21 чел), 88-89,9 (13 чел), 90-91,9 (11 чел), 92-93,9 (9 чел), 94-95,9 (2 чел).
На основе имеющихся данных рассчитать:
1) среднюю арифметическую сгруппированного ряда по способу моментов;
2) среднее квадратическое отклонение;
3) ошибку средней арифметической;
4) используя таблицу Стьюдента, исчислить доверительные интервалы с 95% вероятностью. Сделать заключение.
2. При изучении динамики антитоксинообразования у обоженных больных, получивших полный курс анатоксинотерапии, были получены следующие цифры содержания анатоксинов в крови (в АЕ): в группе из 69 больных до лечения 2,20 ± 0,60 (М1 ± m1); в той же группе после лечения (69 человек) 14,5 ± 1,59 (М2 ± m2). Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента. Сделать заключение
3. Изучалась частота аритмий, вызванных применением сердечных гликозидов при хронической болезни сердца. В группе больных из 76 человек возраста до 60 лет, аритмии были отмечены в 10 случаев, а в группе больных из 46 человек возраста старше 60 лет – у 20. Рассчитать коэффициент достоверности различий, оценить по таблице Стьюдента. Есть ли зависимость между частотой осложнений и возрастом?
Вариант -6
1.При измерении спирометром у 112 пятнадцатилетних школьников, занимающихся в спортивной школе, материал распределился следующим образом: 3550-3600 см (10 чел), 3650-3700 см.(17 чел), 3750-3800 см. (25 чел), 3850-3900 см. (31 чел), 3950-4000 см. (19 чел), 4050-4100 см. (2 чел), 4150-4200 см. (8 чел).
На основе имеющихся данных рассчитать:
1) среднюю арифметическую сгруппированного ряда по способу моментов;
2) среднее квадратическое отклонение;
3) ошибку средней арифметической;
4) используя таблицу Стьюдента, исчислить доверительные интервалы с 95% вероятностью. Сделать заключение.
2.Насколько более выражено отрицательное влияние раннего искусственного вскармливания в сравнении с поздним искусственным вскармливанием, если в первом случае из 152 детей гипотрофия наблюдалась у 30 человек, а во втором случае из 199 детей - у 14.
3. При анализе крови 52 новорожденных с гемолитической болезнью на предмет билирубина установлено до лечения 9,53 ± 0,79 мг % (М1 ± м1), после проведения заместительного переливания крови содержание билирубина стало 5,34 ± 0,52 мг % (М2 ± м2).
Тестовые задания для контроля конечного уровня знаний
Выберите один или несколько правильных ответов
1. ПРИ РАСЧЕТЕ ДОВЕРИТЕЛЬНЫХ ГРАНИЦ СРЕДНЕЙ И ОТНОСИТЕЛЬНОЙ ВЕЛИЧИНЫ ПРИ ЧИСЛЕ НАБЛЮДЕНИЯ N<30 ДОВЕРИТЕЛЬНЫЙ КОЭФФИЦИЕНТ (T) ОПРЕДЕЛЯЕТСЯ
1) по специальной формуле
2) по таблице со специальным коэффициентом
3) по таблице Стьюдента
4) с помощью коэффициента
2. ЗА УСЛОВНУЮ СРЕДНЮЮ МОЖНО ПРИНЯТЬ
1) моду
2) моду, медиану
3) моду, медиану, любую варианту ряда
4) моду, медиану, любую варианту ряда, любое числовое значение
5) моду, медиану, любую варианту ряда, любое числовое значе ние, доверительный коэффициент.
3. ДЛЯ ОПРЕДЕЛЕНИЯ ОШИБКИ СРЕДНЕЙ ВЕЛИЧИНЫ ПРИ БОЛЬШОМ ЧИСЛЕ НАБЛЮДЕНИЙ ИСПОЛЬЗУЕТСЯ:
1) m = 2)
3) m = ± 4)
4. СРЕДНЯЯ АРИФМЕТИЧЕСКАЯ ПО СПОСОБУ МОМЕНТОВ РАВНА:
1) полусумме крайних показателей вариационного ряда
2) любой варианте ряде плюс среднее отклонение от нее всех вариант
3) наименьшей варианте ряда плюс среднее отклонение от нее всех вариант
5. ДЛЯ ВЫЧИСЛЕНИЯ СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ ВЗВЕШЕННОЙ ПРИМЕНЯЕТСЯ ФОРМУЛА:
1) M =
2) M =
3) M = М1 +
4) M = М1 + i
6. ОШИБКА СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ ВЕЛИЧИНЫ ПОКАЗЫВАЕТ
1) в каких пределах могут колебаться полученные средние арифметические величины
2) как отличается максимальный показатель ряда от средней арифметической величины
3) как отличается минимальный показатель ряда от средней арифметической величины
7. ДЛЯ ОЦЕНКИ ДОСТОВЕРНОСТИ РАЗНОСТИ СРАВНИВАЕМЫХ ОТНОСИТЕЛЬНЫХ ВЕЛИЧИН ИСПОЛЬЗУЕТСЯ ФОРМУЛА:
1) 2) t =
3) t =
8. СРЕДНЯЯ ВЕЛИЧИНА-ЭТО:
1) величина, делящаяся вариационный ряд на две равные части
2) варианта, имеющая наибольшее значение
3) средний показатель
4) наиболее часто встречающаяся варианта
5) расчетная величина, дающая обобщающую характеристику изучаемого явления
9. ЦЕЛЬ ВЫЧИСЛЕНИЯ СРЕДНЕКВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ:
1) для оценки отличия условной от средней величины
2) для определения доверительного интервала средней в вариационном ряду
3) для оценки колеблемости средней величины в вариационном ряду
4) для оценки различий между средними, вычисленных разными способами
5) для характеристики дисперсии, или изменчивости признака
10. КАКОЕ ЧИСЛО НАБЛЮДЕНИЙ СООТВЕТСТВУЕТ ТАК НАЗЫВАЕМОЙ МАЛОЙ ВЫБОРКЕ:
1) не более 5
2) меньше 100
3) меньше 30
4) меньше 40
5) меньше 50
11. КАКАЯ ДОЛЯ ВАРИАНТ ПОПАДЕТ В ИНТЕРВАЛ «СРЕДНЯЯ + 2 СИГМЫ»:
1) 95,5%
2) 99,7%
3) 100,0%
4) 68%
5) 90%
12. КАКИЕ ИЗМЕНЕНИЯ СЛЕДУЕТ СДЕЛАТЬ С ЧИСЛОМ НАБЛЮДЕНИЙ В СЛУЧАЕ, ТАК НАЗЫВАЕМОЙ, МАЛОЙ ВЫБОРКИ:
1) разделить на среднюю величину или показатель
2) оставить без изменения
3) вычесть единицу
4) умножить на среднее квадратичное отклонение
5) прибавить единицу
13. ВАРИАЦИОННЫЙ РЯД - ЭТО
1) ряд любых измерений
2) измерения, расположенные в ранговом порядке
3) однородные показатели, изменяющиеся во времени
4) ряд отвлеченных величин
5) ряд элементов статистической совокупности
14. ЦЕЛЬЮ ВЫЧИСЛЕНИЯ СРЕДНЕКВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ ЯВЛЯЕТСЯ
1) оценка отличия условной от средней величины
2) определение доверительного интервала средней в вариационном ряду
3) оценка колеблемости средней величины в вариационном ряду
4) оценка различий между средними, вычисленных разными способами
15. МОДА-ЭТО
1) расчетная величина
2) варианта, чаще других встречающаяся
3) варианта, делящая вариационный ряд на две равные части
4) модальный показатель
5) условная средняя
16. МЕДИАНА - ЭТО
1) наибольшее значение и делящая вариационный ряд на
2) две равные части
3) варианта, делящая вариационный ряд на две равные части
4) условная средняя, делящая вариационный ряд на две равные части
5) модальный показатель
17. ПРОЦЕНТНОЕ ОТНОШЕНИЕ СРЕДНЕГО КВАДРАТИЧЕСКОГО ОТКЛОНЕНИЯ К СРЕДНЕЙ АРИФМЕТИЧЕСКОЙ - ЭТО
1) ошибка репрезентативности
2) условная средняя
3) доверительный коэффициент
4) коэффициент вариации
5) критерий достоверности разности
18. ДОВЕРИТЕЛЬНЫЙ ИНТЕРВАЛ – ЭТО
1) интервал, в пределах которого находятся не менее 68% вариант, близких к средней величине
2) пределы возможных колебаний средней величины (показателя) в генеральной совокупности
3) разница между максимальной и минимальной вариантами вариационного ряда.
Литература
Основная
1.Общественное здоровье и здравоохранение : учебник для студентов под ред.: В. А. Миняева, Н. И. Вишнякова М. – МЕДпресс-информ, 2009. – 655 с.
2.Руководство к практическим занятиям по общественному здоровью и здравоохранению (с применением медицинских информационных систем, компьютерных и телекоммуникационных технологий): учеб. пособие для студентов / И. Н. Денисов, Д. И. Кича, В. И. Чернов. – М. : МИА, 2009. – 464 с.
3.Общественное здоровье и здравоохранение [Электронный ресурс] : учебник для студентов учреждений высш. проф. образования /Ю. П. Лисицын, Г. Э. Улумбекова – М. : ГЭОТАР-МЕДИА, 2011. – 544 с. Режим доступа: http://www.studmedlib.ru/book/ISBN9785970419977.html
Дополнительная
1.Применение методов статистического анализа для изучения общественного здоровья и здравоохранения [Электронный ресурс]: учебное пособие для практ. занятий под ред. В.З. Кучеренко. - М.: ГЭОТАР-Медиа, 2011. - 256 с. – Режим доступа: http://www.studmedlib.ru/book/ISBN9785970419151.html
2.Избранные лекции по общественному здоровью и здравоохранению [Электронный ресурс] : учеб. пособие. - Электрон. текстовые дан. под ред. В. З. Кучеренко М. : Медицина, 2010. – Режим доступа http://www.studmedlib.ru/book/ISBN5225034640.html
Информационный блок
Вариационный ряд – это ряд числовых измерений определенного признака, отличающихся друг от друга по величине, расположенных в определенном порядке. Вариационный ряд состоит из вариант (V) и соответствующих им частот (Р).
Варианта (V) – это каждое числовое значение изучаемого признака. Частота (Р) – это абсолютная численность отдельных вариант в совокупности, указывающая, сколько раз встречается данная варианта в вариационном ряду.
Общее число случаев наблюдений, из которых вариационный ряд состоит, обозначают буквой n.
Вариационный ряд, в котором каждая варианта встречается только один раз (т.е. все Р = 1) называется простым. Если варианты встречаются более одного раза, такой ряд называется взвешенным.
При большом числе наблюдений (более 30) вариационный ряд рекомендуется группировать. Для выбора количества групп в вариационном ряду необходимо учитывать число наблюдений, а также разность между максимальным и минимальным значениями вариант.
Построение из индивидуальных данных вариационного ряда – это только первый шаг к осмысливанию особенностей всей совокупности. Далее необходимо определить средний уровень изучаемого количественного признака. В медицинской статистике широко используются средние величины. Они применяются для характеристики здоровья населения: рождаемости, заболеваемости, инвалидности, смертности, в описании симптомов и течения различных болезней, физического развития отдельных контингентов, при обобщении результатов научных экспериментов. При характеристике организации амбулаторно-поликлинической помощи населению используются такие понятия, как среднее число врачебных посещений на одного жителя в год, средняя численность населения на терапевтическом и педиатрическом участке и т.д. Таким образом, средние величины чрезвычайно широко используются в медицинской статистике.
Средняя - это величина, которая одним числовым значением дает представление обо всей статистической совокупности. Средние величины следует вычислять только на качественно однородном материале. Так, например, при характеристике физического развития новорожденных в исследуемую группу должны быть отобраны младенцы одного пола. Во-вторых, при определении средних величин должно быть достаточное число наблюдений в выборочной совокупности.
Различают несколько видов средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, мода, медиана и др.
Из этих характеристик в медицинской статистике наиболее часто пользуются средними арифметическими величинами. Средние арифметические величины, в свою очередь, в зависимости от метода расчета делятся на:
· среднюю арифметическую простую,
· среднюю арифметическую взвешенную,
· среднюю арифметическую способом моментов,
· среднюю арифметическую в сгруппированном (интервальном) ряду.
Для расчета средней арифметической величины, прежде всего числовые значения (варианты) располагают в возрастающем или, напротив, в убывающем порядке, т.е. составляют вариационный ряд.
Пример 1. Вычисление средней арифметической простой:
Vcм | P |
n=9 |
В простом вариационном ряду средняя арифметическая простая определяется по формуле
cм
Когда отдельные значения вариант начинают повторяться, нужно указать частоту встречаемости (Р) каждой варианты (взвешенный вариационный ряд).
Во взвешенном вариационном ряду среднюю арифметическую можно определить двумя методами: средняя арифметическая «взвешенная» и по способу моментов.
Пример 2. Вычисление средней арифметической «взвешенной».
Vcм | P | V·P |
n=73 | ∑VP |
Средняя арифметическая взвешенная определяется по формуле:
cм
Этот способ определения средней величины является неудобным ввиду необходимости проведения больших расчетов и применяется, в основном, при наличии счетной техники.
Следующий способ (способ моментов) более удобен для расчета.
Пример 3. Вычисление средней арифметической способом моментов:
Vcм | P | а·=(V- М1) | а·Р |
-9 | - 9 | ||
-7 | -28 | ||
-6 | -42 | ||
-4 | -32 | ||
-3 | -30 | ||
125 | |||
n =73 | ∑aP=-71 |
В вариационном ряду выбирается варианта, которая наиболее часто встречается (мода) и её принимают за условную среднюю величину (М1). В нашем примере 125. Находим отклонения всех других вариант от условной средней, затем сумму произведений отклонений всех вариант (∑aP) делим на общее число наблюдений (∑aP момент первой степени).
n
Момент первой степени и является той величиной, которая показывает, насколько условная средняя варианта отличается от фактической или истинной средней. Напишем формулу:
cм
При большом количестве наблюдений число встречающихся размеров вариант может быть очень большим; тогда рекомендуются варианты объединять в группы, причем каждая группа должна иметь равное число значений вариант (иметь равный интервал) 2, 3 .... и т.д.
Пример 4. Вычисление средней арифметической в сгруппированном вариационном ряду.
V1 -V2 (cм) | P | ai | ai·P |
110-112 | -4 | - 4 | |
113-115 | -3 | -15 | |
116-118 | -2 | -22 | |
119-121 | -1 | -12 | |
122-124 | |||
125-127 | |||
128-130 | |||
131-133 | |||
n=73 | ∑aiP=-9 |
Условной средней (M1) в сгруппированном вариационном ряду является середина наиболее часто встречающейся группы (122-124), которая определяется в зависимости от изучаемого признака двумя способами:
1. В непрерывном вариационном ряду, когда числовые значения изучаемого признака могут выражаться дробными числами (рост, вес, масса тела, содержание в крови и мочи их ингредиентов и т.д.) как полусумма первых значений смежных (соседних) групп.
2. В дискретном вариационном ряду, когда признаки выражены целыми числами (частота дыхания, пульс, артериальное давление и т.д.) - как полусумма начала и конца наиболее часто встречающейся группы, взятой за условную среднюю.
Наш вариационный ряд непрерывный (рост восьмилетних мальчиков). Поэтому середина равняется М1 = см
Отклонения (ai) в сгруппированном вариационном ряду определяем как условные, выраженные в интервальных значениях (при определении отклонения пренебрегаем интервалом).
Для расчета интервал (разница между значениями групп) i используем формулу:
i = Vmax - Vmin , где n1 – число групп
n1
В нашем примере интервал i = 3 см:
i = 133 - 110 = 2,8 ≈ 3 (года)
Напишем формулу:
см
Таким образом, мы рассмотрели четыре способа определения средней арифметической величины: среднюю арифметическую в простом вариационном ряду, во взвешенном вариационном ряду - среднюю арифметическую «взвешенную» и по способу моментов и среднюю арифметическую в сгруппированном вариационном ряду.
Кроме средней арифметической величины в медицинской статистике пользуются модой и медианой.
Модой в вариационном ряду называется варианта, которая среди других встречается наиболее часто. Практическое значение моды заключается в том, что, не проводя порой достаточно сложных расчетов, а, ориентируясь на моду, можно знать примерное значение средней величины.
Медианой называется варианта, делящая вариационный ряд пополам. Практическое значение медианы заключается в том, что в симметричном вариационном ряду, котором в обе стороны от середины находится равное число вариант, она по своему значению наиболее близка к средней величине.
Среднее квадратическое отклонение ( ) – степень колеблемости (вариабельности) вариационного ряда, наиболее точно характеризует степень варьирования. Выражается в тех же единицах, что и варианты ряда.
Пример 5.Расчет среднего квадратического отклонения в простом вариационном ряду:
Vcм | P | d=(V-M) | d2 |
-6,9 | 47,6 | ||
-4,9 | 24,0 | ||
-3,9 | 15,2 | ||
-1,9 | 3,6 | ||
-0,9 | 0,8 | ||
2,1 | 4,4 | ||
4,1 | 16,8 | ||
5,1 | 26,0 | ||
7,1 | 50,4 | ||
n=9 |
Последовательность расчета:
1. Находим отклонение (d) каждой варианты от истинной средней (V-M). Для данного вариационного ряда М = 122,9 (пример 1).
2. Отклонение возводим в квадрат (d2).
3. Находим сумму квадратов отклонений (d2).
4. Сумму квадратов отклонений делим на число наблюдений и извлекаем корень квадратный.
Напишем формулу:
При числе наблюдений n < 30 формула следующая:
см
Пример 6. Расчет среднего квадратичного отклонения во взвешенном вариационном ряду (способ среднеарифметический):
Vсм | P | d | d2 | d2P |
-8 | ||||
-6 | ||||
-5 | ||||
-3 | ||||
-2 | ||||
n=73 | ∑d2P=878 |
Последовательность расчета:
1. Находим отклонения вариант от истинной средней М=124,03 (пример 2). Для упрощения расчетов возьмем М =124 см.
2. Отклонения возводим в квадрат (d2).
3. Квадрат отклонений умножаем на частоту (d2P).
4. Находим сумму квадратов отклонений ( ).
5. Сумму квадратов отклонений делим на число наблюдений и извлекаем корень квадратный.
Напишем формулу:
см
Если средняя арифметическая рассчитывалась по способу моментов. То среднее квадратичное отклонение определяется по следующей методике.
Пример 7. Расчет среднего квадратического отклонения во взвешенном вариационном ряду моментов.
Vсм | P | a | aP | a2 | a2P |
-9 | -9 | ||||
-7 | -28 | ||||
-6 | -42 | ||||
-4 | -32 | ||||
-3 | -30 | ||||
125 | |||||
n=73 |
Последовательность расчета:
1 Находим отклонения (а) вариант от условной средней (М1=125).
2.Отклонения умножаем на частоту встречаемости вариант (аP).
3.Находим сумму отклонений (∑aP) и делим на число наблюдений (∑aP)
n
- момент первой степени.
4.Отклонения возводим в квадрат (а2).
5.Квадрат отклонений умножаем на частоту (а2P).
6.Находим сумму квадратов отклонений (∑a2P) и делим на число наблюдений (∑a2P)
n
- момент второй степени.
7.Из момента второй степени вычитаем момент первой степени, возведенный в квадрат, извлекаем корень квадратный.
Напишем формулу и определим сигму:
cм
При определении средней арифметической величины в сгруппированном вариационном ряду отклонения (а) определяются в условных интервальных отклонениях (пример 4.) Формула расчета среднего квадратичного отклонения в этом случае следующая:
, где
i - интервальное отклонение.
В целях экономии времени, затрачиваемого на расчеты, среднее квадратичное отклонение можно найти упрощенным способом:
, где
К- специальный коэффициент, величина которого определяется числом наблюдений по таблице С.И. Ермолаевой.
Значение К для вычисления квадратичного отклонения(δ) по амплитуде
- | - | 1,13 | 1,69 | 2,06 | 2,33 | 2,53 | 2,70 | 2,85 | 2,97 | |
3,08 | 3,17 | 3,26 | 3,34 | 3,41 | 3,47 | 3,53 | 3,59 | 3,64 | 3,69 | |
3,73 | 3,78 | 3,82 | 3,86 | 3,90 | 3,93 | 3,96 | 4,00 | 4,03 | 4,06 | |
4,09 | 4,11 | 4,14 | 4,16 | 4,19 | 4,21 | 4,24 | 4,26 | 4,28 | 4,30 | |
4,32 | 4,34 | 4,36 | 4,38 | 4,40 | 4,42 | 4,43 | 4,45 | 4,47 | 4,48 | |
4,50 | 4,51 | 4,53 | 4,54 | 4,56 | 4,57 | 4,59 | 4,60 | 4,61 | 4,63 | |
4,64 | 4,65 | 4,66 | 4,68 | 4,69 | 4,70 | 4,71 | 4,72 | 4,73 | 4,74 | |
4,75 | 4,77 | 4,78 | 4,79 | 4,80 | 4,81 | 4,82 | 4,83 | 4,83 | 4,84 | |
4,85 | 4,86 | 4,87 | 4,88 | 4,89 | 4,90 | 4,91 | 4,91 | 4,92 | 4,93 | |
4,94 | 4,95 | 4,96 | 4,96 | 4,97 | 4,98 | 4,99 | 4,99 | 5,00 | 5,01 | |
5,02 | 5,49 | 5,76 | 5,94 | 6,07 | 6,18 | 6,28 | 6,35 | 6,42 | 6,48 |
Для нашего примера среднее квадратичное отклонение упрощенным методом: δ =±130-116 =±2,9 см
4,79
Пример 8.
Средний рост восьмилетних мальчиков составил - 125,5 см, среднее квадратическое отклонение δ =±3,4 см , n=73
mм= ±3,4=±0,4 см
√ 73
Пример 9.
Численность детей в возрасте до года по данным детской поликлиники составила 450 ,из них ни разу не болели 100 детей. Необходимо определить "Индекс здоровья" (процент ни разу не болевших детей) и вычислить ошибку для данного показателя.
Индекс здоровья
Пример 10.
М выб .= 125,5 см; m = ± 0,4 см.
При 95% вероятности t =2, при 99,7 % - t = 3 .
М ген.= 125,5 см ± 2 0,4 см = 124,7 - 126,3 см
М ген.= 125,5 см ± 3 0,4 см = 124,3 - 126,7 см.
Таким образом, с вероятностью 95% можно ожидать, что средняя будет находиться в пределах от 124,7 до 126,3 см и с вероятностью 99,7% - в пределах от 124,3 до 126,7 см.
Понятно, что действительное значение средней можно получить только при обследовании всех 8-летних мальчиков, но как это очевидно из полученных данных, подобное исследование нецелесообразно, т.к. средняя арифметическая статистически достоверна (Р > 99,7%), а доверительный интервал для средней в генеральной совокупности является весьма незначительным -t m- = 3 0,4 т.е. всего по 1,2 см от средней выборочной совокупности в большую и меньшую сторону.
Пример 11.
Проведем оценку достоверности различий показателей, характеризующих «индекс здоровья» детей двух районов :
Р1 = 28 % m 1 ± 0,5 % n1=250 Р2=26% m2 = ± 0,4 % n2 =310
t =