Пример определения достоверности различий ЧСС в группах детей, поступающих в отделения больницы, по критерию Хи-квадрат.

Условие задачи: требуется сравнить частоту сердечных сокращений (ЧСС) детей 1-го года жизни, поступающих в отделения №1 и №2 больницы N (см. раздел III).

Задание: определить достоверность различий частоты пульса детей, поступающих в 1-е и 2-е отделения больницы, по критерию Хи-квадрат и сделать вывод.

Решение: запустите программу Excel, откройте файл в папке своей учебной группы под именем «Статистика–Фамилии студентов». Создайте НОВЫЙ лист, переименуйте его, обозначив названием «Крит_Хи-квадрат». На этом листе создайте сгруппированные вариационные ряды, как показано в таблице 22 или перенесите таблицы сгруппированных вариационных рядов, скопировав их с листа «Крит_Стьюдента» (см. раздел III). Выполните вычисления, как показано ниже, сохраните изменения и покажите результат работы преподавателю.

Таблица 22

Результаты измерения частоты пульса детей в 2-х отделениях больницы

1-й вариационный ряд: Частота пульса детей, поступивших в отделение №1 больницы в 20… году   2-й вариационный ряд: Частота пульса детей, поступивших в отделение №2 больницы в 20… году
  V p     V p
 
 
 
 
 
 
 
 

Выполнение расчета (таблица 23):

1. Создаем таблицу частот и вычисляем опытные (эмпирические) и теоретические частоты.
Эмпирические частоты - это количество единиц наблюдения по баллам, вычисляем из вариационных рядов ручным подсчетом или функцией =СЧЁТЕСЛИ(Диапазон ячеек;Значение).
Теоретические частоты вычисляем из таблицы эмпирических частот как среднее значение в каждом отделении, например: 0,48=1*16/33, 0,52=1*17/33 и т.д. Итоги теоретических частот должны совпасть с итогами частот в эксперименте.

Таблица 23

Вычисление теоретических частот и критерия Хи-квадрат

  ЧСС Эмпирические частоты баллов (Э) Теоретические частоты (Вcего*Итого/n) (Т) Расчет χ2 = (Э - Т)² / Т
1-е отд-е 2-е отд-е Всего 1-е отд-е 2-е отд-е Всего 1-е отд-е 2-е отд-е Всего
0,48 0,52 0,55 0,52 1,06
2,91 3,09 0,00 0,00 0,01
3,39 3,61 0,76 0,72 1,48
4,85 5,15 0,15 0,14 0,29
2,42 2,58 0,07 0,07 0,14
0,97 1,03 0,00 0,00 0,00
0,48 0,52 0,48 0,46 0,94
0,48 0,52 0,48 0,46 0,94
  Итого: n=33 2,50 2,36 4,86
2. Вычисляем опытное (эмпирическое) значение критерия Хи-квадрат.  
В ячейках каждого отделения и балла используется формула: (Э - Т)² / Т, а затем суммируется строка «Итого» или столбец «Всего». Общая формула вычислений имеет вид:
      = 4,86      
               
3. Вычисляем критическое значение критерия Хи-квадрат или вероятность различий.
Уровень значимости = 0,05  
Степени свободы (df) = (R - 1) * (C - 1), где R – количество групп в таблице, C – количество столбцов опытных данных.
Число столбцов =    
Число строк =    
df= (2 - 1) * (8- 1)=    
Критическое значение определяется по таблице или вычисляется функцией =ХИ2ОБР(0,05;7)
Критическое значение Хи-квадрат = 14,06714 при p = 0,05
или:              
Расчетная значимость вычисляется функцией =ХИ2ТЕСТ(Опытный интервал; Теоретический интервал). Такой расчет позволяет сократить вычисления, используя диапазоны данных из таблицы частот, и возвращает в ячейку непосредственно опытный уровень значимости.
Расчетная значимость по ХИ2ТЕСТ = 0,677 > 0,05  
                         
4. Сравниваем опытное значение с критическим значением критерия Хи-квадрат или критическим уровнем значимости, формулируем вывод.
4,86 < 14,07 опытное значение (4,86) МЕНЬШЕ критического значения (14,07)
или:            
0,677 > 0,05 опытный уровень значимости (0,677) больше критического (0,05)
   
Вывод: различия частоты пульса в 2-х отделениях НЕдостоверны при уровне значимости p<0,05.  
               

Вывод, сделанный на основе вычисления критерия Хи‑квадрат, в основном согласуется с выводом, сделанным по критерию Стьюдента. Однако вероятности того, что выборки взяты из одной генеральной совокупности, существенно отличаются. При использовании критерия Стьюдента эта вероятность составила 12% (0,12), а по критерию Хи-квадрат 67,7% (0,667). Значит, довод о равенстве совокупностей, полученный с применением критерия Хи-квадрат, более весомый.

ЗАДАНИЯ

Запустите программу Excel, откройте файл в папке своей учебной группы под именем «Статистика–Фамилии студентов», создайте НОВЫЙ лист, переименуйте его, обозначив названием «Крит-й_Хи-квадрат», решите требуемый вариант задания, сохраните, запретите изменения в файле паролем и покажите решение преподавателю.

Вариант 1

В районе N, где расположена тепловая электростанция, в одной из точек жилого поселка было взято 50 проб атмосферного воздуха. Уровень пыли составил: 0,14 мг/м3 в 15-и пробах, 0,16 мг/м3 в 8-и пробах, 0,13 мг/м3 в 2-х пробах, 0,2 мг/м3 в 15-и пробах, 0,18 мг/м3 в 6-и пробах, 0,17 мг/м3 в 4-х пробах.

После установки золоуловителя количество пыли в пробах воздуха измерялось следующими цифрами: 0,09 мг/м3 в 2-х пробах, 0,08 мг/м3 в 2-х пробах, 0,05 мг/м3 в 16-и пробах, 0,02 мг/м3 в 20-и пробах, 0,14 г/м3 в 2-х пробах.

Определите, достоверно ли уменьшение запыленности после установки золоуловителя по критерию Хи-квадрат с уровнем значимости p<0,05?

Вариант 2

В питьевой воде, которой снабжаются дома жителей города N, определяли концентрацию соединений фтора, в 2-х пробах было обнаружено 0,5 мг/л этих соединений, в 4-х пробах – 0,6 мг/л, в 8-и пробах – 0,9 мг/л, в 8-и пробах – 0,4 мг/л, в 16-и пробах – 0,8 мг/л, в 16-и пробах – 0,9 мг/л, в 20-и пробах – 1,2 мг/л, в 24-х пробах – 1,1 мг/л, в 40 пробах – 1,3 мг/л, в 50-и пробах – 1,0 мг/л, в 24-х пробах – 1,5 мг/л, в 20-и пробах – 1,6 мг/л, в 10-и пробах – 0,7 мг/л, в 8-и пробах – 1,4 мг/л, в 4-х пробах – 0,3 мг/л.

Одновременно в городе M были получены следующие результаты: в 20-и пробах было обнаружено 0,1 мг/л соединений фтора, в 15-и пробах – 0,09 мг/л, в 8-и пробах – 0,2 мг/л, в 8-и пробах – 0,05 мг/л, в 16-и пробах – 0,08 мг/л, в 10-и пробах – 0,15 мг/л, в 30-и пробах – 0,1 мг/л, в 12-и пробах – 1,1 мг/л, в 14-и пробах – 1,3 мг/л, в 5-ти пробах – 1,0 мг/л, в 4-х пробах – 1,5 мг/л, в 2-х пробах – 1,6 мг/л, в 1-й пробе – 0,7 мг/л, в 8-и пробах – 0,4 мг/л, в 4-х пробах – 0,3 мг/л.

Определите среднюю концентрацию фторидов в питьевой воде городов N и М. Установите, достоверно ли отличается уровни фтора в питьевой воде этих городов по критерию Хи-квадрат с уровнем значимости p<0,05?

Вариант 3

При обследовании группы школьников 4-х классов сельского района А было установлено, что 8 человек имели по 5 кариозных зубов, 20 человек – по 1 зубу, 10 человек – по 4 зуба, 1 человек – 8 зубов, 20 человек – по 3 зуба, 16 человек – по 2 зуба и 15 человек не имели пораженных кариесом зубов.

При обследовании аналогичной группы школьников в районе Б были получены следующие результаты: 2 человека имели по 5 кариозных зубов, 28 человек – 1 зуб, 8 человек – по 4 зуба, 1 человек – 8 зубов, 20 человек – по 3 зуба, 16 человек – по 2 зуба и 6 школьников не имели пораженных кариесом зубов.

Сравните среднюю интенсивность поражения кариесом в районах А и Б, установите, достоверно ли отличаются районы по этому признаку на основе критерия Хи-квадрат с уровнем значимости p< 0,05.

Вариант 4

Перед сдачей экзамена у студентов определялась частота пульса (ЧСС). Были получены следующие данные: у 2-х студентов – 76 ударов в минуту, у 3-х студентов – 80 ударов в минуту, у 4‑х студентов – 108 ударов в минуту, у 2-х студентов – 116 ударов в минуту, у 20-и студентов – 88 ударов в минуту, у 6-и студентов – 98 ударов в минуту, у 17-и студентов – 86 ударов в минуту, у 11-и студентов – 92 ударов в минуту.

У этих же студентов была измерена частота пульса после экзамена и получены следующие результаты: у 2-х студентов – 73 удара в минуту, у 3-х студентов – 75, у 4-х студентов – 80, у 2-х – студентов 81, у 20‑и студентов – 74, у 6-и студентов – 82, у 17-и студентов – 86, у 11-и студентов – 85.

Сравните средние величины ЧСС студентов до и после экзамена и подтвердите достоверность различий этого признака по критерию Хи-квадрат с уровнем значимости p < 0,05.

Вариант 5

Исследовалась длительность лечения больных пневмонией в стационаре 2-х больниц города N. Были получены следующие результаты: в 1-й больнице 25 дней лечилось 10 больных, 26 дней – 8 больных, 11 дней – 1 больной, 12 дней – 1 больной, 23 дня – 5 больных, 13 дней – 1 больной, 21 день – 15 больных, 24 дня – 9 больных, 22 дня – 7 больных, 14 дней – 2 больных, 20 дней – 5 больных, 15 дней – 2 больных, 16 дней – 3 больных, 17 дней – 4 больных, 19 дней – 2 больных, 18 дней – 3 больных.

Во 2-й больнице 25 дней лечился 1 больной, 21 день – 2 больных, 11 дней – 26 больных, 12 дней – 18 больных, 23 дня – 3 больных, 13 дней – 10 больных, 21 день – 3 больных, 24 дня – 1 больной, 22 дня – 3 больных, 14 дней – 6 больных, 20 дней – 5 больных, 15 дней – 7 больных, 16 дней – 5 больных, 17 дней – 4 больных, 19 дней – 1 больной, 18 дней – 1 больной.

Рассчитайте среднюю длительность лечения пневмонии и определите достоверность различий этого показателя в 2-х больницах с помощью критерия Хи‑квадрат с уровнем значимости p < 0,05.

Вариант 6

Изучалась длина тела новорожденных по данным родильного дома. Были получены следующие данные о новорожденных девочках: у 8 девочек рост составил 48 см, у 6 девочек – 51 см, у 7 девочек – 53 см, у 1 девочки – 49 см, у 9 девочек – 52см, у 8 девочек – 50 см, у 3 девочек – 47 см, у 2 девочек – 46 см, у 2 девочек – 54 см, у 1 девочки – 55 см, у 1 девочки – 56 см.

Данные о новорожденных мальчиках: 9 мальчиков родились с длиной тела 56 см, 6 мальчиков – 55 см, 7 мальчиков – 58 см, 1 мальчик – 59 см, 9 мальчиков – 52 см, 8 мальчиков – 54 см, 2 мальчика – 50 см, 1 мальчик – 49 см, 2 мальчика – 53 см, 4 мальчика – 54 см, 2 мальчика – 51 см, 2 мальчика – 53 см.

Определите среднюю длину тела новорожденных девочек и мальчиков, установите, достоверно ли отличается этот признак у новорожденных женского и мужского пола, подтвердите различия по критерию Хи‑квадрат с уровнем значимости p < 0,05.

VII. Метод стандартизации

Основным принципом подбора групп статистического наблюдения в случае необходимости сравнения между ними является однородность сравниваемых совокупностей по характеризующим признакам.

К характеризующим признакам относятся признаки, по которым выполняется группировка совокупностей. Они, как правило, оказывают влияние на результативные признаки и изучаемое явление в целом. Подбор групп с одинаковым уровнем характеризующих признаков позволяет исключить такое влияние и акцентировать внимание на изучаемых особенностях явления.

Например, общие интенсивные коэффициенты (рождаемости, смертности, младенческой смертности, заболеваемости и т.д.) правильно отражают частоту явлений при их сопоставлении лишь в том случае, если состав сравниваемых совокупностей однороден. Если же они имеют различный возрастно-половой или профессиональный состав, разное соотношение по нозологическим формам или другим характеризующим признакам, то, ориентируясь на общие показатели, сопоставляя их, можно сделать неправильный вывод об истинных причинах разницы показателей сравниваемых совокупностей.

Если же не удается провести формирование однородных выборок, или уже после проведения исследования оказывается, что сравниваемые группы не одинаковы по характеризующим признакам, может использоваться метод стандартизации.

Это метод расчета условных (стандартизованных) показателей, заменяющих общие интенсивные (или средние) величины в тех случаях, когда их сравнение затруднено из-за несопоставимости групп. Он позволяет определить, какие показатели были бы получены в случае однородности групп, т.е. устранить (элиминировать) возможное влияние различий в составе совокупностей по какому-либо признаку на величину сравниваемых интенсивных показателей. Следовательно, метод стандартизации применяется тогда, когда имеющиеся различия в составе сравниваемых совокупностей могут повлиять на размеры общих коэффициентов.

Стандартизованные показатели – это условные, гипотетические величины, они не отражают истинных размеров явлений, но свидетельствуют о том, каковы были бы значения сравниваемых интенсивных показателей, если бы были исключены различия в составах совокупностей.

Для того, чтобы устранить влияние неоднородности составов сравниваемых совокупностей на величину получаемых коэффициентов, их приводят к единому стандарту, то есть условно допускается, что состав совокупностей одинаков. В качестве стандарта можно принять величину среды одной или всех сравниваемых групп, уровень явления в этих группах или какой-либо близкой по существу третьей совокупности. От выбора стандарта зависит способ вычисления, т.е. модификация метода. Принято выделять прямой, обратный и косвенный варианты соответственно. Варианты используемого метода стандартизации не влияют на конечный вывод и определяются исследователем.

Методика выполнения расчетов прямого метода стандартизации состоит из 5 этапов:

- Первый этап. Вычисление общих показателей (относительных или средних величин) отдельно для каждой группы.

- Второй этап. Выбор стандарта осуществляется произвольно.

- Третий этап. Вычисление ожидаемых величин, демонстрирующих уровень явления, который мог бы быть зафиксирован при отсутствии неоднородности в группах.

- Четвертый этап. Определение стандартизованных показателей.

- Пятый этап. Сравнение групп по стандартизованным показателям и формулирование вывода.

Наши рекомендации