Случай 2. выборки зависимы
Проблема.Необходимо определить влияет ли новый препарат на содержание холестерина в плазме крови. С этой целью препарат был испытан на десяти кроликах. В результате получены следующие данные Таблица 33. Экспериментальные данные по холестерину
|
Исследуемый признак количественный, закон распределения для которого неизвестен и его нельзя оценить вследствие малой выборки, а выборки являются зависимыми (попарно связанными). В таком случае можно использовать непараметрический Т-критерий Уилкоксона.
Выдвигаем гипотезы:
Н(0): В генеральной совокупности содержание холестерина в плазме крови после приема препарата не изменяется, или «препарат не влияет на содержание холестерина в плазме крови», или «две выборки извлечены из одной генеральной совокупности»
Н(1): В генеральной совокупности содержание холестерина в плазме крови после приема препарата изменяется (ненаправленная гипотеза)-
Выберем уровень значимости α = 0,05
Т-критерий Уилкоксона вычисляется по следующему алгоритму
· Вычисляются попарные разницы значений «до» и «после» (таблица 34)
Таблица 34. Алгоритм расчета критерия
Концентрация холестерина | ||||||||||
«До», ммоль/л | 6,3 | 6,8 | 5,6 | 4,8 | 7,2 | 6,2 | 8,1 | 7,9 | ||
«После», ммоль/л | 4,8 | 4,6 | 3,3 | 5,6 | 6,3 | 5,1 | 4,7 | 6,3 | 5,5 | 6,2 |
Разница, ммоль/л | 1,5 | 2,4 | 3,5 | -1,5 | 2,1 | 1,5 | -1,3 | 2,6 | 1,7 | |
Ранжир. ряд | -1,3 | -1,4 | 1,5 | -1,5 | 1,5 | 1,7 | 2,4 | 2,6 | 3,5 | |
Ранги | ||||||||||
Т+ | ||||||||||
Т- |
· Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд
· Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг
· Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т-),
Т+ = 3+3+4+5+6+7=28
Т- = 1+2+3=6
· Меньшую из двух таких сумм без учета знака выбирают в качестве критерия:
Твыч = 6
Табличное значение для уровня значимости α = 0,05 и числа пар наблюдений п=10 (двусторонний критерий, Приложение 4):
Ткрит = 9
· Если Твыч > Ткрит то Н(0)
· Если Твыч ≤ Ткрит то Н(1)
В нашем случае вычисленное значение критерия меньше табличного и принимается альтернативная гипотеза.
Вывод: Содержание холестерина в плазме крови после приема препарата изменяется с вероятностью не менее 95%.
Контрольное задание 8:
Исследовалось влияние нервно-эмоциональной нагрузки (тест «реакция на движущийся объект») на частоту пульса у 15 испытуемых. Сформулируйте нулевую и альтернативную гипотезы. Какой критерий можно использовать для проверки этих гипотез, если статистическое распределение ЧП неизвестно. Сделайте выводы по данной задаче, если вычисленное значение критерия равно 2, а α=0,01. Обоснуйте каждый свой ответ.
АНАЛИЗ КАЧЕСТВЕННЫХ ПРИЗНАКОВ. ТАБЛИЦЫ СОПРЯЖЕННОСТИ
Проблема. В ходе наблюдения за беременными, страдающими преэклапсией (эклампсия — это наиболее тяжелая форма токсикоза беременных) было отмечено, что на ранних сроках беременности выраженное ожирение у них регистрировалось чаще, чем в целом в популяции. Возможно, это только впечатление отдельного врача, но поскольку это осложнение беременности слишком грозно, чтобы пренебрегать любыми возможностями предсказать и предотвратить его, все-таки необходимо проверить, является ли выраженное ожирение фактором риска возникновения преэклампсии, и если да, то насколько серьезно (клинически значимо) оно увеличивает этот риск в отношении отдельно взятой пациентки. Для этого необходимо проанализировать частоту встречаемости ожирения, возможно среди женщин с преэклампсией эта патология регистрируется чаще, чем среди тех, кто не имеет этого грозного осложнения беременности. |
Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «вид патологии» или «профессия», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?
В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.
Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки – градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.
Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации). Еще их называют четырехпольными таблицами.
В общем случае Н(0) формулируется следующим образом:
· в генеральных совокупностях доля объектов с интересующими нас признаками одинакова
· или частота встречаемости одного признака не зависит от частоты встречаемости другого признака
· или какой-либо фактор не влияет на частоту встречаемости признака (признаков)