Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок.
Рассмотрим этот критерий на примере. Допустим, получены следующие данные о величине ЧСС в двух группах детей 2-3 и 4-5 лет:
x(2-3 года): 102, 87, 105, 110, 99, 90 (nx=6)
y(4-5 лет): 98, 100, 88, 92, 83, 95, 100, 92, 85, 94 (ny=10)
Сначала выборки смешивают и ранжируют как одну совокупность:
№ | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
x | 83 | 85 | 87 | 88 | 90 | 92 | 92 | 94 | 95 | 98 | 99 | 100 | 100 | 102 | 105 | 110 |
R | 1 | 2 | 3 | 4 | 5 | 6.5 | 6.5 | 8 | 9 | 10 | 11 | 12.5 | 12.5 | 14 | 15 | 16 |
Полученные ранги приписывают числам исходных рядов и подсчитывают их суммы:
x(2-3 года) | 102 | 87 | 105 | 110 | 99 | 90 | |||||
Rx | 14 | 3 | 15 | 16 | 11 | 5 | |||||
y(4-5 лет) | 98 | 100 | 88 | 92 | 83 | 95 | 100 | 92 | 85 | 94 | |
Ry | 10 | 12.5 | 4 | 6.5 | 1 | 9 | 12.5 | 6.5 | 2 | 8 |
Далее полученные суммы включают в специальную формулу для подсчета критерия U:
В нашем примере получаем , .
В качестве берут меньшее из полученных значений (т.е. 17) и сравнивают его с критическими значениями, взятыми из специальной таблицы: для и для . Поскольку , нулевую гипотезу отвергнуть нельзя даже для и различие уровней ЧСС следует признать статистически незначимым.
Чтобы говорить о статистически значимых различиях, должно выполняться условие .
Критерий парных сравненийВилкоксона– ранговый критерий для сравнения зависимых выборок.
Рассмотрим его на примере.У 10 здоровых взрослых людей измеряли кровяное давление после введения кофеина и плацебо. Получены следующие данные для «верхнего», систолического давления СД:
x(кофеин) | ||||||||||
y(плацебо) |
Возникает вопрос, можно ли на основании этих данных полагать, что кофеин оказывает физиологическое действие.
Вначале значения одного ряда строго попарно вычитают из значений другого с учетом знака разницы d. Вычтем нижний ряд из верхнего:
x(кофеин) | ||||||||||
y(плацебо) | ||||||||||
d | -4 | -10 |
Далее разницы ранжируют по известным правилам, но при этом не учитывают знак разницы (т.е. ранжируют по модулю).Нулевую пару отбрасывают.
d | -4 | -10 | |||||||
R | 1.5 | 1.5 | 7.5 | 7.5 |
Отдельно суммируют ранги для положительных и отрицательных разниц. В нашем случае получаем: , . В качестве значения критерия Tz берут меньшую сумму независимо от знака, т.е. Tz =11,5. Сравниваем это значение с «критическим» из специальной таблицы, входом в которую является число сравниваемых пар, но лишь тех, которые не дают нулевые разницы. В нашем случае таковых 9. Тогда Tкр = 6 для и Tкр =2 для . Поскольку даже для первого уровня значимости, различий уровней СД нулевую гипотезу отвергнуть нельзя и различия не являются статистически значимыми (р<0,05). Иными словами, у нас нет пока оснований утверждать, что действие кофеина носит исключительно физиологический характер.
Смысл теста состоит в следующем. Если бы мы имели бесконечно большой ряд случайных разниц, то число и величина положительных разниц равнялись бы числу отрицательных и, соответственно, суммы их рангов были бы равны. На конечном и ограниченном числовом массиве опять же чисто случайно может иметь место «перекос» в сторону преимущественно положительных или отрицательных разниц. Это обстоятельство и учитывается в критических значениях критерия.
Tкр– это граница между практически возможными и практически невозможными значениями критерия. Соответственно, если , то полученная нами сумма рангов с достаточно высокой вероятностью могла возникнуть чисто случайно и о сдвиге одного числового ряда относительно другого ничего определенного сказать нельзя. Это недостоверное различие. Если же , то наблюдаемое различие положительных и отрицательных разниц не могло быть получено случайным образом. Это означает, что смещение значений в сопоставляемых числовых рядах объясняется действием какой-то систематически действующей, неслучайной причины, т.е. носит статистически достоверный (устойчивый и прогнозируемый) характер.
Как было показано выше, пары, имеющие одинаковые числовые значения и, соответственно, дающие нулевые разницы, исключаются из рассмотрения. И если таких случаев много, то «жесткость» критерия нарастает, поскольку Tкртем меньше, чем меньше сравниваемых пар. Соответственно, увеличивается число ситуаций, когда нулевую гипотезу отвергнуть невозможно, и различие будет считаться незначимым. Более того, если число пар окажется меньше 6, то критерий Вилкоксона вообще перестанет «работать»: 6 - минимальное число пар, для которого еще существует Tкр. Для меньшего числа его просто невозможно рассчитать. А подобные ситуации в медико-биологической практике возникают довольно часто, поскольку многие измерения неизбежно приходится выполнять с достаточно высокой степенью грубости, и вероятность появления совпадающих значений здесь все еще весьма высока.
Критерий согласия Пирсона (критерий )
Критерии согласияпозволяют определить степень соответствия эмпирических и теоретических распределений вероятностей, а также двух эмпирических распределений, полученных, например, в «контроле» и «опыте» или в различных вариантах «опыта» или «наблюдения». Этот критерий позволяет проверить гипотезу о схожести фактического,полученного на практике, распределения вероятностей случайной величины и теоретического.
Данный критерий может использоваться, например, для сравнения частот встречаемости качественных или порядковых признаков в выборочных совокупностях.
Критерий Пирсона записывается следующим образом:
где k – число классов ряда распределения, – фактические (наблюдаемые) частоты встречаемости случайной величины в каждом i-ом классе (в виде целых чисел), – теоретически ожидаемые (вычисленные) частоты для данного класса, – разница между ними.
Таким образом, представляет собой вовсе не квадрат какого-то числа, а суммупо всем классам распределения данной случайной величины (от 1-го до k-го) величины квадратов разницы фактических и теоретических частот в каждом классе, отнесенных к теоретическим частотам для этих же классов.
Допустим, что по каждому классу распределения , т.е. фактические (наблюдаемые) и ожидаемые (вычисленные) частоты идеально совпадают. Тогда и, соответственно, . Понятно, что такого рода ситуация может иметь место только в том случае, когдаформа эмпирического распределения абсолютно идентична форме теоретической модели, рассчитанной по эмпирическим данным.
Допустим теперь, что хотя бы для одного из сравниваемых классов эмпирического и теоретического распределений, то есть для какого-то одного из них . Поскольку мы имеем дело с «суммой квадратов», то автоматически станет больше нуля. Чем больше будет таких различий для разных классов и чем значительнее будут сами различия, тем больше будет «набегать» сумма квадратов. Следовательно, при различии наблюдаемых и ожидаемых частот сравниваемых распределений может принимать любые положительные значения, вплоть до бесконечности.Нетрудно представить, что чем менее схожейбудет форма сравниваемых распределений, тем большие числовые значения будет принимать и, само собой, наоборот. Иными словами, является мерой сходства/различия формы сравниваемых распределений вероятностей.
Технология использования критерия «Хи-квадрат» чрезвычайно проста. По приведенной выше формуле подсчитывается «экспериментальное» значение «Хи-квадрат» , которое сравнивают с табличным или «критическим» значением , взятым сообразно наличному числу степеней свободы). Далее, как всегда, проверяется выполнение двух неравенств:
- если , то разница наблюдаемых (фактических) и ожидаемых (теоретических) частот сравниваемых распределений незначительна и не выходит за рамки ее собственных случайных колебаний, не превышает критического порога «возможного». Это не позволяет отвергнуть «нулевую гипотезу», согласно которой имеющие место различия частот носят случайный характер;
- если , то разница наблюдаемых (фактических) и ожидаемых (теоретических) частот сравниваемых распределений столь велика, что выходит за рамки ее собственных случайных колебаний. Самопроизвольное появление такого значения «Хи-квадрат» относится к разряду невозможных событий. Следовательно, различие форм эмпирического и теоретического распределений обусловлено действием некого систематически действующего фактора, и эмпирическое распределение на принятом уровне значимости не может рассматриваться в качестве случайной модификации теоретической модели.
Однако, при использовании критерия Пирсона существуют следующие ограничения:
· во-первых, объем выборочной совокупности должен быть не менее 50;
· во-вторых, допускается сравнение только абсолютных, а не относительных частот, т.е. количества значений случайной величины, попадающей в каждый класс распределения «в штуках»
· в-третьих, если в теоретическом (вычисленном) распределении встречается класс, в котором число значений менее пяти, то его еще до начала вычисления критерия объединяют с соседним, складывая их частоты. При этом такое же сокращение числа классов, независимо от фактического количества частот в них, производят и в эмпирическом распределении.
Отметим, что в современных программных пакетах математико-статистической обработки данных SPSS и Statistica все операции, необходимые для расчета статистических критериев автоматизированы. Главной задачей пользователя является правильный выбор статистического критерия в каждом конкретном случае. Программа выдает полный отчет о результатах расчетов с указанием уровня значимости нулевой гипотезы. Подробное использование этих статистических программ изложено в электронных и печатных руководствах пользователя.
1. Вопросыпотемезанятия:
1. Понятие нулевой гипотезы.
2. Понятие альтернативной гипотезы.
3. Параметрические методы и условия их применимости.
4. Непараметрические методы и условия их применимости.
5. Понятие зависимых выборок.
6. Понятие независимых выборок.
7. Критерий Стьюдента.
8. Критерий Фишера.
9. Критерий Манна-Уитни.
10. Критерий Вилкоксона.
11. Критерии, используемые для проверки нормальности распределения.
2. Тестовые задания по теме с эталонами ответов:
1. ВЫБОР ПОДХОДЯЩЕГО МЕТОДА СРАВНЕНИЯ ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ ОПРЕДЕЛЯЕТСЯ
1) различиями в характеристиках сравниваемых рядов
2) длинами выборок и максимальным разбросом вариант
3) числом сопоставляемых групп, зависимостью или независимостью выборок, видом распределения признака
4) средними значениями и дисперсиями
2. НЕЗАВИСИМЫМИ ВЫБОРКАМИ ЯВЛЯЮТСЯ
1) выборки, полученные при рандомизации
2) совокупность мужей и совокупность жен
3) одни и те же объекты в разные моменты времени
4) пары близнецов
3. ЗАВИСИМЫМИ ВЫБОРКАМИ ЯВЛЯЮТСЯ
1) совокупность мужчин и совокупность женщин
2) одни и те же объекты в разные моменты времени
3) больные сахарным диабетом и больные гриппом
4) выборки, полученные при рандомизации
4. ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ОСНОВАНЫ НА
1) оценке параметров распределения
2) типе распределения
3) выдвигаемых гипотезах
4) требуемой точности
5. ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ПРИМЕНИМЫ, ЕСЛИ
1) распределение ассиметрично
2) требуются достаточно грубые оценки
3) варианты выборок различны
4) численные данные подчиняются нормальному распределению
6. ПРИ АНАЛИЗЕ ДАННЫХ ВЫДВИГАЮТСЯ СЛЕДУЮЩИЕ ГИПОТЕЗЫ
1) нулевая и гипотеза однородности
2) нулевая и альтернативная гипотезы
3) нулевая гипотеза и гипотеза равенства средних
4) гипотеза однородности и гипотеза отсутствия ошибок репрезентативности
7. ЕСЛИ ВЕРОЯТНОСТЬ НУЛЕВОЙ ГИПОТЕЗЫ ОКАЖЕТСЯ ВЫШЕ НЕКОТОРОГО НАПЕРЕД ЗАДАННОГО УРОВНЯ ЗНАЧИМОСТИ α, ТО
1) нулевая гипотеза может быть отвергнута
2) альтернативная гипотеза может быть принята
3) нулевая гипотеза не можетбыть отвергнута
4) уровень значимости нулевой гипотезы возрастает
8. К ПАРАМЕТРИЧЕСКИМ КРИТЕРИЯМ ОТНОСЯТСЯ
1) критерий Стьюдента и критерий Вилкоксона
2) критерий Вилкоксона и критерий Манна-Уитни
3) критерий Фишера и критерий Манна-Уитни
4) критерий Стьюдента и критерий Фишера
9. КРИТЕРИЙ СТЬЮДЕНТА ОСНОВАН НА СРАВНЕНИИ
1) частот изучаемого признака в вариационном ряду
2) средних значений выборок
3) числа наблюдений выборок
4) выборочных дисперсий
10. КРИТЕРИЙ ФИШЕРА ОСНОВАН НА СРАВНЕНИИ
1) частот изучаемого признака в вариационном ряду
2) средних значений выборок
3) числа наблюдений выборок
4) выборочных дисперсий
11. КРИТЕРИЙ СТЬЮДЕНТА ОБОЗНАЧАЕТСЯ СИМВОЛОМ
1) t
2) U
3) Z
4) F
12. ПОЛУЧЕННОЕ ЗНАЧЕНИЕ КРИТЕРИЯ СТЬЮДЕНТА СРАВНИВАЮТ
1) с рассчитанным по формуле значением критерия Стьюдента
2) с табличным значением критерия Стьюдента
3) со стандартной ошибкой
4) с выборочным средним
13. ЕСЛИ ПОЛУЧЕННОЕ ЗНАЧЕНИЕ t-КРИТЕРИЯ ПРЕВЫШАЕТ ТАБЛИЧНОЕ ДЛЯ ВЫБРАННОГО УРОВНЯ ЗНАЧИМОСТИ , ЭТО ОЗНАЧАЕТ ЧТО
1) различие выборочных средних статистически значимо с вероятностью 95%
2) различие выборочных средних статистически значимо с вероятностью 5%
3) различие выборочных средних статистически незначимо
4) различие выборочных средних статистически значимо с вероятностью 0.05
14. ЯВЛЯЕТСЯ ЛИ ПОЛУЧЕННОЕ РАСПРЕДЕЛЕНИЕ НОРМАЛЬНЫМ, МОЖНО ОПРЕДЕЛИТЬ С ПОМОЩЬЮ
1) критерия Манна-Уитни
2) t-критерия
3) критерия Шапиро-Уилка
4) критерия Вилкоксона
15. ДЛЯ КОРРЕКТНОГО ИСПОЛЬЗОВАНИЯ КРИТЕРИЯ ПИРСОНА ОБЪЕМ ВЫБОРОЧНОЙ СОВОКУПНОСТИ ДОЛЖЕН БЫТЬ
1) не менее10
2) не менее 30
3) не менее 50
4) не менее 150
16. НА МАЛЫХ ВЫБОРКАХ РАБОТАЮТ
1) параметрические критерии
2) непараметрические критерии
3) критерии согласия
4) параметрические и непараметрические критерии
17. СТЕПЕНЬ СООТВЕТСТВИЯ ЭМПИРИЧЕСКИХ И ТЕОРЕТИЧЕСКИХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ, А ТАКЖЕ ДВУХ ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ, ПОЗВОЛЯЮТ ОПРЕДЕЛИТЬ
1) непараметрические критерии
2) параметрические и непараметрические критерии
3) параметрические критерии
4) критерии согласия
18. К НЕПАРАМЕТРИЧЕСКИМ КРИТЕРИЯМ ОТНОСЯТСЯ
1) критерий Стьюдента и критерий Вилкоксона
2) критерий Вилкоксона и критерий Манна-Уитни
3) критерий Фишера и критерий Манна-Уитни
4) критерий Стьюдента и критерий Фишера
19. КРИТЕРИЙ МАННА-УИТНИ ЭТО
1) ранговый критерий для сравнения независимых выборок
2) ранговый критерий для сравнения зависимых выборок
3) параметрический критерий для сравнения независимых выборок
4) параметрический критерий для сравнения зависимых выборок
20. КРИТЕРИЙ ВИЛКОКСОНА ЭТО
1) ранговый критерий для сравнения независимых выборок
2) ранговый критерий для сравнения зависимых выборок
3) параметрический критерий для сравнения независимых выборок
4) параметрический критерий для сравнения зависимых выборок
21. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ МОГУТ БЫТЬ ПРИМЕНЕНЫ
1) для данных, имеющих произвольное распределение
2) только для данных, имеющих нормальное распределение
3) только для данных, имеющих распределение Пирсона
4) только для параметров распределения
22. КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА ОБОЗНАЧАЕТСЯ СИМВОЛОМ
1) U
2) t
3)
4) Z
23. СУММАРНАЯ ВЕРОЯТНОСТЬ НУЛЕВОЙ И АЛЬТЕРНАТИВНОЙ ГИПОТЕЗ РАВНА
1) 0
2) 1
3) 5
4) 100
24. МЕРОЙ СХОДСТВА/РАЗЛИЧИЯ ФОРМЫ СРАВНИВАЕМЫХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ ЯВЛЯЕТСЯ КРИТЕРИЙ
1) Стьюдента
2) Вилкоксона
3) Пирсона
4) Манна-Уитни
25. К РАНГОВЫМ КРИТЕРИЯМ ОТНОСИТСЯ
1) критерий Манна-Уитни
2) критерий Стьюдента
3) критерий Фишера
4) критерий Пирсона
26. ДОПУЩЕНИЕ ОБ ОТСУТСТВИИ ТОГО ИЛИ ИНОГО ИНТЕРЕСУЮЩЕГО ИССЛЕДОВАТЕЛЯ СОБЫТИЯ, ЯВЛЕНИЯ ИЛИ ЭФФЕКТА – ЭТО
1) альтернативная гипотеза
2) нулевая гипотеза
3) дизайн исследования
4) погрешность
27. ПОД АЛЬТЕРНАТИВНОЙ ГИПОТЕЗОЙ ПОДРАЗУМЕВАЕТСЯ
1) наличие того или иного события, явления или эффекта
2) отсутствие события, явление или эффекта
3) возможность возникновения события
4) погрешность
28. ЕСЛИ ВЕРОЯТНОСТЬ НУЛЕВОЙ ГИПОТЕЗЫ УВЕЛИЧИВАЕТСЯ, ТО ВЕРОЯТНОСТЬ АЛЬТЕРНАТИВНОЙ ГИПОТЕЗЫ
1) не изменяется
2) увеличивается
3) равна 1
4) снижается
29. В СЛУЧАЕ, ЕСЛИ МАКСИМАЛЬНОЕ ЗНАЧЕНИЕ ОДНОГО ИЗ СРАВНИВАЕМЫХ ВЫБОРОЧНЫХ ВАРИАЦИОННЫХ РЯДОВ ЗАВЕДОМО МЕНЬШЕ МИНИМАЛЬНОГО ЗНАЧЕНИЯ ДРУГОГО ВАРИАЦИОННОГО РЯДА, ТО
1) необходим расчет критерия Стьюдента
2) расчетов с применением критерия Стьюдента не требуется
3) необходим расчет критерия Манна-Уитни
4) необходим расчет критерия Вилкоксона
30. ЕСЛИ НАБОР ОБЪЕКТОВ ИССЛЕДОВАНИЯ В КАЖДУЮ ИЗ ГРУПП ОСУЩЕСТВЛЯЛСЯ НЕЗАВИСИМО ОТ ТОГО, КАКИЕ ОБЪЕКТЫ ИССЛЕДОВАНИЯ ВКЛЮЧЕНЫ В ДРУГУЮ ГРУППУ, ТАКИЕ ВЫБОРКИ НАЗЫВАЮТСЯ
1) зависимыми
2) независимыми
3) случайные
4) возможные
Эталоны ответов на тестовые задания:
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ | ||||||||||
вопрос | ||||||||||
ответ |
Занятие №6