Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок.

Рассмотрим этот критерий на примере. Допустим, получены следующие данные о величине ЧСС в двух группах детей 2-3 и 4-5 лет:

x(2-3 года): 102, 87, 105, 110, 99, 90 (n_x=6)

y(4-5 лет): 98, 100, 88, 92, 83, 95, 100, 92, 85, 94 (n_y=10)

Сначала выборки смешивают и ранжируют как одну совокупность:

№	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16
x	83	85	87	88	90	92	92	94	95	98	99	100	100	102	105	110
R	1	2	3	4	5	6.5	6.5	8	9	10	11	12.5	12.5	14	15	16

Полученные ранги приписывают числам исходных рядов и подсчитывают их суммы:

x(2-3 года)	102	87	105	110	99	90
R_x	14	3	15	16	11	5
y(4-5 лет)	98	100	88	92	83	95	100	92	85	94
R_y	10	12.5	4	6.5	1	9	12.5	6.5	2	8

Далее полученные суммы включают в специальную формулу для подсчета критерия U:

Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru

В нашем примере получаем Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , .

В качестве Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru берут меньшее из полученных значений (т.е. 17) и сравнивают его с критическими значениями, взятыми из специальной таблицы: Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru для и для . Поскольку , нулевую гипотезу отвергнуть нельзя даже для и различие уровней ЧСС следует признать статистически незначимым.

Чтобы говорить о статистически значимых различиях, должно выполняться условие Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru .

Критерий парных сравненийВилкоксона– ранговый критерий для сравнения зависимых выборок.

Рассмотрим его на примере.У 10 здоровых взрослых людей измеряли кровяное давление после введения кофеина и плацебо. Получены следующие данные для «верхнего», систолического давления СД:

x(кофеин)
y(плацебо)

Возникает вопрос, можно ли на основании этих данных полагать, что кофеин оказывает физиологическое действие.

Вначале значения одного ряда строго попарно вычитают из значений другого с учетом знака разницы d. Вычтем нижний ряд из верхнего:

x(кофеин)
y(плацебо)
d	-4	-10

Далее разницы ранжируют по известным правилам, но при этом не учитывают знак разницы (т.е. ранжируют по модулю).Нулевую пару отбрасывают.

d				-4				-10
R	1.5	1.5					7.5	7.5

Отдельно суммируют ранги для положительных и отрицательных разниц. В нашем случае получаем: Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , . В качестве значения критерия T_z берут меньшую сумму независимо от знака, т.е. T_z =11,5. Сравниваем это значение с «критическим» из специальной таблицы, входом в которую является число сравниваемых пар, но лишь тех, которые не дают нулевые разницы. В нашем случае таковых 9. Тогда T_кр = 6 для Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru и T_кр =2 для . Поскольку даже для первого уровня значимости, различий уровней СД нулевую гипотезу отвергнуть нельзя и различия не являются статистически значимыми (р<0,05). Иными словами, у нас нет пока оснований утверждать, что действие кофеина носит исключительно физиологический характер.

Смысл теста состоит в следующем. Если бы мы имели бесконечно большой ряд случайных разниц, то число и величина положительных разниц равнялись бы числу отрицательных и, соответственно, суммы их рангов были бы равны. На конечном и ограниченном числовом массиве опять же чисто случайно может иметь место «перекос» в сторону преимущественно положительных или отрицательных разниц. Это обстоятельство и учитывается в критических значениях критерия.

T_кр– это граница между практически возможными и практически невозможными значениями критерия. Соответственно, если Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , то полученная нами сумма рангов с достаточно высокой вероятностью могла возникнуть чисто случайно и о сдвиге одного числового ряда относительно другого ничего определенного сказать нельзя. Это недостоверное различие. Если же Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , то наблюдаемое различие положительных и отрицательных разниц не могло быть получено случайным образом. Это означает, что смещение значений в сопоставляемых числовых рядах объясняется действием какой-то систематически действующей, неслучайной причины, т.е. носит статистически достоверный (устойчивый и прогнозируемый) характер.

Как было показано выше, пары, имеющие одинаковые числовые значения и, соответственно, дающие нулевые разницы, исключаются из рассмотрения. И если таких случаев много, то «жесткость» критерия нарастает, поскольку T_кртем меньше, чем меньше сравниваемых пар. Соответственно, увеличивается число ситуаций, когда нулевую гипотезу отвергнуть невозможно, и различие будет считаться незначимым. Более того, если число пар окажется меньше 6, то критерий Вилкоксона вообще перестанет «работать»: 6 - минимальное число пар, для которого еще существует T_кр. Для меньшего числа его просто невозможно рассчитать. А подобные ситуации в медико-биологической практике возникают довольно часто, поскольку многие измерения неизбежно приходится выполнять с достаточно высокой степенью грубости, и вероятность появления совпадающих значений здесь все еще весьма высока.

Критерий согласия Пирсона (критерий Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru )

Критерии согласияпозволяют определить степень соответствия эмпирических и теоретических распределений вероятностей, а также двух эмпирических распределений, полученных, например, в «контроле» и «опыте» или в различных вариантах «опыта» или «наблюдения». Этот критерий позволяет проверить гипотезу о схожести фактического,полученного на практике, распределения вероятностей случайной величины и теоретического.

Данный критерий может использоваться, например, для сравнения частот встречаемости качественных или порядковых признаков в выборочных совокупностях.

Критерий Пирсона записывается следующим образом:

Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru

где k – число классов ряда распределения, Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru – фактические (наблюдаемые) частоты встречаемости случайной величины в каждом i-ом классе (в виде целых чисел), Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru – теоретически ожидаемые (вычисленные) частоты для данного класса, – разница между ними.

Таким образом, Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru представляет собой вовсе не квадрат какого-то числа, а суммупо всем классам распределения данной случайной величины (от 1-го до k-го) величины квадратов разницы фактических и теоретических частот в каждом классе, отнесенных к теоретическим частотам для этих же классов.

Допустим, что по каждому классу распределения Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , т.е. фактические (наблюдаемые) и ожидаемые (вычисленные) частоты идеально совпадают. Тогда Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru и, соответственно, . Понятно, что такого рода ситуация может иметь место только в том случае, когдаформа эмпирического распределения абсолютно идентична форме теоретической модели, рассчитанной по эмпирическим данным.

Допустим теперь, что Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru хотя бы для одного из сравниваемых классов эмпирического и теоретического распределений, то есть для какого-то одного из них Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru . Поскольку мы имеем дело с «суммой квадратов», то автоматически станет больше нуля. Чем больше будет таких различий для разных классов и чем значительнее будут сами различия, тем больше будет «набегать» сумма квадратов. Следовательно, при различии наблюдаемых и ожидаемых частот сравниваемых распределений Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru может принимать любые положительные значения, вплоть до бесконечности.Нетрудно представить, что чем менее схожейбудет форма сравниваемых распределений, тем большие числовые значения будет принимать Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru и, само собой, наоборот. Иными словами, является мерой сходства/различия формы сравниваемых распределений вероятностей.

Технология использования критерия «Хи-квадрат» чрезвычайно проста. По приведенной выше формуле подсчитывается «экспериментальное» значение «Хи-квадрат» Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , которое сравнивают с табличным или «критическим» значением , взятым сообразно наличному числу степеней свободы). Далее, как всегда, проверяется выполнение двух неравенств:

- если Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , то разница наблюдаемых (фактических) и ожидаемых (теоретических) частот сравниваемых распределений столь велика, что выходит за рамки ее собственных случайных колебаний. Самопроизвольное появление такого значения «Хи-квадрат» относится к разряду невозможных событий. Следовательно, различие форм эмпирического и теоретического распределений обусловлено действием некого систематически действующего фактора, и эмпирическое распределение на принятом уровне значимости не может рассматриваться в качестве случайной модификации теоретической модели.

Однако, при использовании критерия Пирсона существуют следующие ограничения:

· во-первых, объем выборочной совокупности должен быть не менее 50;

· во-вторых, допускается сравнение только абсолютных, а не относительных частот, т.е. количества значений случайной величины, попадающей в каждый класс распределения «в штуках»

· в-третьих, если в теоретическом (вычисленном) распределении встречается класс, в котором число значений менее пяти, то его еще до начала вычисления критерия объединяют с соседним, складывая их частоты. При этом такое же сокращение числа классов, независимо от фактического количества частот в них, производят и в эмпирическом распределении.

Отметим, что в современных программных пакетах математико-статистической обработки данных SPSS и Statistica все операции, необходимые для расчета статистических критериев автоматизированы. Главной задачей пользователя является правильный выбор статистического критерия в каждом конкретном случае. Программа выдает полный отчет о результатах расчетов с указанием уровня значимости нулевой гипотезы. Подробное использование этих статистических программ изложено в электронных и печатных руководствах пользователя.

1. Вопросыпотемезанятия:

1. Понятие нулевой гипотезы.

2. Понятие альтернативной гипотезы.

3. Параметрические методы и условия их применимости.

4. Непараметрические методы и условия их применимости.

5. Понятие зависимых выборок.

6. Понятие независимых выборок.

7. Критерий Стьюдента.

8. Критерий Фишера.

9. Критерий Манна-Уитни.

10. Критерий Вилкоксона.

11. Критерии, используемые для проверки нормальности распределения.

2. Тестовые задания по теме с эталонами ответов:

1. ВЫБОР ПОДХОДЯЩЕГО МЕТОДА СРАВНЕНИЯ ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ ОПРЕДЕЛЯЕТСЯ

1) различиями в характеристиках сравниваемых рядов

2) длинами выборок и максимальным разбросом вариант

3) числом сопоставляемых групп, зависимостью или независимостью выборок, видом распределения признака

4) средними значениями и дисперсиями

2. НЕЗАВИСИМЫМИ ВЫБОРКАМИ ЯВЛЯЮТСЯ

1) выборки, полученные при рандомизации

2) совокупность мужей и совокупность жен

3) одни и те же объекты в разные моменты времени

4) пары близнецов

3. ЗАВИСИМЫМИ ВЫБОРКАМИ ЯВЛЯЮТСЯ

1) совокупность мужчин и совокупность женщин

2) одни и те же объекты в разные моменты времени

3) больные сахарным диабетом и больные гриппом

4) выборки, полученные при рандомизации

4. ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ОСНОВАНЫ НА

1) оценке параметров распределения

2) типе распределения

3) выдвигаемых гипотезах

4) требуемой точности

5. ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ ПРИМЕНИМЫ, ЕСЛИ

1) распределение ассиметрично

2) требуются достаточно грубые оценки

3) варианты выборок различны

4) численные данные подчиняются нормальному распределению

6. ПРИ АНАЛИЗЕ ДАННЫХ ВЫДВИГАЮТСЯ СЛЕДУЮЩИЕ ГИПОТЕЗЫ

1) нулевая и гипотеза однородности

2) нулевая и альтернативная гипотезы

3) нулевая гипотеза и гипотеза равенства средних

4) гипотеза однородности и гипотеза отсутствия ошибок репрезентативности

7. ЕСЛИ ВЕРОЯТНОСТЬ НУЛЕВОЙ ГИПОТЕЗЫ ОКАЖЕТСЯ ВЫШЕ НЕКОТОРОГО НАПЕРЕД ЗАДАННОГО УРОВНЯ ЗНАЧИМОСТИ α, ТО

1) нулевая гипотеза может быть отвергнута

2) альтернативная гипотеза может быть принята

3) нулевая гипотеза не можетбыть отвергнута

4) уровень значимости нулевой гипотезы возрастает

8. К ПАРАМЕТРИЧЕСКИМ КРИТЕРИЯМ ОТНОСЯТСЯ

1) критерий Стьюдента и критерий Вилкоксона

2) критерий Вилкоксона и критерий Манна-Уитни

3) критерий Фишера и критерий Манна-Уитни

4) критерий Стьюдента и критерий Фишера

9. КРИТЕРИЙ СТЬЮДЕНТА ОСНОВАН НА СРАВНЕНИИ

1) частот изучаемого признака в вариационном ряду

2) средних значений выборок

3) числа наблюдений выборок

4) выборочных дисперсий

10. КРИТЕРИЙ ФИШЕРА ОСНОВАН НА СРАВНЕНИИ

1) частот изучаемого признака в вариационном ряду

2) средних значений выборок

3) числа наблюдений выборок

4) выборочных дисперсий

11. КРИТЕРИЙ СТЬЮДЕНТА ОБОЗНАЧАЕТСЯ СИМВОЛОМ

1) t

2) U

3) Z

4) F

12. ПОЛУЧЕННОЕ ЗНАЧЕНИЕ КРИТЕРИЯ СТЬЮДЕНТА СРАВНИВАЮТ

1) с рассчитанным по формуле значением критерия Стьюдента

2) с табличным значением критерия Стьюдента

3) со стандартной ошибкой

4) с выборочным средним

13. ЕСЛИ ПОЛУЧЕННОЕ ЗНАЧЕНИЕ t-КРИТЕРИЯ ПРЕВЫШАЕТ ТАБЛИЧНОЕ ДЛЯ ВЫБРАННОГО УРОВНЯ ЗНАЧИМОСТИ Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru , ЭТО ОЗНАЧАЕТ ЧТО

1) различие выборочных средних статистически значимо с вероятностью 95%

2) различие выборочных средних статистически значимо с вероятностью 5%

3) различие выборочных средних статистически незначимо

4) различие выборочных средних статистически значимо с вероятностью 0.05

14. ЯВЛЯЕТСЯ ЛИ ПОЛУЧЕННОЕ РАСПРЕДЕЛЕНИЕ НОРМАЛЬНЫМ, МОЖНО ОПРЕДЕЛИТЬ С ПОМОЩЬЮ

1) критерия Манна-Уитни

2) t-критерия

3) критерия Шапиро-Уилка

4) критерия Вилкоксона

15. ДЛЯ КОРРЕКТНОГО ИСПОЛЬЗОВАНИЯ КРИТЕРИЯ ПИРСОНА ОБЪЕМ ВЫБОРОЧНОЙ СОВОКУПНОСТИ ДОЛЖЕН БЫТЬ

1) не менее10

2) не менее 30

3) не менее 50

4) не менее 150

16. НА МАЛЫХ ВЫБОРКАХ РАБОТАЮТ

1) параметрические критерии

2) непараметрические критерии

3) критерии согласия

4) параметрические и непараметрические критерии

17. СТЕПЕНЬ СООТВЕТСТВИЯ ЭМПИРИЧЕСКИХ И ТЕОРЕТИЧЕСКИХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ, А ТАКЖЕ ДВУХ ЭМПИРИЧЕСКИХ РАСПРЕДЕЛЕНИЙ, ПОЗВОЛЯЮТ ОПРЕДЕЛИТЬ

1) непараметрические критерии

2) параметрические и непараметрические критерии

3) параметрические критерии

4) критерии согласия

18. К НЕПАРАМЕТРИЧЕСКИМ КРИТЕРИЯМ ОТНОСЯТСЯ

1) критерий Стьюдента и критерий Вилкоксона

2) критерий Вилкоксона и критерий Манна-Уитни

3) критерий Фишера и критерий Манна-Уитни

4) критерий Стьюдента и критерий Фишера

19. КРИТЕРИЙ МАННА-УИТНИ ЭТО

1) ранговый критерий для сравнения независимых выборок

2) ранговый критерий для сравнения зависимых выборок

3) параметрический критерий для сравнения независимых выборок

4) параметрический критерий для сравнения зависимых выборок

20. КРИТЕРИЙ ВИЛКОКСОНА ЭТО

1) ранговый критерий для сравнения независимых выборок

2) ранговый критерий для сравнения зависимых выборок

3) параметрический критерий для сравнения независимых выборок

4) параметрический критерий для сравнения зависимых выборок

21. НЕПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ МОГУТ БЫТЬ ПРИМЕНЕНЫ

1) для данных, имеющих произвольное распределение

2) только для данных, имеющих нормальное распределение

3) только для данных, имеющих распределение Пирсона

4) только для параметров распределения

22. КРИТЕРИЙ СОГЛАСИЯ ПИРСОНА ОБОЗНАЧАЕТСЯ СИМВОЛОМ

1) U

2) t

3) Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru

4) Z

23. СУММАРНАЯ ВЕРОЯТНОСТЬ НУЛЕВОЙ Критерий Манна-Уитни – ранговый критерий для сравнения независимых выборок. - student2.ru И АЛЬТЕРНАТИВНОЙ ГИПОТЕЗ РАВНА

1) 0

2) 1

3) 5

4) 100

24. МЕРОЙ СХОДСТВА/РАЗЛИЧИЯ ФОРМЫ СРАВНИВАЕМЫХ РАСПРЕДЕЛЕНИЙ ВЕРОЯТНОСТЕЙ ЯВЛЯЕТСЯ КРИТЕРИЙ

1) Стьюдента

2) Вилкоксона

3) Пирсона

4) Манна-Уитни

25. К РАНГОВЫМ КРИТЕРИЯМ ОТНОСИТСЯ

1) критерий Манна-Уитни

2) критерий Стьюдента

3) критерий Фишера

4) критерий Пирсона

26. ДОПУЩЕНИЕ ОБ ОТСУТСТВИИ ТОГО ИЛИ ИНОГО ИНТЕРЕСУЮЩЕГО ИССЛЕДОВАТЕЛЯ СОБЫТИЯ, ЯВЛЕНИЯ ИЛИ ЭФФЕКТА – ЭТО

1) альтернативная гипотеза

2) нулевая гипотеза

3) дизайн исследования

4) погрешность

27. ПОД АЛЬТЕРНАТИВНОЙ ГИПОТЕЗОЙ ПОДРАЗУМЕВАЕТСЯ

1) наличие того или иного события, явления или эффекта

2) отсутствие события, явление или эффекта

3) возможность возникновения события

4) погрешность

28. ЕСЛИ ВЕРОЯТНОСТЬ НУЛЕВОЙ ГИПОТЕЗЫ УВЕЛИЧИВАЕТСЯ, ТО ВЕРОЯТНОСТЬ АЛЬТЕРНАТИВНОЙ ГИПОТЕЗЫ

1) не изменяется

2) увеличивается

3) равна 1

4) снижается

29. В СЛУЧАЕ, ЕСЛИ МАКСИМАЛЬНОЕ ЗНАЧЕНИЕ ОДНОГО ИЗ СРАВНИВАЕМЫХ ВЫБОРОЧНЫХ ВАРИАЦИОННЫХ РЯДОВ ЗАВЕДОМО МЕНЬШЕ МИНИМАЛЬНОГО ЗНАЧЕНИЯ ДРУГОГО ВАРИАЦИОННОГО РЯДА, ТО

1) необходим расчет критерия Стьюдента

2) расчетов с применением критерия Стьюдента не требуется

3) необходим расчет критерия Манна-Уитни

4) необходим расчет критерия Вилкоксона

30. ЕСЛИ НАБОР ОБЪЕКТОВ ИССЛЕДОВАНИЯ В КАЖДУЮ ИЗ ГРУПП ОСУЩЕСТВЛЯЛСЯ НЕЗАВИСИМО ОТ ТОГО, КАКИЕ ОБЪЕКТЫ ИССЛЕДОВАНИЯ ВКЛЮЧЕНЫ В ДРУГУЮ ГРУППУ, ТАКИЕ ВЫБОРКИ НАЗЫВАЮТСЯ

1) зависимыми

2) независимыми

3) случайные

4) возможные

Эталоны ответов на тестовые задания: