Непараметрические критерии для несвязных выборок.

Критерий U Вилкоксона – Манна – Уитни

Несвязанные или независимые выборки образуются, когда в целях эксперимента для сравнения привлекаются данные двух или более выборок, причем эти выборки могут быть взяты из разных генеральных совокупностей. Таким образом, для несвязанных выборок характерно, что в них обязательно входят разные испытуемые.

Для оценки достоверности различий между несвязными выборками используется ряд непараметрических критериев. Одним из наиболее распространенных является критерий U. Этот критерий применяют для оценки различий по уровню выраженности какого-либо признака для двух независимых (несвязных) выборок. При этом выборки могут различаться по числу входящих в них испытуемых. Этот критерий особенно удобен в том случае, когда число испытуемых невелико и в обеих выборках не превышает число 20, хотя таблицы критических значений рассчитаны для величин выборок, не превышающих 60 человек испытуемых.

Пример: Две неравные по численности группы испытуемых решали техническую задачу. Показателем успешности служило время решения. Испытуемые меньшей по численности группы получали дополнительную мотивацию в виде денежного вознаграждения. Психолога интересует вопрос – влияет ли вознаграждение на успешность решения задачи?

Психологом были получены следующие результаты времени решения технической задачи в секундах: в первой группе – с дополнительной мотивацией – 39, 38, 44, 6, 25, 25, 30, 43; во второй группе – без дополнительной мотивации – 46, 8, 50, 45, 32, 41, 41, 31, 55. Число испытуемых в впервой группе обозначается как n1 и равно 8, во - второй как n2 и равно 9.

Для ответа на вопрос задачи применим критерий U Вилкоксона – Манна – Уитни. Существует два способа подсчета по критерию U. Мы рассмотрим (первый) наиболее

простой способ.

Полученные данные необходимо объединить, т. е. представить как один ряд и упорядочить его по возрастанию входящих в него величин. Подчеркнем, что для критерия U важны не сами численные значения данных, а порядок их расположения. Предварительно обозначим каждый элемент первой группы символом х, а второй - символом у. Тогда общий упорядоченный по возрастанию численных величин ряд можно представить так:

x y x x x y y x x y y x x y y y y Модифицированный ряд

6 8 25 25 30 31 32 38 39 41 41 43 44 45 46 50 55

Если бы упорядоченный ряд, составленный по данным двух выборок, принял бы такой вид:

x x x x x x x x x y y y y y y y y y y y y

то, очевидно, что такие две выборки значимо различались бы между собой, такое расположение называется идеальным. Критерий U основан на подсчете нарушений в расположении чисел в упорядоченном экспериментальном ряду по сравнению с идеальным рядом. Любое нарушение порядка идеального ряда называют инверсией. Одним нарушением (одной инверсией) считают такое расположение чисел, когда перед некоторым числом первого ряда, стоит только одно число второго ряда. Если перед некоторым числом первого ряда стоит два числа второго ряда, то возникают две инверсии и т. д.

Удобно подсчитывать число инверсий, расположив исходные данные в виде таблицы, в которой один столбец состоит из данных первого ряда, а второй из данных второго. При этом и первый и второй столбцы имеют пропуски чисел, которые обозначаются символом «-».

Пропуск в первом столбце означает, что в соседнем столбце имеется число, занимающее промежуточное положение по отношению к числам первого столбца, ограничивающим пропуск. То же самое верно для пропусков второго столбца. Упорядоченное объединение экспериментальных данных в порядке их возрастания, представленное отдельно в первом и втором столбце с учетом пропусков и является по существу модифицированным рядом. Представим этот модифицированный ряд в виде табл. 6, в которую добавлены еще два столбца для подсчета инверсий. В третьем столбце таблицы даны инверсии первого столбца по отношению ко второму, они обозначаются как инверсии X/Y, а четвертом столбце инверсии второго столбца по отношению к первому, они обозначаются как инверсии Y/X.

Таблица 7

Группа с дополнительной мотивацией X Группа без дополнительной мотивации Y   Инверсии X/Y   Инверсии Y/X
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
- -
Суммы инверсий  


Инверсии X/Y подсчитываются следующим образом: число 6 первого столбца не имеет перед собой никаких чисел второго столбца, поэтому в третьем столбце напротив числа 6 ставим ноль; числа 25, 25 и 30 первого столбца (х) имеют перед собой только одно число второго столбца – 8 (у), т. е. имеют по одной инверсии, поэтому в столбце 3 для инверсий X/Y каждому из чисел 25, 25 и 30 ставим в соответствие число 1. Числа 38 и 39 первого столбца имеют перед собой по три числа второго столбца – это числа 8, 31 и 32, т. е. имеют по три инверсии. Последние два числа первого столбца 43 и 44 имеют перед собой пять чисел второго столбца, т. е. по 5 инверсий. Таким образом, суммарное число инверсий X/Y третьего столбца составляет:

U (x/y) = 1 + 1 + 1 + 3 + 3 + 5 + 5 =19

Необходимо рассчитать также число инверсий второго столбца (y) по отношению к первому (x), т. е. суммарное число инверсий Y/X. Поскольку число 8 (y) имеет перед собой одно число первого столбца – 6, то столбце 4 с инверсиями для Y/X напротив числа 8 ставим число инверсий -1; числа 31 и 32 второго столбца имеют перед собой четыре числа первого столбца: 6, 25, 25 и 30, следовательно, числу 31 и числу 32 приписываем в столбце 4 величины инверсий равные 4, и так далее. Таким образом, суммарное число инверсий Y/X четвертого столбца составляет:

U (x/y) = 1 + 4 + 4 + 6 + 6 + 8 + 8 +8 + 8 = 53

Видно, что во втором случае сумма инверсий существенно больше. Принято считать, что U Непараметрические критерии для несвязных выборок. - student2.ru есть минимальное из сумм инверсий.

Или, иначе говоря, U Непараметрические критерии для несвязных выборок. - student2.ru = min (U(x/y), U(y/x)) = 19

Получив U Непараметрические критерии для несвязных выборок. - student2.ru обращаемся к табл. 16 приложения 6. Эта таблица состоит из нескольких таблиц, рассчитанных отдельно для уровней P = 0,05, P = 0,01, а также для величин n1 и n2. В нашем случае n1 = 8 и n2 = 9. По этим таблицам находим, что значения U Непараметрические критерии для несвязных выборок. - student2.ru равны:

18 для P Непараметрические критерии для несвязных выборок. - student2.ru 0,05

11 для P Непараметрические критерии для несвязных выборок. - student2.ru 0,01

Непараметрические критерии для несвязных выборок. - student2.ru Соответствующая «ось значимости» имеет вид:

Непараметрические критерии для несвязных выборок. - student2.ru

Полученное значение U Непараметрические критерии для несвязных выборок. - student2.ru попало в зону незначимости, следовательно, принимается гипотеза H Непараметрические критерии для несвязных выборок. - student2.ru о сходстве, а гипотеза H Непараметрические критерии для несвязных выборок. - student2.ru о наличии различий отклоняется. Таким образом, психолог может утверждать, что дополнительная мотивация не приводит к статистически значимому увеличению эффективности решения технической задачи.

Для применения критерия U необходимо соблюдать следующие условия:

1. Измерение должно быть произведено в шкале интервалов и отношений.

2. Выборки должны быть несвязанными.

3. Нижняя граница применимости критерия n1 Непараметрические критерии для несвязных выборок. - student2.ru 3 и n2 Непараметрические критерии для несвязных выборок. - student2.ru 3 или n1 = 2, а n2 Непараметрические критерии для несвязных выборок. - student2.ru 5.

4. Верхняя граница применимости критерия: n1 и n2 Непараметрические критерии для несвязных выборок. - student2.ru 60 Непараметрические критерии для несвязных выборок. - student2.ru

Наши рекомендации