Практическое упражнение по вычислению критерия Манна-Уитни на основе заданных учебных числовых значений
Напоминаем: Критерий Манна-Уитни – непараметрический статистический метод, позволяющий оценить достоверность различий между двумя выборками по уровню представленности исследуемого признака.
Дано. Две выборки показателей интеллекта, относящихся к группе студентов-физиков (n=14) и студентов-психологов (n=12). (Пример взят из (1) стр. 51).
Задача: определить, отличаются ли эти группы по уровню интеллекта.
Рисунок 30.
Таблица эмпирических значений.
Коды имен и фамилий студентов-физиков | IQ - физиков | Коды имен и фамилий студентов-психологов | IQ психологов |
IA | NT | ||
KA | OV | ||
KE | EV | ||
PA | FO | ||
SA | IN | ||
CA | ICH | ||
TA | IV | ||
FA | KO | ||
CHI | RR | ||
CA1 | RI | ||
SMA | OK | ||
KAN | NK | ||
BL | |||
FV |
Шаг 1. Запустить программу SPSS одним из известных способов. В окне ввода данных внести содержимое приведенной таблицы с клавиатуры.
Шаг 2. Перейти в окно задания свойств переменной и присвоить имеющимся переменным соответствующие имена: Name 1; Intel 1; Name 2; Intel 2.
Шаг 3. В окне задания свойств переменной охарактеризовать имеющиеся переменные:
- присвоив им соответствующий тип (опция Type) (числовой или строковый);
- выровняв для наглядности их значения различным образом (опция Align);
- разрядность знаков до и после запятой, а так же пропущенные значения и ширину колонки оставить без изменения (опции Width, Decimals, Missing, Columns);
- метки переменной и метки значений не устанавливать (опции Label и Values);
- охарактеризовать для каждой переменной тип шкалы – номинальный или равных отношений (опция Measure).
Вернуться в окно ввода данных.
Шаг «учебная ошибка».Нажать последовательность кнопок «Анализ» - «Непараметрические тесты» - «2 независимые образцы». Возникнет окно, показанное на рисунке 31.
Рисунок 31.
Как видим, простого переноса переменных из окна переменных в «Тест списка переменной» оказывается недостаточно. (Этот некорректный перевод подразумевал, очевидно: «список проверяемых переменных» («Test variables list»)). Оказывается, для чего-то существуют окна «Группировка переменной» и «Определение групп». Ясно, что в таком виде, как у нас, данные не пригодны для обработки этим критерием.
Вспомним суть критерия Манна-Уитни: данные двух выборок, предварительно помеченные, смешиваются и ранжируются в общем ряду, после чего вновь раскладываются по своим местам. Программа SPSS при создании файла позволяет сложить все данные в общую выборку, но требует присутствия группирующей переменной, которая бы указывала машине, какие значения общей выборки относятся на самом деле к выборке 1, а какие – к выборке 2, которые мы, собственно и сравниваем между собой.
Проделаем эти операции.
Шаг 4. Создадим две новые переменные, которые назовем: «Intsum» и «gruppir», обозначающие, соответственно «сумма значений интеллекта» и «группирующая».
В переменную «Intsum» через буфер обмена скопируем вначале все значения первой выборки, а затем – второй. С этой целью содержимое второй выборки выделяется мышью, копируется, затем следующая вниз (после последней заполненной) ячейка переменной (столбца) «Intsum» активизируется мышью, и в нее копируется содержимое буфера обмена.
Группирующую переменную «gruppir» снабдим следующими значениями: против тех значений переменной «Intsum», которые, по сути дела, относятся к первой выборке, ставим число 1, а против тех, которые относятся ко второй – число 2. В итоге получим следующую таблицу:
Name 1 | Intel 1 | Name 2 | Intel 2 | intsum | gruppir |
IA | 111,00 | NT | 113,00 | 111,00 | 1,00 |
KA | 104,00 | OV | 107,00 | 104,00 | 1,00 |
KE | 107,00 | EV | 123,00 | 107,00 | 1,00 |
PA | 90,00 | FO | 122,00 | 90,00 | 1,00 |
SA | 115,00 | IN | 117,00 | 115,00 | 1,00 |
CA | 107,00 | ICH | 112,00 | 107,00 | 1,00 |
TA | 106,00 | IV | 105,00 | 106,00 | 1,00 |
FA | 107,00 | KO | 108,00 | 107,00 | 1,00 |
CHI | 95,00 | RR | 111,00 | 95,00 | 1,00 |
CA1 | 116,00 | RI | 114,00 | 116,00 | 1,00 |
SMA | 127,00 | OK | 102,00 | 127,00 | 1,00 |
KAN | 115,00 | NK | 104,00 | 115,00 | 1,00 |
BL | 102,00 | , | 102,00 | 1,00 | |
FV | 99,00 | , | 99,00 | 1,00 | |
, | , | 113,00 | 2,00 | ||
, | , | 107,00 | 2,00 | ||
, | , | 123,00 | 2,00 | ||
, | , | 122,00 | 2,00 | ||
, | , | 117,00 | 2,00 | ||
, | , | 112,00 | 2,00 | ||
, | , | 105,00 | 2,00 | ||
, | , | 108,00 | 2,00 | ||
, | , | 111,00 | 2,00 | ||
, | , | 114,00 | 2,00 | ||
, | , | 102,00 | 2,00 | ||
, | , | 104,00 | 2,00 |
(Для наглядности соответствующие блоки данных выделены в таблице курсивом и жирным шрифтом.)
Шаг 5. Снабдим новые переменные свойствами (аналогично шагу 3). Группирующая переменная, понятно, должна быть выражена в номинальной шкале. Группирующую переменную можно снабдить меткой, поясняющей, что такое значение, равное 1, и что такое - равное 2.
Шаг 6. Проделаем действия, те же, что в начале шага «учебная ошибка», то есть добьемся появления окон, показанных на рисунке 32 и после – на рисунке 31. В качестве обрабатываемой переменной в «список проверяемых переменных» помещаем «Intsum», а в качестве группирующей – «Gruppir». После этого нажимаем на кнопку «Определение групп», и в раскрывшемся окошке вводим соответственно числа 1 и 2. Нажимаем «Продолжить» («Continue»), и возвращаемся в предыдущее окошко, где (убедившись, что все сделали верно, и расставили все нужные флажки) нажимаем на «ОК».
После этого программа сгенерирует файл вывода результатов, в котором должны получиться следующие значения:
Ranks
1 - pervaya vyborka 2 - vtoraya vyborka | N | Mean Rank | Sum of Ranks | |
obedinennaya vyborka | 1,00 | 11,79 | 165,00 | |
2,00 | 15,50 | 186,00 | ||
Total |
Test Statistics
obedinennaya vyborka | |
Mann-Whitney U | 60,000 |
Wilcoxon W | 165,000 |
Z | -1,237 |
Asymp. Sig. (2-tailed) | ,216 |
Exact Sig. [2*(1-tailed Sig.)] | ,231a |
a Not corrected for ties.
b Grouping Variable: 1 - pervaya vyborka 2 - vtoraya vyborka
Из таблиц узнаем:
1) объемы выборок, средние ранги, сумму рангов;
2) значение критерия Манна-Уитни; значение критерия Вилкоксона («в довесок»); Z – оценка, позволяющая наглядно сопоставить результаты проверки достоверности различий между выборками по различным переменным (Z); достоверность выявленного различия по критерию Манна-Уитни; точное значение различий.
3) Сообщения о достоверности различий и группирующей переменной.