Пример 7.4.6. Различия в результатах t-критерия Стьюдента и критерия Манна-Уитни

В большинстве случае полезно проводить расчет и Т-критерия Стьюдента, и критерия Манна-Уитни и сопоставлять их результаты. Если результаты не согласуются, важно уставить причину расхождения --- выявить, в чем особенности выборок, более подробно проанализировав распределения данных, оценив шкалы, в которых измеряются анализируемые параметры и т.д.

Рассмотрим результаты эксперимента, связанного с исследованием навыка письма у младших школьников. В эксперименте испытуемым, учащимся первого и второго класса, предлагалось написать небольшой диктант. Затем, в качестве меры степени освоения навыка измерялись различные параметры письма: скорость, качество почерка, количество допущенных ошибок разного типа и др. В файле writing-t.sav приводятся модельные данные по общему количеству допущенных ошибок у испытуемых из первого и второго класса. В первом столбце содержится информация о принадлежности испытуемого к первому или второму классу, во втором столбце --- общее количество допущенных испытуемым ошибок в диктанте.

Сравним количество ошибок, допущенных детьми, учащимися в первом и втором классе. Средний показатель, полученный у учеников первого класса составил 13.3 ошибки (стандартное отклонение --- 1.5), у учеников второго класса --- 11.25 (стандартное отклонение --- 3.36).

Проверим, насколько эти различия значимы с помощью Т-критерия Стьюдента и критерия Манна-Уитни. T-критерий свидетельствует о незначимости различий средних показателей (t(22)=1.961, p=0.063), однако критерий Манна-Уитни показывает значимый результат U=22, p=0.003.

Чтобы прояснить ситуацию, рассмотрим гистограммы распределения значения данных в двух группах, изображенные на рис. 7.4.4.

[Рис 7.4.4.bmp]

Рис. 7.4.4. Гистограммы распределения количества ошибок в первом и во втором классах.

На графике видно, что основная часть испытуемых из второго класса делает меньше ошибок, чем дети, учащиеся в первом классе, однако, есть один второклассник, который сделал очень большое количество ошибок --- 21 (при среднем значении 11). Именно это аномально высокое значение (так называемый "выброс") может исказить результаты параметрического t-критерия Стьюдента. Непараметрический критерий Манна-Уитни устойчив к такого рода выбросам, поэтому в данном случае имеет смысл ориентироваться на него.

Почему один из испытуемых допустил такое большое количество ошибок --- вопрос, не относящийся к области статистики, однако мы, например, можем предположить, что это ребенок, страдающий нарушением письма (дисграфией) и поэтому он "выпадает" из общего достаточно однородного распределения. Если мы намерены исследовать навык письма в норме, нам следует исключить такого испытуемого из общего анализа и рассмотреть отдельно[12].

При исключении такого ребенка (вы можете выделить его номер в самом левом служебном столбце с номерами измерений, кликнув на него мышью, а затем нажать клавишу Delete, при этом удалится вся строка), результаты Т-критерия и критерия Манна-Уитни становятся более согласованными: различия между двумя группами значимы на уровне p<0.001 для обоих критериев.

Задание 7.4.8.

Представьте, что руководство фирмы намерено оценить, насколько вовремя их сотрудники приходят на работу. В файле work.sav представлены данные по числу опозданий за неделю у сотрудников двух отделов. Задача начальства --- установить, в каком отделе ситуация с посещаемостью хуже. В первом столбце указана принадлежность сотрудника к одному из отделов. Во втором столбце --- количество опозданий за неделю.

· Сравните количество опозданий у сотрудников двух отделов при помощи t-критерия Стьюдента и критерия Манна-Уитни.

· Постройте гистограммы и обоснуйте, чем вызвано несовпадение результатов двух критериев.

Обратите внимание, что в данном случае нет однозначного ответа на вопрос о том, какой из критериев "нужно" применять в данном случае. Расхождение критериев указывает на качественное различие ситуации в отделах --- и руководству эти различия могут быть значительно более важны, нежели однозначный статистический вывод.

Задание 7.4.9.

В файле hospitalization.sav представлены модельные результаты исследования связь отношения к болезни и повторных обострений заболевания (повторных госпитализаций) у пациентов с шизофренией. При помощи опросника восстановления после психоза[13] у 50 больных шизофренией перед выпиской оценивался уровень понимания больным своего заболевания и готовности следовать рекомендациям врача (так называемый комплайенс). Через 2 года оценивалось то, госпитализировался ли пациент повторно (были ли обострения). 20 больных попали в клинику, 30 --- нет. В первом столбце содержится информация о госпитализации (по этому признаку выделяется две группы испытуемых), во втором столбце --- результаты проведения опросника.

· Сравните баллы по опроснику восстановления после психоза у больных, госпитализировавшихся и не госпитализировавшихся повторно после выписки.

· Сравните результаты, полученные при помощи параметрического и непараметрического критериев.

· Постройте диаграмму рассеяния и обоснуйте, чем вызвано несовпадение результатов двух критериев. Постарайтесь учесть (1) характер методики --- это был опросник, (2) особенности течения заболевания и другие факторы, которые могли повлиять на результаты.

[1] Loevinger J. Measuring ego development. San-Francisco, 1996

[2] Иванова Н.А. Психодиагностические возможности методики неоконченных предложений Вашингтонского университета. Дипломная работа. М., МГУ, 2010

[3] Согласно Дж.Левинжер, первая стадия развития характерна для младенчества и не встречается у детей школьного возраста и старше, поэтому методика не включает критериев ее оценки

[4] Maddi S. R. Hardiness training at Illinois Bell Telephone // J.P. Opatz (Ed.). Health promotion evaluation. Stevens Point (WI): National Wellness Institute, 1987. P. 101—115

[5] Bandura A. Regulation of Cognitive Processes Through Perceived Self-Efficacy / 2000. Download from: http://www.emory.edu/EDUCATION/mfp/BanduraRegulation.html

[6] См., например. Методика самооценки эмоциональных состояний (А.Уэссман и Д.Рикс) / Сонин В.А. Психодиагностическое познание профессиональной деятельности. --- СПб., 2004. С.94-96

[7] Личностная шкала проявлений тревоги (Дж.Тейлор, адаптация Т.А.Немчина) / Диагностика эмоционально-нравственного развития. Ред. и сост. И.Б.Дерманова. - СПб., 2002. С.126-128

[8] Denckla MB, Rudel R., Rapid "automatized" naming of pictured objects, colors, letters and numbers by normal children // Cortex, 1974, 10(2), p.186-202.

[9] Обратите внимание, что сумма рангов зависит от количества испытуемых в группах. Если в группах разное количество испытуемых, делать содержательные выводы о различии между группами по этому показателю нельзя, и следует анализировать показатель средний ранг

[10] Calhoun, L., Tedeshi, R. (Eds). Handbook of posttraumatic growth. Research and practice. Mahwah: Lawrence Erlbaum, 2006

[11] Рубинштейн С.Я. Экспериментальные методики патопсихологии и опыт их применения (практическое руководство). СПб, 1998

[12] Надо все же отметить, что исключение "выбросов" не опирается на какие-то строгие правила, так что такая операция всегда уязвима для критики.

[13] Chen, E., Tam, D., Wong, J., Law, C., Chin, C. Self-administered instrument to measure the patients experience of recovery after first-episode psychosis: development and validation of the Psychosis Recovery Inventory // Australian and New Zealand Journal of Psychiatry, 2005, 39, 493-499

Наши рекомендации