Особенности применения методов непараметрической статистики при анализе эмпирических данных
Методы непараметрической статистики применяются в тех случаях, когда показатели тестов распределены ненормально или распределение неизвестно. Существует определение: "Непараметрические методы статистики - методы математической статистики, не предполагающие знание функционального вида генеральных распределений". Распространение методов непараметрической статистики сдерживается отсутствием учебных пособий по этому предмету. История непараметрических методов начинается с использования критериев знаков Арбетноттом в 1710 г. Во второй половине XIX в. Фехнер и Гальтон стали применять ранги и коэффициенты ранговой корреляции. Работами Спирмена (1904) к ранговым методам было привлечено внимание научной общественности, а работы Колмогорова (1933), Смирнова(1935), Уилкоксона (1945), Сигеля (1956) и др. создали непараметрическую статистику как самостоятельную ветвь математической статистики.
Для определения статистических зависимостей в непараметрической статистике предназначены:
- мода (Мо);
- медиана (Ме);
- критерии Манна-Уитни, Уилкоксона, Хи-квадрат;
- коэффициенты ассоциации (Ф) и контингенции (Q);
- преобразованный коэффициент корреляции Пирсона (φ);
- коэффициент сопряженности Пирсона (С) (для больших выборок);
- коэффициент сопряженности Чупрова (К) (для Mx N-клеточной сопряженности);
- коэффициент ранговой корреляции Спирмена (Rs) и др.
В практической работе психологов и, в частности, в профотборе для статистической оценки связей эмпирических переменных используют следующие коэффициенты:
- а) в шкале наименований: коэффициент согласия Пирсона (χ2), коэффициенты контингенции (Q) и ассоциации (Ô) (для 4-клеточной сопряженности), коэффициенты взаимной сопряженности Пирсона (С) и Чупрова (К) (для mх n-клеточной сопряженности).
- б) в шкале порядков: коэффициент ранговой корреляции Спирмена (Rs).
- в) меры центральной тенденции:
Мода (Мо) - наиболее вероятное появление показателя.
Медиана (Ме) - вариант, приходящийся на середину ранжированного вариационного ряда.
г) меры связи и статистического вывода:
Критерий Манна -Уитни основан на парном сравнении результатов из первой и второй выборок.
Критерий Уилкоксона эквивалентен критерию Манна -Уитни и основан на переходе от наблюдений к их рангам.
Коэффициент согласия Пирсона (χ2) основан на приближении частоты проявления признака в различных выборках, измеренного в номинальной шкале. Расчет осуществляется по формуле:
χ2 = Σ (ni1 — ni2)2 / ni2 ,
где ni1 - частоты тестовых данных: частота (Р1) проявления свойства у первого испытуемого;
ni2 - частоты тестовых данных: частота (Р2) проявления свойства у второго испытуемого.
6) Для определения статистической связи переменных, измеренных в дихотомической шкале наименований, используются коэффициенты контингенции (Q) и ассоциации (Ô).
Теоретическая интерпретация коэффициента ранговой корреляции Спирмена Rs идентична любой статистике из области измерения связей переменных. Если значение Rs более 0.5, то имеет место статистически сильная связь, если менее 0.5 — слабая. Положительные и отрицательные знаки показывают направленность связи (соответственно, прямая и обратная).
Популярность непараметрических методов объясняется широкой областью их применения, устойчивостью выводов, простотой математических средств. Непараметрические критерии значительно менее трудоемки, а при распределениях, далеких от нормального, более эффективны и точны, чем параметрические.
Каковы же основные особенности непараметрических методов и как их можно использовать в психолого-педагогических исследованиях? Непараметрическая статистика, как мы уже упоминали, рассматривает только такие ситуации, в которых о функциональном виде распределений ничего не известно. Единственной априорной информацией считается информация о характере случайных величин (например, непрерывны они или дискретны) и о типе различий между их распределениями. Легко заметить, что многие психологические и педагогические исследования с чисто математической стороны сводимы именно к данному, кругу вопросов. Существенны ли различия в объеме и качестве знаний, усвоенных несколькими группами учащихся, обучаемых различными методами? Можно ли определить, как соотносятся между собой некоторые личностные черты и успехи в овладении определенным видом деятельности? Верно ли, что учителям с более структурированной волевой сферой личности присущ более высокий уровень волевого развития и, в свою очередь, лучшая успешность в осуществлении профессиональной деятельности?
Наиболее часто в педагогике и психологии встречается задача проверки непараметрических гипотез. В чем ее суть? Прежде чем приступить к проведению эксперимента, исследователь обычно выдвигает две взаимоисключающие гипотезы. Одна из них является статистической гипотезой, которую исследователь обычно предполагает отклонить, и называется нулевой гипотезой (Но). В ней выдвигаются различные предположения относительно значений одного или нескольких параметров исходной совокупности. Например, проводится эксперимент по типу социально-психологического тренинга. Затем равные выборки испытуемых, прошедших и не прошедших тренинг сензитивности, исследуются с помощью специальных диагностических методик. Нулевая гипотеза состоит в том, что доля лиц, отвечающих примерно одинаково на вопросы об эффективности межличностных отношений и удовлетворенности ими, будет одинакова для обеих выборок.
Альтернативная гипотеза (H1) фактически отрицает нулевую гипотезу. В нашем случае она предполагает, что значительно больший процент лиц, удовлетворенных межличностными отношениями, находится в выборке, члены которой предварительно обучались общению с помощью активных методов. Таким образом, если альтернативная гипотеза подтвердится (т. е. Но будет отвергнута), исследователь может делать выводы об эффективности метода социально-психологического тренинга. Несколько забегая вперед, укажем, что чем выше абсолютные значения разности критериев значимости, тем более существенны обнаруженные различия в выборках.
Любая задача проверки непараметрических гипотез выглядит следующим образом. Из двух конкурирующих гипотез альтернативная всегда непараметрична, а Но может быть либо простой, либо непараметрической. Поскольку, по крайней мере, одна гипотеза есть класс неизвестных распределений, различие между гипотезами задается в некотором общем виде, не связанном с конкретным видом функции распределения. Требуется предложить процедуру, результатом которой явилось бы решение об истинности одной из гипотез на основании предъявленной выборки (или нескольких выборок).