Непараметрические критерии проверки гипотез и его виды
Непараметрические методы разработаны для тех ситуаций, когда исследователь ничего не знает о параметрах исследуемой популяции (отсюда и название методов - непараметрические). Говоря более специальным языком, непараметрические методы не основываются на оценке параметров (таких как среднее или стандартное отклонение) при описании выборочного распределения интересующей величины.
Поэтому эти методы иногда также называются свободными от параметров или свободно распределенными.
Непараметрические методы позволяют обрабатывать данные "низкого качества" из выборок малого объема с переменными, про распределение которых мало что или вообще ничего не известно.
По существу, для каждого параметрического критерия имеется, по крайней мере, один непараметрический аналог. Эти критерии можно отнести к одной из следующих групп:
• критерии различия между независимыми выборками
• критерии различия между зависимыми выборками
• критерии зависимости между переменными
Различия между независимыми выборками
Две независимые выборки: U-критерий Манна-Уитни и др.
Обычно, когда имеются две выборки (например, мужчины и женщины), которые вы хотите сравнить относительно среднего значения некоторой изучаемой переменной, вы используете t-критерий для независимых выборок.
Непараметрическими альтернативами параметрического критерия для двух независимых групп являются:
• U критерий Манна-Уитни
• Критерий серий Вальда-Вольфовица
• Двухвыборочный критерий Колмогорова-Смирнова
32. Критерий согласия: Хи квадрат Пирсона и Колмогорова-Смирнова
Критерий Колмогорова-Смирнова Данный критерий также позволяет оценить существенность различий между двумя выборками, в том числе возможно его применение для сравнения эмпирического распределения с теоретическим. Критерий позволяет найти точку, в которой сумма накопленных частот расхождений между двумя распределениями является наибольшей, и оценить достоверность этого расхождения. Нулевая гипотеза H0={различия между двумя распределениями недостоверны (судя по точке максимального накопленного расхождения между ними)}. Схематично алгоритм применения критерия Колмогорова-Смирнова можно представить следующим образом: Проиллюстрируем использование критерия Колмогорова-Смирнова на примере. При изучении творческой активности студентов были получены результаты для экспериментальных и контрольных групп (см. таблицу). Являются ли значимыми различия между контрольной и экспериментальной группами? Уровень усвоения Частота в экспериментальной группе Частота в контрольной группе Хороший 172 чел. 120 чел. Приблизительный 36 чел. 49 чел. Плохой 15 чел. 36 чел. Объём выборки n1=172+36+15=223 n2=120+49+36=205 Вычисляем относительные частоты f, равные частному от деления частот на объём выборки, для двух имеющихся выборок. Далее определяем модуль разности соответствующих относительных частот для контрольной и экспериментальной выборок. В результате исходная таблица примет следующий вид: Относительная частота экспериментальной группы (fэксп) Относительная частота контрольной группы (fконтр) Модуль разности частот |fэксп – fконтр| 172/223≈0.77 120/205≈0.59 0.18 36/223≈0.16 49/205≈0.24 0.08 15/223≈0.07 36/205≈0.17 0.1 Среди полученных модулей разностей относительных частот выбираем наибольший модуль, который обозначается dmax. В рассматриваемом примере 0.18>0.1>0.08, поэтому dmax=0.18. Эмпирическое значение критерия λэмп определяется с помощью формулы: Чтобы сделать вывод о схожести по рассматриваемому критерию между двумя группами, сравним экспериментальное значение критерия с его критическим значением, определяемым по специальной таблице, исходя из уровня значимости . В качестве нулевой гипотезы примем утверждение о том, что сравниваемые группы незначительно отличаются друг от друга по уровню усвоения. При этом нулевую гипотезу следует принять в том случае, если наблюдаемое значение критерия не превосходит его критического значения. Считая, что , по таблице определяем критическое значение критерия: λкр(0,05)=1,36. Таким образом, λэмп=1,86>1,36= λкр. Следовательно, нулевая гипотеза отвергается, и группы по рассмотренному признаку отличаются существенно. Заметим, что объёмы рассматриваемых выборок должны быть достаточно большими: n1≥50, n2≥50. |
Критерий Пирсона
Критерий согласия Пирсона позволяет осуществлять проверку эмпирического и теоретического (либо другого эмпирического) распределений одного признака. Данный критерий применяется, в основном, в двух случаях:
- Для сопоставления эмпирического распределения признака с теоретическим распределением (нормальным, показательным, равномерным либо каким-то иным законом);
- Для сопоставления двух эмпирических распределений одного и того же признака.
Идея метода – определение степени расхождения соответствующих частот ni и ; чем больше это расхождение, тем больше значение
Объемы выборок должны быть не меньше 50 и необходимо равенство сумм частот
Нулевая гипотеза H0={два распределения практически не различаются между собой}; альтернативная гипотеза – H1={расхождение между распределениями существенно}.
Приведем схему применения критерия для сопоставления двух эмпирических распределений:
Рассмотрим применение критерия на следующем примере.
Среди школьников с 1 по 7 класс в течение двух недель проводился опрос об удовлетворенности собственными оценками. Результаты опроса представлены в таблице:
Номер возрастного интервала (соответствует классу) | Число удовлетворенных оценками в первую неделю исследования | Число удовлетворенных оценками на второй неделе исследования |
Можно ли считать, что эмпирическое распределение на первой неделе исследования согласуется с эмпирическим распределением на второй неделе исследования, т.е. структура удовлетворенности ответами учащихся сохранилась в течение данного времени?
Пусть уровень значимости равен 0,05.
Вычислим эмпирическое значение критерия:
По таблице критических точек распределения по заданному уровню значимости 0,05 и числу степеней свободы k=7-1 находим критическую точку
Поскольку то нет оснований отвергать нулевую гипотезу об одинаковом распределении мнений учащихся о своей успеваемости в разные недели.