Критерии согласия для дисперсий
против
Для проверки нулевой гипотезы используется критерий отношений дисперсий Фишера.
.
Так как суммы квадратов отклонений нормально распределенных случайных величин от их средних значений имеют распределение c2, то числитель и знаменатель представляют собой величины с распределением c2, поделенные соответственно на n1 и n2, и следовательно, их отношение имеет F-распределение с n1-1 и n2-1 степенями свободы.
Общепринято и так построены таблицы F-распределения что в качестве числителя берется большая из дисперсий, и поэтому определяется только одна критическая точка, соответствующая выбранному уровню значимости.
U критерий Маана-Уитни
Критерий Манна-Уитни представляет непараметрическую альтернативу t-критерия для независимых выборок.
Критерий Манна-Уитни предполагает, что рассматриваемые переменные измерены, по крайней мере, в порядковой шкале (ранжированы). Интерпретация теста по существу похожа на интерпретацию результатов t-критерия для независимых выборок, за исключением того, что U критерий вычисляется, как сумма индикаторов попарного сравнения элементов первой выборки с элементами второй выборки.
U критерий - наиболее мощная (чувствительная) непараметрическая альтернатива t-критерия для независимых выборок; фактически, в некоторых случаях он имеет даже большую мощность, чем t-критерий.
Если объем выборки больше 20, то распределение выборки для U статистики быстро сходится к нормальному распределению.
Поэтому вместе с U статистикой часто показываются z значения (для нормального распределения и соответствующее p-значение.
Проверим гипотезу о принадлежности сравниваемых независмых выборок к одной и той же генеральной совокупности с помощью непараметрического U-критерия Манна-Уитни. Сравним результаты, полученные в примере 1 для 2-го и 3-го столбцов таблицы по критерий Стьюдента, с результатами непараметрического сравнения. Для расчета U-критерия расположим варианты сравниваемых выборок в порядке возрастания в один обобщенный ряд и присвоим вариантам обобщенного ряда ранги от 1 до n1 + n2. Первая строка представляет собой варианты первой выборки, вторая - второй выборки, третья - соответствующие ранги в обобщенном ряду:
2,5 | 2,5 | 19,5 | 19,5 | ||||||||||||||||
Надо обратить внимание, что если имеются одинаковые варианты, им присваивается средний ранг, однако значение последнего ранга должно быть равно n1 + n2 (в нашем случае 20). Это правило используют для проверки правильности ранжирования.
Отдельно для каждой выборки рассчитываем суммы рангов их вариант R1 и R2. В нашем случае:
R1 = 1 + 2,5 + 2,5 + 5 + 5 + 9 + 9 + 9 + 12 + 14 = 69
R2 = 5 + 9 + 9 + 14 + 14 + 17 + 17 +17 + 19,5 + 19,5 = 141
Для проверки правильности вычислений можно воспользоваться другим правилом: R1 + R2 = 0,5 * (n1 + n2) * (n1 + n2 + 1). В нашем случае R1 + R2 = 210.
Статистика U1 = 69 - 10*11/2 = 14; U2 = 141 - 10*11/2 = 86.
Для проверки одностороннего критерия выбираем минимальную статистику U1 = 14 и сравниваем ее с критическим значением для n1 = n2 = 10 и уровня значимости 1%, равным 19. Так как вычисленное значение критерия меньше табличного, нулевая гипотеза отвергается на выбранном уровне значимости, и различия между выборками признаются статистически значимыми.