Непараметрические критерии: Критерий согласия Пирсона (описание)
Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности
Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Итак, пустьпо выборке объема п получено эмпирическое распределение:
варианты……. хi х1 х2 … хs
эмп. частоты... пi п1 п2 ... пs
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты п'i (например, так, как в следующем параграфе). При уровне значимости а требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.
В качестве критерия проверки нулевой гипотезы примем случайную величину
(*)
.Эта величина случайная, так как в различных опытах она принимает различные, заранее не известные значения. Ясно, что чем меньше различаются эмпирические и теоретические частоты, тем меньше величина критерия (*), и, следовательно, он в известной степени характеризует близость Эмпирического и теоретического распределений.
Заметим, что возведением в квадрат разностей частот устраняют возможность взаимного погашения положительных и отрицательных разностей. Делением на достигают уменьшения каждого из слагаемых; в противном случае сумма была бы настолько велика, что приводила бы к отклонению нулевой гипотезы даже и тогда. когда она справедлива. Разумеется, приведенные соображенияне являются обоснованием выбранного критерия, а лишь пояснением.
Доказано, что при п—>∞ закон распределения случайной величины (*) независимо от того, какому закон распределения подчинена генеральная совокупность, стремится к закону распределения χ2 с k степенями свободы Поэтому случайная величина (*) обозначена через χ2, :
сам критерий называют критерием согласия «хи квадрат»
Число степеней свободы находят по равенству k == s—1—г, где s—число групп (частичных интервалов выборки; г—число параметров предполагаемого распределения, которые оценены по данным выборки.
В частности, если предполагаемое распределение—нормальное, то оценивают два параметра (математическское ожидание и среднее квадратическое отклонение), поэтому г =2 и число степеней свободы k==s—1—r =s—1—2=
=s—3.
Если, например, предполагают, что генеральная совокупность распределена по закону Пуассона, то оценивают один параметр К, поэтомуг==1 и k=s—2.
Поскольку односторонний критерий более «жестко» отвергает нулевую гипотезу, чем двусторонний, построим правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости а:
.
Таким образом, правосторонняя критическая область определяется неравенством , а область принятия нулевой гипотезы—неравенством .
Обозначим значение критерия, вычисленное по данным наблюдений, через и сформулируем правило проверки нулевой гипотезы.