Статистический критерий проверки нулевой гипотезы. Наблюдаемое значение критерия
Для проверки нулевой гипотезы используют специально подобранную случайную величину, точное или приближённое распределение которой известно. Обозначим эту величину в целях общности через .
Статистическим критерием (или просто критерием) называют случайную величину , которая служит для проверки нулевой гипотезы.
Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия принимают отношение исправленных выборочных дисперсий: .
Эта величина случайная, потому что в различных опытах дисперсии принимают различные, наперёд неизвестные значения, и распределена по закону Фишера-Снедекора.
Для проверки гипотезы по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают частное (наблюдаемое) значение критерия.
Наблюдаемым значением называют значение критерия, вычисленное по выборкам. Например, если по двум выборкам найдены исправленные выборочные дисперсии и , то наблюдаемое значение критерия .
После выбора определённого критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается, а другая – при которых она принимается.
Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.
Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.
Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если наблюдаемое значение критерия принадлежит области принятия гипотезы – гипотезу принимают.
Поскольку критерий - одномерная случайная величина, все её возможные значения принадлежат некоторому интервалу. Поэтому критическая область и область принятия гипотезы также являются интервалами и, следовательно, существуют точки, которые их разделяют.
Критическими точками (границами) называют точки, отделяющие критическую область от области принятия гипотезы.
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.
Правосторонней называют критическую область, определяемую неравенством > , где - положительное число.
Левосторонней называют критическую область, определяемую неравенством < , где - отрицательное число.
Односторонней называют правостороннюю или левостороннюю критическую область.
Двусторонней называют критическую область, определяемую неравенствами где .
В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами ( в предположении, что >0):
, или равносильным неравенством .
7.4. Критерий c2 как критерий согласия
Критерий c2 как критерий согласия используют при проверке принадлежности эмпирического распределения к теоретическому, например, к нормальному, биноминальному, распределению Пуассона и т. п.
В этом случае значение критерия c2 определяют, исходя из частот (f) эмпирического распределения и частот (fo) теоретического распределения:
.
При этом возможны случаи, когда теоретические частоты заранее известны и когда неизвестны. Во втором случае теоретические частоты определяют на основе теоретического распределения исходя из численности выборки.
При проверке гипотезы о соответствии эмпирического распределения теоретическому сравнивают фактическое значение критерия с табличным . Если меньше , следовательно, эмпирическое распределение соответствует теоретическому. В противном случае эмпирическое распределение не соответствует теоретическому, распределение частот в нем носит другой характер.
Рассмотрим методику применения критерия c2 как критерия согласия.
Пример.В результате учета яйценоскости 50 кур-несушек, содержащихся на птицеферме, был построен интервальный вариационный ряд (табл. 8). Средняя арифметическая ряда равна 228,8, а выборочное среднее квадратическое отклонение – 7,95.
Т а б л и ц а 8