Процедура проверки нулевой гипотезы.
Глава 3. Проверка статистических гипотез
Статистическая гипотеза
Статистической гипотезой называют предположение либо о виде распределения генеральной совокупности (закон распределения неизвестен), либо о значениях неизвестных параметров известного закона распределения. Например, статистическими являются гипотезы:
1) генеральная совокупность распределена по закону Пуассона;
2) математическое ожидание а нормально распределенной генеральной совокупности равно числу а0;
3) дисперсии двух нормальных совокупностей равны между собой.
Статистические гипотезы делятся на параметрические (в них говорится о значениях параметров известного распределения) и непараметрические (в них высказывается предположение о виде закона распределения). Например, гипотеза 1) является непараметрической, а гипотезы 2) и 3) – параметрическими.
Наряду с проверяемой гипотезой (ее называют нулевой или основной Н0.) рассматривают и противоречащую ей гипотезу (ее называют конкурирующей или альтернативной Н1). Нулевая и альтернативная гипотеза взаимно исключают друг друга. Процедура проверки применяется к нулевой гипотезе Н0. Если в результате проверки нулевую гипотезу Н0 оказывается целесообразней отвергнуть, то принимается альтернативная гипотеза.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что а ¹10. Коротко это записывают так: Н0: а=10; Н1: а¹10.
Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Нулевая гипотеза– это простая гипотеза, в ней говорится о конкретных значениях параметров или о конкретном распределении. Альтернативная гипотеза сложная, в ней подразумевается бесконечно много возможностей.
Процедура проверки нулевой гипотезы.
Для проверки нулевой гипотезы используют специально подобранную случайную величину (выборочную статистику) К, точное или приближенное распределение которой известно в предположении справедливости нулевой гипотезы Н0. Эта случайная величина К называется статистическим критерием.
После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества: одно из них содержит значения критерия, при которых нулевая гипотеза отвергается (оно называется критической областью или областью отвержения гипотезы), а другое – те значения, при которых она принимается (область принятия гипотезы).При справедливости нулевой гипотезы Н0 вероятность того, что случайная величина К примет значения из области принятия гипотезы, велика, а вероятность того, что случайная величина К примет значения из критической области, мала. Вероятность попадания в критическую область называется уровнем значимости и обозначается буквой .Тогда вероятность попадания в область принятия гипотезы Н0 равна .
По выборке, извлеченной из генеральной совокупности, вычисляют наблюдаемое значение критерия К – число Кнабл. Если это число принадлежит критической области, то гипотеза Н0 отвергается, как противоречащая опытным данным. Справедливой в этом случае считается альтернативная гипотеза Н1. Если же число Кнабл принадлежит области принятия гипотезы Н0, то эта гипотеза считается согласующейся с опытными данными.
В зависимости от условия эксперимента критическую область можно выбрать двусторонней, левосторонней и правосторонней. Критическая область строится в зависимости от вида конкурирующей гипотезы. Обозначим – плотность распределения случайной величины К при условии справедливости гипотезы Н0.
Двусторонняя критическая область на рис. 1 образованна интервалами (– ¥, k1кр) и (k2кр, ¥). Интервал (k1кр, k2кр) – область принятия нулевой гипотезы. Площади под кривой на интервалах (– ¥, k1кр) и (k2кр, ¥) равны каждая.
Правосторонняя критическая область на рис. 2 образованна интервалом (k2кр, ¥). Интервал (– ¥, k1кр) – область принятия нулевой гипотезы. Площадь под кривой на интервале (k2кр, ¥) равна .
Левосторонняя критическая область на рис. 3 образованна интервалом (– ¥, k1кр). Интервал (k2кр, ¥) – область принятия нулевой гипотезы. Площадь под кривой на интервале (– ¥, k1кр) равна .