Следует отметить, что статистическими методами гипотезу можно только опровергнуть или неопровергнуть, но не доказать.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки.
ОПРЕДЕЛЕНИЕ: Статистическая гипотеза - это предположение о виде распределения или о величинах неизвестных параметров генеральной совокупности, которая может быть проверена на основании выборочных показателей.
Примеры статистических гипотез:
1.Генеральная совокупность распределена по нормальному закону Гаусса.
2.Дисперсии двух нормальных совокупностей равны между собой.
Гипотезы типа «на Марсе есть жизнь», «в 2023г земля может сойти со своей орбиты» (Нострадамус) не являются статистическими, так как в них не присутствуют ни закон распределения, ни параметры.
ОПРЕДЕЛЕНИЕ: Статистические гипотезы о параметрах распределения известного вида называются параметрическими гипотезами, а гипотезы о виде неизвестного распределения называются непараметрическими гипотезами.
ОПРЕДЕЛЕНИЕ: Основная гипотеза, которая проверяется, называется нулевой гипотезой и обозначается Н0.
ОПРЕДЕЛЕНИЕ: Альтернативной гипотезой Н1, называется гипотеза, конкурирующая с нулевой, то есть противоречащая ей.
ОПРЕДЕЛЕНИЕ: Гипотезу, содержащую только одно предположение называют простой. Например, гипотеза Н0: a=a0- простая. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, Н0: а>5.
ОПРЕДЕЛЕНИЕ: Правило, по которому принимается решение принять или отклонить гипотезу Н0 называется статистическим критерием проверки гипотезы Н0.
Проверку гипотез осуществляют на основании результатов выборки X1,X2,…,Xn , из которых формируют функцию выборки Tn=T(X1,X2,…,Xn ), называемой статистикой критерия.
Основной принцип проверки гипотез состоит в следующем:
множество возможных значений статистики критерия Tn разбивается на два непересекающихся подмножества: критическую область S, т.е. область отклонения гипотезы Н0 и область принятия этой гипотезы. Если фактически наблюдаемое значение статистики критерия (т.е. значение критерия, вычисленное по выборке Tнабл=T(X1,X2,…,Xn )) попадает в критическую область S, то основная гипотеза Н0 отклоняется и принимается альтернативная гипотеза Н1, если же Тнабл попадает в , то принимается Н0, а Н1 отклоняется.
Решение об отклонении и принятии статистической гипотезы принимается по выброчным данным. Поэтому приходится считаться и с возможностью ошибочного решения.
Различают ошибки двух родов.
ОПРЕДЕЛЕНИЕ: Ошибка первого рода состоит в том, что будет отвергнута нулевая гипотеза Н0, в то время как она верна.
ОПРЕДЕЛЕНИЕ: Ошибка второго рода состоит в том, что будет принята нулевая гипотеза Н0, в то время как верной является альтернативная гипотеза Н1.
Гипотеза Н0 | Отвергается | Принимается |
Верна Неверна | Ошибка 1-го рода Нет ошибки | Нет ошибки Ошибка второго рода |
ОПРЕДЕЛЕНИЕ: Вероятность допустить ошибку 1-го рода называется уровнем значимости критерия и обозначается через a(альфа).
Вероятность ошибки 2-го рода обозначается через b(бета). Тогда a=Р(отвергнуть Н0/Н0 верна) или a=Р(Н1/Н0)
b=Р(принять Н0/Н0 неверна) или b=Р(Н0 /Н1)
ОПРЕДЕЛЕНИЕ: Величина (1- b) , то есть вероятность недопущения ошибки 2-го рода называется мощностью критерия. Следовательно, мощность- это вероятность отклонения нулевой гипотезы, когда она ложна;
1-b=Р(принять Н1/Н1 верна)
чем больше мощность критерия, тем вероятность ошибки 2-го рода меньше, что, конечно, желательно.
Естественным является желание выбрать a как можно меньше, но тогда вероятность ошибки второго рода b может оказатся слишком большой. Разумное соотношение между a и b находят, исходя из тяжести последствий каждой из ошибок.
Методика проверки гипотез сводится к следующему:
- Располагая выборкой X1,X2,…,Xn (исходя из содержания задачи) формируют нулевую гипотезу Н0 и альтернативную Н1.
- Задается уровень значимости.
- Для полученной реализации выборки Х=(X1,X2,…,Xn ) подсчитывают значение критерия, то есть Tнабл=T(X1,X2,…,Xn )=t. В каждом конкретном случае подбирают статистику критерия Tn=T(X1,X2,…,Xn ) обычно из перечисленных ниже U-нормальное распределение, Х2-распределение хи-квадрат (Пирсона), t-распределение Стьюдента, F-распределение Фишера.
- По статистике критерия Tn и уровню значимости a определяют критическую точку tкр, то есть границу, отделяющую область S от . Для каждого критерия имеются соответствующие таблицы, по которым и находят критическую точку, удовлетворяющую приведенным выше соотношениям.
- Если tÎS (например, t> tкр для правосторонней области S), то нулевую гипотезу Н0 отвергают; если же tÎ (t <tкр), то нет оснований, чтобы отвергнуть гипотезу Н0.