Классификация статистических гипотез.
Нулевой гипотезой (Н0) называют выдвинутое предположение. Альтернативными(конкурирующими) гипотезами (Н1) называют гипотезы, при которых Н0 не выполняется (нарушается).
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание распределения размера детали равно 10 мм, то конкурирующая гипотеза, в частности, может состоять в предположении, что ≠ 10 мм. Кратко это записывают так: H0: = 10 мм; Н1: ≠10 мм. В данном случае имеет место «двусторонняя»альтернативная гипотеза. Если же конкурирующая гипотеза состоит в предположении, что > 10 мм, или наоборот, что < 10 мм, то она является «односторонней»гипотезой.
Простой называют гипотезу, содержащую только одно предположение. Например, предыдущая гипотеза Н0: = 10 мм - простая.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, гипотеза: > 10 - сложная.
Пусть некоторая оценка вычислена по выборке объема N независимых наблюдений случайной величины х. Предположим, что есть основания считать истинное значение оцениваемого параметра Ф равным некоторой величине Фо. Если даже Ф = Фо, то выборочное значение не будет, по-видимому, точно совпадать с Фо из-за выборочной изменчивости статистики . Поэтому возникает следующий вопрос. Если принять гипотезу Ф = Фо, то насколько велико должно быть различие между и Фо, чтобы эту гипотезу следовало отвергнуть как ошибочную? На этот вопрос можно ответить в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между Ф и Фо на основе выборочного распределения параметра Ф. Если вероятность превышения этой разности Ф и заданного уровня Фо мала, то этот уровень следует считать значимым и гипотезу Ф = Фо следует отвергнуть. Если вероятность превышения данной разности не является малой, то наличие этой разности можно отнести за счет обычной статистической изменчивости и гипотезу Ф = Фо можно считать правдоподобной.
«Статистическим критерием» называется правило, по которому принимается или отклоняется гипотеза. Области принятия и отклонения при проверке гипотез для случая, когда оценка параметра Ф распределена по нормальному закону, представлены на рис. 7.1. Интервал значений Ф, при которых гипотезу следует отвергнуть, называют областью отклонения гипотезы или критической областью. Точки, которые разделяют критическую область и область принятия гипотезы, называются «критическими точками». Различают «одностороннюю» (правостороннюю или левостороннюю) и «двустороннюю» (рис. 7.1) критические области.
Рис. 7.1. Области принятия и отклонения при проверке гипотез: p(Ф) - плотность распределения оценки параметра Ф; Ф0 - истинное значение параметра Ф; Ф1-α/2 - нижний уровень оценки; Фα/2 - верхний уровень оценки; α - вероятность выхода оценки за пределы верхнего и нижнего уровней
Поскольку расчеты по определению «критических точек» производятся на основе «выборочного метода», то они всегда имеют вероятностный характер. То есть положение «критических точек» определяется неточно, в результате чего при проверке гипотезы возможны ошибки двух родов:
-«Ошибка первого рода» состоит в том, что нулевая гипотеза отвергается, когда она на самом деле верна. Вероятность допустить ошибку первого рода, выраженная в процентах или в долях целого, называется «уровнем значимостикритерия» (обозначают q или α, см. рис. 7.1, и выражают в долях единицы как целого или в %). Это значит,что с вероятностью P=1 - q (или 100% - q) гипотеза действительно верна. Обычно в инженерных расчетах используют q=5% или q=1% (иначе q=0,05 или q=0,01) в зависимости от степени значимости и необходимой безопасности изделия, для которого деталь предназначена.
«Ошибка второго рода» возникает в том случае, если гипотеза Н0 принимается, когда в действительности она не верна. Для того чтобы найти, какова вероятность допустить ошибку второго рода, необходимо задать определенную величину отклонения истинного значения Ф от гипотетического значения параметра Фо, которое требуется определить. Предположим, например, что истинное значение параметра Ф в действительности равно Фо + d или Фо - d, как показано на рис. 7.2. Если, согласно гипотезе, Ф = Фо, а в действительности Ф = Фо ± d, то вероятность того, что Ф попадает в область принятия гипотезы, т.е. в интервал (Ф1 - α/2; Фα /2), составляет β. Это значит, что вероятность допустить ошибку второго рода при выявлении отклонения ±d от гипотетического значения Фо равна β.
Рис. 7.2. Области принятия и отклонения, соответствующие ошибке второго рода при проверке гипотезы, где d - смещение истинного значения параметра Фо
Анализ графика (рис. 7.2) показывает, что вероятность возникновения ошибки второго рода, в сущности, есть вероятность попадания в область принятия гипотезы при смещении истинного значения. Вероятность возникновения ошибки второго рода принято обозначать β и она выражается горизонтально заштрихованными площадями в области принятия гипотезы, см. рис. 7.2.
Применительно к проверке гипотез, относящихся к области попадания в доверительный интервал (см. главу 6), с ошибками первого и второго рода связывают следующие понятия:
- «риск поставщика» (годная партия продукции ошибочно забракована, в результате чего потери несёт её производитель - ошибка первого рода);
- «риск заказчика» (партия принята, но имеет брак и в результате её поставки потери несёт заказчик - ошибка второго рода).