Статистическая проверка гипотез
При разработке планов статистического контроля и регулирования качества, а также при статистическом анализе полученных результатов приходится решать задачи сравнения. Например, сравнение точности работы станка или измерительной системы со стандартом, сравнение качества продукции нескольких станков и так далее. Для решения этих задач по данным выборочных наблюдений используют статистические критерии, то есть методы статистической проверки гипотез. Рассмотрим некоторые общие положения.
Статистической гипотезой называют любое предположение о виде или параметрах неизвестного закона распределения.
Нулевой гипотезой называют выдвинутую гипотезу, которую нужно проверить, а гипотезу противоположную нулевой, называют конкурирующей.
Под статистическим критерием понимают однозначно определенное правило, устанавливающее условия, при которых проверяемую гипотезу по результатам наблюдений следует либо отвергнуть, либо не отвергнуть. Основу критерия составляет специально составленная выборочная характеристика (статистика) точное или приближенное распределение которой известно, где выборочные наблюдения. Каждый критерий разбивает все множество возможных значений статистики на две непересекающиеся области: критическую область и область принятия гипотезы. Если наблюдаемое значение статистики критерия попадает в критическую область, то гипотезу отвергают. В противном случае гипотезу не отвергают. При использовании статистического критерия возможны четыре случая:
- гипотеза верна и ее принимают согласно критерию;
- гипотеза неверна и ее отвергают согласно критерию;
- гипотеза верна, но ее отвергают согласно критерию (ошибка первого рода);
- гипотеза неверна, но ее принимают согласно критерию (ошибка второго рода).
Статистический критерий не дает логического доказательства или опровержения гипотезы. Так как гипотеза проверяется по результатам выборочных наблюдений, то неизбежно имеет место некоторая, хотя бы и очень малая, вероятность ошибочного решения как первого, так и второго рода. При неограниченном увеличении объема выборки и использовании обоснованного критерия возможно добиться как угодно малых вероятностей обеих ошибок. Однако наиболее часто в практических задачах контроля имеют дело с фиксированным объемом выборки, когда задаются вероятностью ошибки первого рода - так называемым уровнем значимости α.
Выбор уровня значимости ос зависит от сопоставления потерь, связанных с ошибками первого и второго рода. Следует учитывать, что уменьшение α приводит к росту вероятности ошибки второго рода. Поскольку в большинстве практических задач определить величину потерь оказывается весьма затруднительно, то, как правило, пользуются некоторыми стандартными уровнями значимости. К таким значениям можно отнести: 0.1, 0.05, 0.01, 0.005, 0.001. Наиболее часто используют значение α=0.05, которое означает, что в среднем в 5 случаях из 100 мы можем допустить ошибку и отвергнуть гипотезу , в то время, как она справедлива.
Остановимся на правилах выбора критической области. Критическую область следует выбирать так, чтобы вероятность показания в нее была равна уровню значимости ос, если верна нулевая гипотеза , и максимальна, если верна конкурирующая гипотеза . Второе условие выражает требование максимума мощности критерия.
Под мощностью критерия понимают вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза, то есть вероятность не допустить ошибку второго рода (β – вероятность ошибки второго рода).
С целью обеспечения максимума мощности критерия в зависимости от гипотезы выбирают правостороннюю, левостороннюю или двустороннюю критические области. Границы критической области при заданном уровне значимости α находят из соотношений:
- для правосторонней критической области
,
- для двусторонней критической области
,
,
где – левосторонняя, а – правосторонняя границы критической области.
Статистические критерии позволяют либо отвергнуть гипотезу (высказанная гипотеза противоречит данным наблюдений), либо не отвергнуть (гипотеза не противоречит данным наблюдений, а поэтому ее можно принять в качестве одного из допустимых решений). При этом неотрицательный результат не означает, что наше предположение (гипотеза) является единственно подходящим. Поэтому статистически проверенную гипотезу следует рассматривать как достаточно правдоподобное, не противоречащее опыту утверждение.