Статистическая проверка гипотез
При разработке планов статистического контроля и регулирования качества, а также при статистическом анализе полученных результатов приходится решать задачи сравнения. Например, сравнение точности работы станка или измерительной системы со стандартом, сравнение качества продукции нескольких станков и так далее. Для решения этих задач по данным выборочных наблюдений используют статистические критерии, то есть методы статистической проверки гипотез. Рассмотрим некоторые общие положения.
Статистической гипотезой называют любое предположение о виде или параметрах неизвестного закона распределения.
Нулевой гипотезой (Но) называют выдвинутую гипотезу, которую нужно проверить, а гипотезу (H1), противоположную нулевой, называют конкурирующей.
Под статистическим критерием понимают однозначно определенное правило, устанавливающее условия, при которых проверяемую гипотезу (Но) по результатам наблюдений следует либо отвергнуть, либо не отвергнуть. Основу критерия составляет специально составленная выборочная характеристика (статистика) , точное или приближенное распределение которой известно, где – выборочные наблюдения. Каждый критерий разбивает все множество возможных значений статистики на две непересекающиеся области: критическую область и область принятия гипотезы. Если наблюдаемое значение статистики критерия попадает в критическую область, то гипотезу (Но) отвергают. В противном случае гипотезу не отвергают. При использовании статистического критерия возможны четыре случая:
–гипотеза Но верна и ее принимают согласно критерию;
–гипотеза Но неверна и ее отвергают согласно критерию;
–гипотеза Но верна, но ее отвергают согласно критерию (ошибка первого рода);
–гипотеза Но неверна, но ее принимают согласно критерию (ошибка второго рода).
Статистический критерий не дает логического доказательства или опровержения гипотезы. Так как гипотеза Но проверяется по результатам выборочных наблюдений, то неизбежно имеет место некоторая, хотя бы и очень малая, вероятность ошибочного решения как первого, так и второго рода. При неограниченном увеличении объема выборки и использовании обоснованного критерия возможно добиться как угодно малых вероятностей обеих ошибок. Однако наиболее часто в практических задачах контроля имеют дело с фиксированным объемом выборки, когда задаются вероятностью ошибки первого рода - так называемым уровнем значимости .
Выбор уровня значимости зависит от сопоставления потерь, связанных с ошибками первого и второго рода. Следует учитывать, что уменьшение α приводит к росту вероятности ошибки второго рода. Поскольку в большинстве практических задач определить величину потерь оказывается весьма затруднительно, то, как правило, пользуются некоторыми стандартными уровнями значимости. К таким значениям можно отнести: 0.1, 0.05, 0.01, 0.005, 0.001. Наиболее часто используют значение α=0.05, которое означает, что в среднем в 5 случаях из 100 мы можем допустить ошибку и отвергнуть гипотезу Но, в то время, как она справедлива.
Остановимся на правилах выбора критической области. Критическую область следует выбирать так, чтобы вероятность попадания в нее была равна уровню значимости , если верна нулевая гипотеза Но, и максимальна, если верна конкурирующая гипотеза H1. Второе условие выражает требование максимума мощности критерия.
Под мощностью критерия понимают вероятность того, что нулевая гипотеза Но будет отвергнута, если верна конкурирующая H1 гипотеза, то есть вероятность (1–β) не допустить ошибку второго рода (β – вероятность ошибки второго рода).
С целью обеспечения максимума мощности критерия в зависимости от гипотезы H1 выбирают правостороннюю, левостороннюю или двустороннюю критические области. Границы критической области при заданном уровне значимости α находят из соотношений:
– для правосторонней критической области
– для двусторонней критической области
,
где – левосторонняя, а – правосторонняя границы критической области.
Статистические критерии позволяют либо отвергнуть гипотезу (высказанная гипотеза противоречит данным наблюдений), либо не отвергнуть (гипотеза не противоречит данным наблюдений, а поэтому ее можно принять в качестве одного из допустимых решений). При этом неотрицательный результат не означает, что наше предположение (гипотеза) является единственно подходящим. Поэтому статистически проверенную гипотезу следует рассматривать как достаточно правдоподобное, не противоречащее опыту утверждение.
ПРЕДВАРИТЕЛЬНЫЙ ВЫБОР ЗАКОНА РАСПРЕДЕЛЕНИЯ
Большинство применяемых в практике контроля статистических методов основано на предположении, что распределение контролируемого признака подчиняется определенному теоретическому закону (нормальному, биноминальному, пуассоновскому и так далее) с параметрами, либо оцениваемыми по выборке, либо заранее известными. Применению этих методов должна предшествовать проверка по данным выборочных наблюдений гипотезы о законе распределения.
Чаще всего на практике имеют дело с нормальным распределением. Чем это объясняется? Ответ на этот вопрос дан А.М.Ляпуновым в центральной предельной теореме теории вероятности. Приведем следствие из нее: если случайная величина X представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то X имеет распределение, близкое к нормальному.
Функция плотности нормального закона распределения имеет вид , а интегральная функция распределения -
У нормального распределения два параметра (r =2): математическое ожидание и среднее квадратическое отклонение . Их оцениваем по выборке: .
Кривая нормального распределения симметрична относительно прямой .
1) Для нормального закона средняя арифметическая , мода и медиана равноправны, как характеристики центра распределения:
У нас: . Как видно, значения этих величин отличаются друг от друга. Это можно объяснить тем, что три интервала имеют одинаковую частоту, которая является максимальной.
2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.
У нас: . Как видно, значение коэффициента асимметрии можно считать равным нулю, тогда как значение коэффициента эксцесса значительно отличается от нуля. Это можно объяснить неоднородностью статистического материала.
3) В случае нормального распределения справедливо следующее условие:
.
Проверим выполнение этого условия для нашего примера. В нашем случае выборочные коэффициенты асимметрии и эксцесса равны , следовательно, условие выполнено, а именно для : , ; для ,
4) На практике для выдвижения гипотезы о нормальном распределении используют правило 3-х сигм: если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения, т.е. все значения случайной величины должны попасть в интервал: .
В нашем случае все значения величины попадают в интервал , равный , т.к.
Рисунок 5 - Правило 3-х сигм.
Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза)
.