Статистическая проверка гипотез

При разработке планов статистического контроля и регулирования качества, а также при статистическом анализе полученных результатов приходится решать задачи сравнения. Например, сравнение точности работы станка или измерительной системы со стандартом, сравнение качества продукции нескольких станков и так далее. Для решения этих задач по данным выборочных наблюдений используют статистические критерии, то есть методы статистической проверки гипотез. Рассмотрим некоторые общие положения.

Статистической гипотезой называют любое предположение о виде или параметрах неизвестного закона распределения.

Нулевой гипотезой (Но) называют выдвинутую гипотезу, которую нужно проверить, а гипотезу (H1), противоположную нулевой, называют конкурирующей.

Под статистическим критерием понимают однозначно определенное правило, устанавливающее условия, при которых проверяемую гипотезу (Но) по результатам наблюдений следует либо отвергнуть, либо не отвергнуть. Основу критерия составляет специально составленная выборочная характеристика (статистика) статистическая проверка гипотез - student2.ru статистическая проверка гипотез - student2.ru статистическая проверка гипотез - student2.ru , точное или приближенное распределение которой известно, где статистическая проверка гипотез - student2.ru – выборочные наблюдения. Каждый критерий разбивает все множество возможных значений статистики на две непересекающиеся области: критическую область и область принятия гипотезы. Если наблюдаемое значение статистики критерия попадает в критическую область, то гипотезу (Но) отвергают. В противном случае гипотезу не отвергают. При использовании статистического критерия возможны четыре случая:

–гипотеза Но верна и ее принимают согласно критерию;

–гипотеза Но неверна и ее отвергают согласно критерию;

–гипотеза Но верна, но ее отвергают согласно критерию (ошибка первого рода);

–гипотеза Но неверна, но ее принимают согласно критерию (ошибка второго рода).

Статистический критерий не дает логического доказательства или опровержения гипотезы. Так как гипотеза Но проверяется по результатам выборочных наблюдений, то неизбежно имеет место некоторая, хотя бы и очень малая, вероятность ошибочного решения как первого, так и второго рода. При неограниченном увеличении объема выборки и использовании обоснованного критерия возможно добиться как угодно малых вероятностей обеих ошибок. Однако наиболее часто в практических задачах контроля имеют дело с фиксированным объемом выборки, когда задаются вероятностью ошибки первого рода - так называемым уровнем значимости статистическая проверка гипотез - student2.ru .

Выбор уровня значимости статистическая проверка гипотез - student2.ru зависит от сопоставления потерь, связанных с ошибками первого и второго рода. Следует учитывать, что уменьшение α приводит к росту вероятности ошибки второго рода. Поскольку в большинстве практических задач определить величину потерь оказывается весьма затруднительно, то, как правило, пользуются некоторыми стандартными уровнями значимости. К таким значениям можно отнести: 0.1, 0.05, 0.01, 0.005, 0.001. Наиболее часто используют значение α=0.05, которое означает, что в среднем в 5 случаях из 100 мы можем допустить ошибку и отвергнуть гипотезу Но, в то время, как она справедлива.

Остановимся на правилах выбора критической области. Критическую область следует выбирать так, чтобы вероятность попадания в нее была равна уровню значимости статистическая проверка гипотез - student2.ru , если верна нулевая гипотеза Но, и максимальна, если верна конкурирующая гипотеза H1. Второе условие выражает требование максимума мощности критерия.

Под мощностью критерия понимают вероятность того, что нулевая гипотеза Но будет отвергнута, если верна конкурирующая H1 гипотеза, то есть вероятность (1–β) не допустить ошибку второго рода (β – вероятность ошибки второго рода).

С целью обеспечения максимума мощности критерия в зависимости от гипотезы H1 выбирают правостороннюю, левостороннюю или двустороннюю критические области. Границы критической области при заданном уровне значимости α находят из соотношений:

– для правосторонней критической области

статистическая проверка гипотез - student2.ru

– для двусторонней критической области

статистическая проверка гипотез - student2.ru

статистическая проверка гипотез - student2.ru ,

где статистическая проверка гипотез - student2.ru – левосторонняя, а статистическая проверка гипотез - student2.ru – правосторонняя границы критической области.

Статистические критерии позволяют либо отвергнуть гипотезу (высказанная гипотеза противоречит данным наблюдений), либо не отвергнуть (гипотеза не противоречит данным наблюдений, а поэтому ее можно принять в качестве одного из допустимых решений). При этом неотрицательный результат не означает, что наше предположение (гипотеза) является единственно подходящим. Поэтому статистически проверенную гипотезу следует рассматривать как достаточно правдоподобное, не противоречащее опыту утверждение.

ПРЕДВАРИТЕЛЬНЫЙ ВЫБОР ЗАКОНА РАСПРЕДЕЛЕНИЯ

Большинство применяемых в практике контроля статистических методов основано на предположении, что распределение контролируемого признака подчиняется определенному теоретическому закону (нормальному, биноминальному, пуассоновскому и так далее) с параметрами, либо оцениваемыми по выборке, либо заранее известными. Применению этих методов должна предшествовать проверка по данным выборочных наблюдений гипотезы о законе распределения.

Чаще всего на практике имеют дело с нормальным распределением. Чем это объясняется? Ответ на этот вопрос дан А.М.Ляпуновым в центральной предельной теореме теории вероятности. Приведем следствие из нее: если случайная величина X представляет собой сумму очень большого числа взаимно независимых случайных величин, влияние каждой из которых на всю сумму ничтожно мало, то X имеет распределение, близкое к нормальному.

Функция плотности нормального закона распределения имеет вид статистическая проверка гипотез - student2.ru , а интегральная функция распределения - статистическая проверка гипотез - student2.ru

У нормального распределения два параметра (r =2): математическое ожидание статистическая проверка гипотез - student2.ru и среднее квадратическое отклонение статистическая проверка гипотез - student2.ru . Их оцениваем по выборке: статистическая проверка гипотез - student2.ru .

Кривая нормального распределения симметрична относительно прямой статистическая проверка гипотез - student2.ru .

статистическая проверка гипотез - student2.ru

1) Для нормального закона средняя арифметическая статистическая проверка гипотез - student2.ru , мода статистическая проверка гипотез - student2.ru и медиана статистическая проверка гипотез - student2.ru равноправны, как характеристики центра распределения:

статистическая проверка гипотез - student2.ru

У нас: статистическая проверка гипотез - student2.ru . Как видно, значения этих величин отличаются друг от друга. Это можно объяснить тем, что три интервала имеют одинаковую частоту, которая является максимальной.

2) У кривой нормального распределения коэффициенты асимметрии и эксцесса равны нулю.

У нас: статистическая проверка гипотез - student2.ru . Как видно, значение коэффициента асимметрии можно считать равным нулю, тогда как значение коэффициента эксцесса значительно отличается от нуля. Это можно объяснить неоднородностью статистического материала.

3) В случае нормального распределения справедливо следующее условие:

статистическая проверка гипотез - student2.ru .

Проверим выполнение этого условия для нашего примера. В нашем случае выборочные коэффициенты асимметрии и эксцесса равны статистическая проверка гипотез - student2.ru , следовательно, условие выполнено, а именно для статистическая проверка гипотез - student2.ru : статистическая проверка гипотез - student2.ru , статистическая проверка гипотез - student2.ru ; для статистическая проверка гипотез - student2.ru статистическая проверка гипотез - student2.ru , статистическая проверка гипотез - student2.ru

4) На практике для выдвижения гипотезы о нормальном распределении используют правило 3-х сигм: если случайная величина распределена нормально, то абсолютная величина её отклонения от математического ожидания не превосходит утроенного среднеквадратического отклонения, т.е. все значения случайной величины должны попасть в интервал: статистическая проверка гипотез - student2.ru .

В нашем случае все значения величины попадают в интервал статистическая проверка гипотез - student2.ru , равный статистическая проверка гипотез - student2.ru , т.к. статистическая проверка гипотез - student2.ru

статистическая проверка гипотез - student2.ru

Рисунок 5 - Правило 3-х сигм.

Таким образом, у нас есть основания предположить, что изучаемая случайная величина распределена по нормальному закону (нулевая гипотеза)

статистическая проверка гипотез - student2.ru статистическая проверка гипотез - student2.ru .

Наши рекомендации