Задача проверки статистической гипотезы
Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, которое можно проверить по выборке. Как правило, статистические гипотезы делят на гипотезы о законах распределения и гипотезы о параметрах распределения.
Пусть – закон распределения случайной величины X, зависящий от одного параметра
. Предположим, что наша гипотеза состоит в утверждении, что
. Назовём эту гипотезу нулевой и обозначим её
. Альтернативной, или конкурирующей гипотезой, которую обозначим
, будет
. Перед нами стоит задача проверки гипотезы
относительно конкурирующей гипотезы
на основании выборки, состоящей из n независимых наблюдений X1, X2,…, Xn. Следовательно, всё возможное множество выборок объёма n можно разделить на два непересекающихся подмножества О и W таких, что проверяемая гипотеза
должна быть отвергнута, если наблюдаемая выборка попадает в подмножество W и принята, если выборка принадлежит подмножеству О. Подмножество О называют областью допустимых значений, а подмножество W – критической областью. При формировании критической области возможны ошибки.
Ошибка первого родасостоит в том, нулевая гипотеза отвергается, то есть принимается гипотеза , в то время как в действительности верна гипотеза
.
Ошибка второго рода состоит в том, что принимается гипотеза , а в действительности верна гипотеза
.
Для любой заданной критической области будем обозначать через – вероятность ошибки первого рода, а через
– вероятность ошибки второго рода. Следовательно, можно сказать, что при большом количестве выборок доля ложных заключений равна
, если верна гипотеза
, и
, если верна гипотеза
. При фиксированном объёме выборки выбор критической области W позволяет сделать как угодно малой либо
, либо
.
Существует несколько критериев согласия для проверки законов распределения случайной величины. Мы остановимся лишь на критерии Пирсона – это наиболее часто употребляемый критерий для проверки закона распределения случайной величины.
Сначала нужно разбить всю область изменения случайной величины на 1интервалов (бин). Затем нужно подсчитать, сколько этих величин попадает в каждый бин, подсчитать эмпирические частоты . Чтобы вычислить теоретические частоты нужно вероятность попадания в каждый бин рi умножить на объём выборки
. Таким образом, статистика
является случайной величиной, подчиняющейся закону со
степенями свободы. В последней формуле
– число параметров распределения, определяемы по выборке. Для нормального закона – это два параметра, для закона Пуассона – один и т.д.
Рассчитав значения и выбрав уровень значимости
, по таблице
– распределения определяют
. Если
, то гипотезу
отвергают, если
то гипотезу принимают.
3.2 Проверка выдвинутой гипотезы о законе распределения исходных данных с доверительной вероятностью 0,95 по критерию Пирсона
Используем для проверки критерий согласия Пирсона (критерий ).
Для того чтобы проверить нулевую гипотезу , необходимо вычислить теоретические частоты и наблюдаемое значение
, которое является мерой расхождения данных от теоретического закона:
– теоретическая частота (вероятность) попадания в i-тый интервал.
Далее по статистическим таблицам критических точек распределения по заданному уровню значимости
и числу степеней свободы
необходимо найти критическую точку
и сравнить ее с наблюдаемым значением.
Число степеней свободы определяется с учетом числа интервалов и числа связей, наложенных на заданное значение:
– число оцениваемых параметров, равное 2.
k – число связей, равное 7.
Найденное значение сравниваем с наблюдаемым значением
:
1) Если нет оснований отвергать гипотезу о распределении выборки по нормальному закону;
2) Если , гипотеза отвергается.
При этом существует вероятность ошибочного принятия нулевой гипотезы, или ошибочного ее отвержения.
№ – номер интервала;
– нижняя граница интервала;
– верхняя граница интервала;
– середина i-го интервала;
– число значений попавших в i-ый интервала;
– теоретическая вероятность попадания в i-тый интервал;
– нормирующие случайные величины относительно найденного среднего;
– функция Лапласа от нормирующего значения yi;
=12,087.
=0,639
Исходя из того, что:
Гипотеза о том, что представленный закон распределения является нормальным, принимается.