Задача проверки статистической гипотезы
Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, которое можно проверить по выборке. Как правило, статистические гипотезы делят на гипотезы о законах распределения и гипотезы о параметрах распределения.
Пусть – закон распределения случайной величины X, зависящий от одного параметра . Предположим, что наша гипотеза состоит в утверждении, что . Назовём эту гипотезу нулевой и обозначим её . Альтернативной, или конкурирующей гипотезой, которую обозначим , будет . Перед нами стоит задача проверки гипотезы относительно конкурирующей гипотезы на основании выборки, состоящей из n независимых наблюдений X1, X2,…, Xn. Следовательно, всё возможное множество выборок объёма n можно разделить на два непересекающихся подмножества О и W таких, что проверяемая гипотеза должна быть отвергнута, если наблюдаемая выборка попадает в подмножество W и принята, если выборка принадлежит подмножеству О. Подмножество О называют областью допустимых значений, а подмножество W – критической областью. При формировании критической области возможны ошибки.
Ошибка первого родасостоит в том, нулевая гипотеза отвергается, то есть принимается гипотеза , в то время как в действительности верна гипотеза .
Ошибка второго рода состоит в том, что принимается гипотеза , а в действительности верна гипотеза .
Для любой заданной критической области будем обозначать через – вероятность ошибки первого рода, а через – вероятность ошибки второго рода. Следовательно, можно сказать, что при большом количестве выборок доля ложных заключений равна , если верна гипотеза , и , если верна гипотеза . При фиксированном объёме выборки выбор критической области W позволяет сделать как угодно малой либо , либо .
Существует несколько критериев согласия для проверки законов распределения случайной величины. Мы остановимся лишь на критерии Пирсона – это наиболее часто употребляемый критерий для проверки закона распределения случайной величины.
Сначала нужно разбить всю область изменения случайной величины на 1интервалов (бин). Затем нужно подсчитать, сколько этих величин попадает в каждый бин, подсчитать эмпирические частоты . Чтобы вычислить теоретические частоты нужно вероятность попадания в каждый бин рi умножить на объём выборки . Таким образом, статистика
является случайной величиной, подчиняющейся закону со степенями свободы. В последней формуле – число параметров распределения, определяемы по выборке. Для нормального закона – это два параметра, для закона Пуассона – один и т.д.
Рассчитав значения и выбрав уровень значимости , по таблице – распределения определяют . Если , то гипотезу отвергают, если то гипотезу принимают.
3.2 Проверка выдвинутой гипотезы о законе распределения исходных данных с доверительной вероятностью 0,95 по критерию Пирсона
Используем для проверки критерий согласия Пирсона (критерий ).
Для того чтобы проверить нулевую гипотезу , необходимо вычислить теоретические частоты и наблюдаемое значение , которое является мерой расхождения данных от теоретического закона:
– теоретическая частота (вероятность) попадания в i-тый интервал.
Далее по статистическим таблицам критических точек распределения по заданному уровню значимости и числу степеней свободы необходимо найти критическую точку и сравнить ее с наблюдаемым значением.
Число степеней свободы определяется с учетом числа интервалов и числа связей, наложенных на заданное значение:
– число оцениваемых параметров, равное 2.
k – число связей, равное 7.
Найденное значение сравниваем с наблюдаемым значением :
1) Если нет оснований отвергать гипотезу о распределении выборки по нормальному закону;
2) Если , гипотеза отвергается.
При этом существует вероятность ошибочного принятия нулевой гипотезы, или ошибочного ее отвержения.
№ – номер интервала;
– нижняя граница интервала;
– верхняя граница интервала;
– середина i-го интервала;
– число значений попавших в i-ый интервала;
– теоретическая вероятность попадания в i-тый интервал;
– нормирующие случайные величины относительно найденного среднего;
– функция Лапласа от нормирующего значения yi;
=12,087.
=0,639
Исходя из того, что:
Гипотеза о том, что представленный закон распределения является нормальным, принимается.