Проверка статистических гипотез
Одна из часто встречающихся на практике задач, связанных с применением статистических методов, состоит в решении вопроса о том, можно ли на основании данной выборки быть принято или, напротив, отвергнуто некоторое предположение (гипотеза) относительно генеральной совокупности (случайной величины).
Например, новое лекарство испытано на определенном числе людей. Можно ли сделать по данным результатам лечения обоснованный вывод о том, что новое лекарство более эффективно, чем старое?
Процедура сопоставления высказанного предположения (гипотезы) с выборочными данными называется проверкой гипотез.
Задачи статистической проверки гипотез ставятся в следующем виде: относительно некоторой генеральной совокупности высказывается та или иная гипотеза Из этой генеральной совокупности извлекается выборка. Требуется указать правило, при помощи которого можно было бы по выборке решить вопрос о том, следует ли отклонять гипотезу или принять ее. Причем речь не идет о доказательстве гипотезы, а только о принятии или отклонении.
Под статистической гипотезой понимается всякое высказывание (предположение) о генеральной совокупности, проверяемое по выборке.
Гипотезы делятся на гипотезы о параметрах распределения известного вида (параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы).
Одну из гипотез выделяют в качестве основной (или нулевой) и обозначают , а другую, являющуюся логическим отрицанием , т.е. противоположную - в качестве конкурирующей (или альтернативной) гипотезы и обозначают .
Гипотезу, однозначно фиксирующую распределение наблюдений, называют простой (в ней идет речь об одном значении параметра), в противном случае – сложной.
Например, гипотеза , состоящая в том, что математическое ожидание случайной величины равно , т.е. является простой. В качестве альтернативной гипотезы можно рассматривать одну из следующих гипотез: 1) : (сложная гипотеза), 2) : (сложная гипотеза), 3) : (сложная гипотеза), 4 : (простая гипотеза).
Имея две гипотезы и надо на основе выборки принять либо основную гипотезу , либо конкурирующую гипотезу .
Схема проверки нулевой гипотезы:
1) Рассматривая выборочные данные и учитывая конкретные условия задачи, принимают - нулевую гипотезу и - альтернативную гипотезу, конкурирующую с .
2) Так как решение о справедливости гипотезы принимается на основе выборочных данных, могут возникнуть ошибки двух родов:
¨гипотеза отвергается, а на самом деле она верна - это ошибка первого рода; вероятность ошибки первого рода равна уровню значимости т.е.
¨гипотеза принимается, а на самом деле она неверна - это ошибка второго рода, вероятность ошибки второго рода равна т.е.
Соответственно, вероятность принять верную гипотезу равна а вероятность отвергнуть неверную гипотезу равна
3) Используя выборочные данные, вводят статистический критерий - некоторую функцию , зависящую от условий решаемой статистической задачи. Эти функции, являясь случайными величинами, подчинены некоторому известному, затабулированному закону распределения ( распределение, распределение или нормальное распределение).
4) В зависимости от принятого уровня значимости из области допустимых значений функции критерия выделяют критическую область w. Далее руководствуются правилом: если вычисленное по выборке значение критерия попадает в критическую область, то отвергается и принимается гипотеза При этом возможно, что справедлива и, следовательно, совершена ошибка первого рода, вероятность которой , т.е.
Возможны три варианта расположение критической области:
*правосторонняя критическая область, состоящая из интервала где определяется из условия
*левосторонняя критическая область, состоящая из интервала где определяется из условия
*двусторонняя критическая область, состоящая из интервалов и где точки и определяются из условий и
5) По выборочным данным находят числовое значение критерия Если попадает в критическую область , то гипотеза отвергается и принимается альтернативная гипотеза Если не попадает в критическую область, то гипотеза принимается.