Проверка гипотез о числовых значениях параметров
Рассмотрим несколько примеров статистических критериев, предназначенных для проверки простых основных гипотез относительно числовых значений параметров анализируемых законов распределения вероятностей, т.е. речь идет о проверке основной («нулевой») гипотезы
против альтернативы или ,
где и – заданные числовые значения параметра, который участвует в модельном описании функции распределения вероятностей анализируемой случайной величины (т.е. ).
Критерии проверки гипотез о числовом значении параметра биноминального распределения
Рассматриваемая задача относится к анализу результатов серии независимых испытаний Бернулли. При этом в имеющейся у нас выборке объема интересующее нас событие произошло раз. Можно интерпретировать эту серию (выборку) как единственное наблюдение -биномиальной случайной величины в ситуации, когда параметр известен, а параметр нет.
Найдем критическую статистику критерия, опираясь на критерий отношения правдоподобия, как на наиболее мощный среди всех других возможных критериев. При этом для удобства будем работать не самим отношением правдоподобия, а с его логарифмом.
Функция правдоподобия биномиального закона с параметрами и при единственном наблюдении имеет вид:
.
Критическая статистика критерия , определяемая логарифмом отношения правдоподобия при произвольном значении параметра по отношению к основному гипотетическому , будет равна
. (1)
Достаточно большие значения говорят о большей правдоподобности конкурирующей гипотезы , т.е. о необходимости отвергнуть основную гипотезу .
Для того чтобы построить критерий при заданном значении уровня значимости , нужно определить такое значение , при котором
. (2)
А для того, чтобы вычислить ошибку второго рода или мощность критерия , нужно вычислить вероятность
. (3)
Из (1) следует, что обе эти задачи решаются, если мы будем знать распределение случайной величины как при условии справедливости «нулевой» гипотезы (т.е. при значении параметра, равном заданной величине ), так и при условии справедливости любой альтернативы. Но признак , по построению, есть биномиально распределенная случайная величина со значением параметра , определяемым в зависимости от того, в условиях справедливости какой из гипотез мы ее рассматриваем.
Поэтому в дальнейшем в качестве критической статистики будем рассматривать случайную величину, распределенную по биномиальному закону с параметрами . Рассмотрим возможные варианты анализа задачи.
Вариант 1. проверяется простая гипотеза при простой альтернативе , причем . Тогда смысл неравенств (2) и (3) сохраняется при замене на , а именно по заданному уровню значимости требуется найти такое , что
. (2¢)
Но
. (2¢¢)
Следовательно, требуется решить уравнение (2¢¢) относительно . Обычно для этого используют нормальное или пуассоновское приближение, а именно:
· если гипотетическая величина , а число наблюдений составляет хотя бы несколько десятков, то используют теорему Муавра-Лапласа о приближенной (асимптотической) стандартной нормальности случайной величины
.
Тогда при
. (2¢¢¢)
Следовательно, аргумент функции стандартного нормального распределения является квантилем уровня этого распределения (квантилем уровня непрерывной случайной величины называется такое возможное значение : ). Определив из таблиц величину , получим
. (4)
Из (4) определяем величину , на которой основано правило проверки гипотезы : если окажется, что , то гипотеза отвергается (с вероятностью ошибки, приблизительно равной ).
Ошибка второго рода этого критерия вычисляется также с использованием нормальной аппроксимации биномиального закона, но при значении параметра :
. (5)
· если гипотетическая величина близка к нулю или единице (т.е. или ), а число наблюдений, как и в предыдущем случае, составляет хотя бы несколько десятков, то для вычисления вероятностей события вида , где – случайная величина, распределенная по биномиальному закону с параметрами , лучше использовать аппроксимацию по закону Пуассона, т.е.
. (6)
С помощью таблиц распределения Пуассона с параметром находим из условия
. (7)
Затем вычисляем вероятность ошибки второго рода
. (8)
(функция обозначает функцию распределения закона Пуассона с параметром )
Вариант 2. Проверяется простая гипотеза при простой альтернативе , причем . В этом случае критическая константа находится из условия
.
Схема решения такая же, как в варианте 1 с заменой смысла неравенств на противоположный в формулах (2¢), (2¢¢), (5), (7) и (8).
Вариант 3. Проверяется простая гипотеза против сложной альтернативы . В этом случае одинаково неестественными (с точки зрения справедливости гипотезы ) будут большие отклонения от как в одну, так и в другую сторону. Поэтому
· при использовании нормальной аппроксимации следует находить константу , заменив при этом на . Тогда гипотеза отвергается, если
,
где – квантиль уровня стандартного нормального распределения.
· При использовании аппроксимации с помощью закона Пуассона нужно вычислить две критические константы: -ную и -ную точки (соответственно и ) распределения Пуассона с параметром . Гипотеза будет приниматься, если , и отвергаться в противном случае.
Пример.
Пример.