Проверка гипотез о числовых значениях параметров
Рассмотрим несколько примеров статистических критериев, предназначенных для проверки простых основных гипотез относительно числовых значений параметров анализируемых законов распределения вероятностей, т.е. речь идет о проверке основной («нулевой») гипотезы
против альтернативы или
,
где и
– заданные числовые значения параметра, который участвует в модельном описании функции распределения вероятностей анализируемой случайной величины
(т.е.
).
Критерии проверки гипотез о числовом значении параметра биноминального распределения
Рассматриваемая задача относится к анализу результатов серии независимых испытаний Бернулли. При этом в имеющейся у нас выборке объема
интересующее нас событие произошло
раз. Можно интерпретировать эту серию (выборку) как единственное наблюдение
-биномиальной случайной величины в ситуации, когда параметр
известен, а параметр
нет.
Найдем критическую статистику критерия, опираясь на критерий отношения правдоподобия, как на наиболее мощный среди всех других возможных критериев. При этом для удобства будем работать не самим отношением правдоподобия, а с его логарифмом.
Функция правдоподобия биномиального закона с параметрами и
при единственном наблюдении
имеет вид:
.
Критическая статистика критерия , определяемая логарифмом отношения правдоподобия при произвольном значении параметра
по отношению к основному гипотетическому
, будет равна
. (1)
Достаточно большие значения говорят о большей правдоподобности конкурирующей гипотезы
, т.е. о необходимости отвергнуть основную гипотезу
.
Для того чтобы построить критерий при заданном значении уровня значимости , нужно определить такое значение
, при котором
. (2)
А для того, чтобы вычислить ошибку второго рода или мощность критерия
, нужно вычислить вероятность
. (3)
Из (1) следует, что обе эти задачи решаются, если мы будем знать распределение случайной величины как при условии справедливости «нулевой» гипотезы
(т.е. при значении параметра, равном заданной величине
), так и при условии справедливости любой альтернативы. Но признак
, по построению, есть биномиально распределенная случайная величина со значением параметра
, определяемым в зависимости от того, в условиях справедливости какой из гипотез мы ее рассматриваем.
Поэтому в дальнейшем в качестве критической статистики будем рассматривать случайную величину, распределенную по биномиальному закону с параметрами
. Рассмотрим возможные варианты анализа задачи.
Вариант 1. проверяется простая гипотеза при простой альтернативе
, причем
. Тогда смысл неравенств (2) и (3) сохраняется при замене
на
, а именно по заданному уровню значимости
требуется найти такое
, что
. (2¢)
Но
. (2¢¢)
Следовательно, требуется решить уравнение (2¢¢) относительно . Обычно для этого используют нормальное или пуассоновское приближение, а именно:
· если гипотетическая величина , а число наблюдений
составляет хотя бы несколько десятков, то используют теорему Муавра-Лапласа о приближенной (асимптотической) стандартной нормальности случайной величины
.
Тогда при
. (2¢¢¢)
Следовательно, аргумент функции стандартного нормального распределения является квантилем уровня этого распределения
(квантилем уровня
непрерывной случайной величины
называется такое возможное значение
:
). Определив из таблиц величину
, получим
. (4)
Из (4) определяем величину , на которой основано правило проверки гипотезы
: если окажется, что
, то гипотеза
отвергается (с вероятностью ошибки, приблизительно равной
).
Ошибка второго рода этого критерия вычисляется также с использованием нормальной аппроксимации биномиального закона, но при значении параметра :
. (5)
· если гипотетическая величина близка к нулю или единице (т.е.
или
), а число наблюдений, как и в предыдущем случае, составляет хотя бы несколько десятков, то для вычисления вероятностей события вида
, где
– случайная величина, распределенная по биномиальному закону с параметрами
, лучше использовать аппроксимацию по закону Пуассона, т.е.
. (6)
С помощью таблиц распределения Пуассона с параметром находим
из условия
. (7)
Затем вычисляем вероятность ошибки второго рода
. (8)
(функция обозначает функцию распределения закона Пуассона с параметром
)
Вариант 2. Проверяется простая гипотеза при простой альтернативе
, причем
. В этом случае критическая константа
находится из условия
.
Схема решения такая же, как в варианте 1 с заменой смысла неравенств на противоположный в формулах (2¢), (2¢¢), (5), (7) и (8).
Вариант 3. Проверяется простая гипотеза против сложной альтернативы
. В этом случае одинаково неестественными (с точки зрения справедливости гипотезы
) будут большие отклонения
от
как в одну, так и в другую сторону. Поэтому
· при использовании нормальной аппроксимации следует находить константу , заменив при этом
на
. Тогда гипотеза
отвергается, если
,
где – квантиль уровня
стандартного нормального распределения.
· При использовании аппроксимации с помощью закона Пуассона нужно вычислить две критические константы: -ную и
-ную точки (соответственно
и
) распределения Пуассона с параметром
. Гипотеза
будет приниматься, если
, и отвергаться в противном случае.
Пример.
Пример.