Уровень значимости и мощность критерия
Рассмотрим две простые гипотезы: проверяемую : и конкурирующую: : . С каждым -критерием связаны ошибки двух родов. Ошибка первого рода – отвержение гипотезы , когда она верна; принимая гипотезу , в случае когда верна конкурирующая гипотеза , мы делаем ошибку второго рода.
Обозначим
, i = 0, 1. (2.1)
Тогда, вероятность ошибки первого рода - критерия равна:
, (2.2)
а вероятность ошибки второго рода равна:
, где , (2.3)
и иногда называют просто ошибками І и ІІ рода.
Задача построения -критерия для проверки простой гипотезы при конкурирующей гипотезе ставится следующим образом. Вероятность ошибки І рода называют уровнем значимости - критерия.
Функцией мощности -критерия называется следующая функция от :
(2.4)
т.е. вероятность отвергнуть гипотезу , если истинное значение параметра равно .
Как видно из (2.2), (2.3) и (2.4), вероятности ошибок І и ІІ рода следующим образом выражаются через функцию мощности:
,
Итак, сначала задается уровень значимости и рассматривается множество всех -критериев с уровнем значимости . Среди этих критериев выбирается критерий , для которого мощность при принимает наибольшее значение, т.е.
,
Критерий , удовлетворяющий условиям (2.5) называется оптимальным, или наиболее мощным, критерием, который не всегда существует.
Обобщим понятие статистического критерия. Для этого опишем -критерий с помощью функции , определенной по правилу:
(2.6)
Мы можем истолковать , как вероятность отвергнуть гипотезу , когда выборка приобретает значение . Критерии, описываемые функцией вида (2.6) называются нерандомизированными. Введем понятие рандомизированого критерия (от англ. random-случайный).
Пусть задана функция , такая, что для любых . Мы предполагаем, что с каждыми значением выборки связывается некий случайный эксперимент (рандомизация ) с двумя исходами: 1 и 0, причем вероятность 1 равна , а вероятность 0 равна В зависимости от исхода этой рандомизации действует и этот рандомизированный критерий. Если выпала 1, то отвергается, если выпал 0, то принимается.
Функцию мощности этого критерия, который можно назвать -критерием обозначим Она равна :
где означает математическое ожидание по распределению , а - случайная величина, плотность которой равна .
Уровень значимости -критерия равен:
,
а вероятность ошибки II рода равна:
Рассмотрим множество всех -критериев с фиксированным уровнем значимости . Мы будем называть -критерий оптимальным или наиболее мощным, если
, (2.7)
Задача (2.7) всегда допускает решения.