Проверка сложной гипотезы о математическом ожидании
Плотность распределения генеральной совокупности X - нормальна, дисперсия неизвестна. Из генеральной совокупности извлечена выборка объема . Как и в разд. 2.5.4, проверяется сложная гипотеза
а) : против альтернативы : .
Заданы вероятности ошибок первого и второго рода a и b.
Естественной статистикой для проверки гипотезы о математическом ожидании, как и ранее, является среднее арифметическое значение выборочных данных, а для построения доверительного интервала для математического ожидания требуется вычислить оценку дисперсии:
.
Доверительный интервал для математического ожидания строится с помощью квантилей (коэффициентов) Стъюдента в соответствии с разд. 2.4.4:
.
Эту вероятность Фишер предложил трактовать, как вероятностную меру полуоткрытого интервала
,
из чего сразу же следует трактовка генеральной характеристики (математического ожидания ), как случайной величины, и это заключение как раз является основной причиной неполного признания такой вероятностной меры, которую Фишер назвал фидуциальной.
Посмотрим, как, несмотря ни на что, применить эту меру с пользой для дела, а именно для проверки сформулированной гипотезы с контролем вероятностей a и b.
На рис. 38 показаны три варианта возможного расположения этого доверительного интервала относительно границы а, которая разделяет вещественную ось на две зоны, соответствующие гипотезам и .
В соответствии с формулировкой гипотезы положение нижней границы доверительного интервала в зоне, соответствующей гипотезе , безразлично, и поэтому на рис. 38, а) нижняя граница обозначена условно. По указанной причине для этого варианта строится доверительный интервал, нижняя граница которого равна – ¥, а верхняя граница определяется заданной вероятностью b ошибки второго рода:
,
где – процентная квантиль плотности распределения Стъюдента.
Это равенство означает, что с позиций фидуциальной вероятностной меры, истинное значение находится в зоне, соответствующей гипотезе с вероятностью, не меньшей, чем Q. В этой ситуации, когда
,
принимается решение о справедливости гипотезы . Вероятность ошибки в этом решении не будет превышать значения вероятности, с которой истинное значение расположено справа от верхней границы доверительного интервала. Объясняется это тем, что здесь
,
и в силу монотонности вероятностной меры
,
а это означает, что .
Поэтому в показанной ситуации вероятность ошибочного решения о признании гипотезы справедливой не превысит заданного значения b:
.
Точно так же в соответствии с формулировкой гипотезы положение верхней границы доверительного интервала в зоне, соответствующей гипотезе , безразлично. По указанной причине для этого варианта строится доверительный интервал, верхняя граница которого равна ¥, а нижняя граница определяется заданной вероятностью a ошибки первого рода:
,
где – -процентная квантиль плотности распределения Стъюдента с степенями свободы.
Это равенство означает, что с позиций фидуциальной вероятностной меры истинное значение находится в зоне, соответствующей гипотезе с вероятностью, не меньшей, чем Q = 1 – . В этой ситуации, когда
,
принимается решение о справедливости гипотезы . Вероятность ошибки в этом решении не будет превышать значения вероятности, с которой истинное значение расположено слева от нижней границы доверительного интервала. Объясняется это тем, что здесь
,
и в силу монотонности вероятностной меры
,
а это означает, что .
Поэтому в показанной ситуации вероятность ошибочного решения о признании гипотезы справедливой не превысит заданного значения a:
.
В третьем варианте, (см. рис. 38, в), у нас нет достаточных оснований для принятия никакого иного решения, кроме решения продолжить испытания с целью увеличения объема выборки. Надежда здесь возлагается на то, что с увеличением объема выборки ширина доверительного интервала уменьшается.
После увеличения объема выборки до снова строится доверительный интервал при тех же заданных значениях вероятностей a и b, и на втором этапе вновь возможны три варианта расположения нового, более узкого доверительного интервала относительно значения а. Все описанные рассуждения и действия повторяются.
В конечном итоге описанная последовательная процедура проверки сложной гипотезы о математическом ожидании должна завершиться выходом доверительного интервала целиком в одну из зон и принятием соответствующей гипотезы. Когда по экономическим, техническим и иным причинам дальнейшее продолжение испытаний (экспериментов) оказывается невозможным, придется принимать произвольное (так называемое волевое) решение об отклонении той или иной гипотезы в зависимости от того, риск какого рода (первого или второго) более оправдан.
Второй разновидностью сложной гипотезы о математическом ожидании, которая имеет важные практические приложения, является гипотеза
б) : против альтернативы : .
К проверке такой гипотезы приходится прибегать, например, когда по результатам испытания продукции необходимо установить, что контролируемый параметр или параметры находятся в пределах установленного и рекламируемого допуска.
Заданы вероятности ошибок первого и второго рода a и b, которые в этом случае приходится принимать равными, то есть a = b.
Как и ранее, в соответствии с разд. 2.4.4, по выборке объема строится доверительный интервал
,
где на этот раз a = b, . Этот интервал располагается по отношению к интервалу , соответствующему гипотезе так, как показано на рис. 39.
Также возможны три варианта расположения доверительного интервала.
В первом варианте (см. рис. 39 а), когда доверительный интервал, который накрывает истинное значение с вероятностью Q, целиком находится в зоне справедливости нулевой гипотезы, это означает, что истинное значение находится в зоне, соответствующей гипотезе с вероятностью, превышающей Q. В этой ситуации принимается решение о принятии гипотезы . Вероятность ошибочного решения не будет превышать b, то есть значения вероятности, с которой истинное значение расположено вне доверительного интервала. Объясняется это тем, что в силу монотонности вероятностной меры в ситуации, показанной на рис. 39, а)
,
а это означает, что .
Поэтому вероятность ошибочного решения о признании гипотезы справедливой, то есть вероятность ошибки второго рода не превысит заданного значения b:
.
Когда во втором варианте (см. рис. 39, б) доверительный интервал целиком находится вне зоны, соответствующей гипотезе , справа или слева от нее, принимается решение о принятии гипотезы . Вероятность ошибочного решения не будет превышать α, то есть значения вероятности, с которой истинное значение расположено вне доверительного интервала, поскольку в этой ситуации,
если доверительный интервал находится слева от зоны гипотезы ,
;
если доверительный интервал находится справа от зоны гипотезы , то также
.
Это означает, что .
Поэтому вероятность ошибочного решения о признании гипотезы справедливой, то есть вероятность ошибки первого рода не превысит заданного значения a:
.
В третьем варианте (см. рис. 39, в), как и прежде, принимается решение об увеличении объема выборки, если этому нет экономических, технических или иных препятствий. Получив выборку увеличенного объема , процедуру повторяют до ее естественного завершения или до прекращения по соображениям экономического, технического или иного обоснованного характера.