Проверка статистических гипотез
Статистическими гипотезаминазывают любые предположения относительно параметров, (такие гипотезы называют параметрическими) или вида функции распределения случайной величины.
Задача проверки статистической гипотезы относительно генеральной совокупности ставится так:
Найти правило, позволяющее по выборке (1) обоснованно решить вопрос о принятии или отклонении гипотезы . Для решения этой задачи выбирают критерий проверки, то есть некоторую функцию от выборки
, (5)
которая является случайной величиной, так как все есть случайные величины. Предполагается, что для этой функции известны плотности распределения вероятностей и , где – альтернативная гипотеза. Зададим уровень значимости . Эта вероятность такова, что событиями, происходящими с такой вероятностью в данной ситуации, можно пренебречь. Обычно выбирают .
Критической областью называют совокупность значений критерия , при которой гипотезу отвергают.
Область находят из условия
. (6)
Отметим, что условием (6) область определяется неоднозначно.
Основной принцип проверки статистической гипотезы состоит в следующем: по реализации (2) выборки и формуле (5) вычисляют величину .
Если , то отвергают в пользу альтернативной гипотезы . Если же , то оснований отвергнуть нет, так как выборочные данные (2) не противоречат гипотезе .
Число называют мощностью критерия.
. (7)
При принятии или отклонении гипотезы возможны ошибки двоякого рода: 1) ошибка первого рода – отвергают, а она верна.
Вероятность ошибки 1 рода ;
2) ошибка второго рода – принимают, а она не верна.
Вероятность ошибки второго рода .
Из формулы (7) видно, что чем больше мощность , тем меньше ошибка 2 рода. Обычно поступают следующим образом: фиксируют уровень значимости , то есть фиксируют приемлемую вероятность ошибки 1 рода, а затем ищут критерий с наибольшей мощностью, то есть с наименьшей ошибкой 2 рода.
Таким образом, проверка параметрической статистической гипотезы может быть разбита на следующие этапы:
формулируем гипотезы и ;
назначаем уровень значимости ;
выбираем статистику (5) для проверки гипотезы ;
находим плотности распределения и ;
в зависимости от гипотезы находим критическую область ;
по выборке (2) вычисляем ;
принимаем решение: если , гипотезу оставляем. Если , гипотезу отклоняем в пользу альтернативной .
Модель 1.Пусть известно, что генеральная совокупность где m ‒ неизвестно, а – известно. Требуется по выборке (2) и уровню значимости проверить нулевую гипотезу : .
Решение.Рассмотримстатистику :
, где , n-объём выборки.
Возьмем z в качестве критерия проверки гипотезы H0.
Пусть - квантиль уровня α случайной величины , ;
Тогда для альтернативных гипотез область G будет иметь вид:
По выборке (2) считаем статистику z:
- если , то нулевую гипотезу отвергаем в пользу альтернативной;
- если , то выборочные данные не дают основания для того, чтобы отвергнуть нулевую гипотезу.
Для простой альтернативной гипотезы
, мощность критерия ;
Для гипотезы , , .
Модель 2.Пусть генеральная совокупность , и оба параметра и неизвестны. По уровню значимости проверить нулевую гипотезу .
Решение. По выборке (1) найдем точечные оценки
и
неизвестных параметров. Можно доказать, что если гипотеза Н0 справедлива, то статистика - распределена по закону Стьюдента с степенью свободы. Для альтернативных гипотез область G будет иметь вид:
;
;
;
Здесь - квантиль распределения уровня .
По выборке (2) считаем статистику z:
- если , то нулевую гипотезу отвергаем в пользу альтернативной;
- если , то выборочные данные не дают основания для того, чтобы отвергнуть нулевую гипотезу.
Модель 3.Пусть имеем две независимые выборки (1) и
(8)
объемом и из нормальных генеральных совокупностей и . Предположим, что и известны. Требуется на уровне значимости проверить гипотезу : :
Решение.Для этой модели статистика имеет вид
,
где , .
Для альтернативных гипотез , область , область , , , где – квантиль уровня случайной величины .
По реализациям обеих выборок считаем статистику z:
- если (для каждой альтернативной гипотезы область своя), то нулевую гипотезу отвергаем в пользу альтернативной;
- если , то выборочные данные не дают основания для того, чтобы отвергнуть нулевую гипотезу.
Пример 1.По паспортным данным автомобильного двигателя расход топлива на 100 км пробега составляет 10 л. Ожидается, что после модернизации двигателя расход топлива уменьшится. Для проверки производятся испытания 25 случайно отобранных автомобилей с модернизированным двигателем. По результатам испытаний выборочная средняя расходов топлива на 100 км пробега составила л. Предполагая, что расход топлива есть нормальная случайная величина с проверить гипотезу , утверждающую, что изменение конструкции двигателя не повлияет на расход топлива при уровне значимости .
Решение.Дано: .
Вычислим статистику .
Область , где квантиль уровня случайной величины . Имеем , то есть .
Так как , то гипотезу отвергаем в пользу альтернативной. То есть из опытных данных следует, что модернизация двигателя привела к уменьшению расхода топлива.
Замечание.Пусть в условиях задачи . Вычислим мощность критерия , вероятность ошибки второго рода , и ответим на вопрос, какой минимальный объем выборки нужно взять, чтобы .
Имеем .
, где .
.
Решим уравнение
,
,
, , .
Пример 2.Из продукции двух станков-автоматов, выпускающих однотипные изделия, взяты выборки объемов и По результатам выборок найдены мм, мм. Дисперсии генеральных совокупностей известны , . В предположении о нормальном законе распределения погрешностей изготовления требуется на уровне значимости проверить гипотезу при альтернативной гипотезе .
Решение.У нас , , , , , , .
Статистика .
.
Критическая область для альтернативной гипотезы имеет вид
,
, .
Так как , то отклоняем гипотезу в пользу альтернативной .
Модель 4.
Пусть имеем две независимые выборки (1) и
(8)
объемом и из нормальных генеральных совокупностей и .
Требуется проверить нулевую гипотезу .
при трех альтернативных:
при этом предполагаем, что , но дисперсии не известны.
Решение.Рассмотрим статистику :
где ; .
Можно доказать, что если гипотеза Н0 справедлива, то статистика - распределена по закону Стьюдента с степенями свободы. Возьмем z в качестве критерия проверки гипотезы H0..
Для альтернативных гипотез область G будет иметь вид:
;
;
.
Здесь - квантиль распределения уровня .
По реализациям обеих выборок считаем статистику z:
- если (для каждой альтернативной гипотезы область своя), то нулевую гипотезу отвергаем в пользу альтернативной;
- если , то выборочные данные не дают основания для того, чтобы отвергнуть нулевую гипотезу.
Модель 5
Имеется две выборки из нормальных генеральных совокупностей ; .
Причём параметры , - неизвестны.
;
.
Решение.Найдём точечные оценки дисперсий:
; .
Предположим, что . Построим статистику . Можно доказать, что при выполнении гипотезы Н0, - распределение Фишера , где .
Возьмем в качестве критерия проверки гипотезы H0.
Для гипотезы область .
Если , то отклоняем Н0 в пользу На ; если , у нас нет оснований отвергнуть гипотезу Н0. Здесь квантиль распределения Фишера .
Замечание.Для гипотез:
Замечание. Если гипотезу принимают, то говорят, что различие выборочных дисперсий и статистически не значимои оценка общей дисперсии такова: .
Пример 3. Расход сырья на одно изделие случаен. Результаты наблюдений таковы:
Старая технология | Новая технология | ||||||
Расход сырья | |||||||
Число изделий |
Предположив, что расход сырья, как при старой, так и при новой технологии имеет нормальное распределение, выяснить, влияет ли технология на средний расход сырья на одно изделие. Принять .
Решение. Здесь Найдем выборочные средние: и и выборочные дисперсии и .
По условию генеральные дисперсии не известны и неизвестно, равны ли они. Поэтому, прежде чем сравнить генеральные средние, проверим гипотезу , приняв в качестве альтернативной . Согласно -критерию (см. модель 5), вычислим , а затем найдем по таблице Так как , то Нулевую гипотезу о равенстве генеральных дисперсий принимаем.
Теперь проверим гипотезу , приняв в качестве альтернативной . Согласно - критерию (см. модель 4) вычислим
= =3,852.
Далее найдем Так как , то Следовательно, принимаем гипотезу то есть считаем, что применение новой технологии снижает средние затраты сырья на одно изделие.
Часто при обработке статистической информации можно встретиться с признаками, не поддающимися количественной оценке. Например, невозможно дать количественную оценку математическим способностям студента, качеству продукции и т. д. В этих случаях принято подсчитывать долю или процент генеральной совокупности обладающих тем или иным качественным признаком.
Модель 6.Пусть р – доля элементов генеральной совокупности, обладающих некоторым качественным признаком. Из этой генеральной совокупности извлечена выборка объема n (n≥100) и по ней получена точечная оценка параметра р
,
где n ‒ объем выборки, m – число элементов выборки, обладающих исследуемым свойством.
Требуется проверить нулевую гипотезу H0 : р=р0
при трех альтернативных:
: р≠ р0
р< р0 ,
р> р0.
Решение. Проверка нулевой гипотезы основывается на вычислении выборочной статистики
Для решения задачи поступают следующим образом:
По выборке (2) считают .
По уровню значимости и таблицам находят соответствующий квантиль нормальной случайной величины
;
Вычисляют (где q0=1-p0)
Для альтернативных гипотез На критическая область G имеет вид: На :
Тогда, если U набл. G, то отклоняем гипотезу H0 в пользу альтернативной гипотезы Если G, то у нас нет оснований отклонять H0 .
Модель 7.Пусть даны 2 генеральные совокупности, имеющие биномиальный закон распределения (схема Бернулли) с параметрами и ( неизвестные доли элементов генеральной совокупности, обладающие заданным качественным признаком).
Из этих генеральной совокупности извлечены выборки объема n1 и n2 и вычислены
где mi-количество элементов в i-той выборке, которые обладают качественным признаком, который мы исследуем.
Проверка нулевой гипотезы основывается на вычислении выборочной статистики
, где ; ;
Для решения задачи поступают следующим образом:
По выборкам считают
По уровню значимости и таблицам находят соответствующий квантиль нормальной случайной величины
;
3. Вычисляют где ; ;
Для альтернативных гипотез критическая область G имеет вид:
Тогда, если G, то отклоняем гипотезу H0 в пользу альтернативной гипотезы Если G, то у нас нет оснований отклонять H0 .
Пример 4.Партия изделий принимается в том случае, если вероятность того, что изделие соответствует стандарту Среди случайно отобранных 200 изделий проверяемой партии оказалось 193 соответствующих стандарту. Можно ли принять партию? Принять уровень значимости a=0,02.
Решение: H0: p= 0,97. Ha: p< 0,97
,
Значит справедлива нулевая гипотеза: партия изделий принимается.
Пример 5. Компания А утверждает, что ее зубная паста лучше зубной пасты компании В. Отобраны группы людей nA=400, nB=300 человек, которые чистили зубы зубными пастами компаний А и В. После окончания эксперимента у mA=30, mB=25 человек появились новые признаки кариеса. Проверить гипотезу, что зубная паста фирмы А более эффективна, чем зубная паста фирмы В, если уровень значимости .
Решение: n1=400, m1=30, n2=300, m2=25, ,
H0: p1=p2;
Ha: p1<p2;
. Пасты одинаково эффективны.
16. Критерий
Пусть основная гипотеза состоит в том, что функция распределения случайной величины есть функция , зависящая от неизвестных параметров. Процедура применения критерия для проверки гипотезы состоит из следующих этапов:
По выборке (2) найдем точечные оценки неизвестных параметров предполагаемого закона распределения .
Разобьем числовую ось на промежутков , ,
, , .
Если гипотеза справедлива, то промежутку, соответствует вероятность , .
Пусть из выборки (2) значений попадает в -й промежуток . Тогда отношение представляет собой частоту попадания выборочных значений в -й интервал. Близость частот к свидетельствует в пользу гипотезы .
Вычисляем выборочное значение статистики , которая характеризует согласованность гипотезы с опытными данными.
Принимаем статистическое решение: гипотеза не противоречит опытным данным на заданном уровне значимости , если ; если же , то гипотеза отклоняется. Здесь – квантиль уровня распределения Пирсона с степенями свободы, – число параметров распределения , которые оцениваются по выборке (2).
Замечание. Критерий использует тот факт, что случайная величина
,
имеет распределение, близкое к нормальному . Чтобы это утверждение было достаточно точным, необходимо чтобы для всех интервалов выполнялось условие . Если в некоторых интервалах это условие не выполняется, то их следует объединить с соседними.