Уровень значимости и мощность критерия
Рассмотрим две простые гипотезы: проверяемую H0: θ = θ0, и конкурирующую H1: θ = θ1. С каждым S-критерием связаны ошибки двух родов. Ошибка 1-го рода — отвержение гипотезы H0, когда она верна; ошибка 2-го рода — принятие H0, когда верна конкурирующая гипотеза H1. Обозначим
Тогда вероятность ошибки первого рода S-критерия равна , а вероятность ошибки второго рода равна . В самом деле пусть гипотеза H0-верна, тогда θ = θ0. Гипотеза H0— отвергается, если (x1, x2,…xn) S. Вероятность этого равна . Вероятность ошибки второго рода равна , где , — множество значений (x1, x2,…xn).
Опр: Вероятность ошибки первого рода α называется уровнем значимости S-критерия. Функция аргумента θ называется функцией мощности S-критерия.
Из определений следует, что Отсюда видно, что чем больше мощность в точке θ1, тем меньше вероятность ошибки второг рода.
Параметрические критерии для распознавания двух простых гипотез H0 и H1 строят следующим образом. Сначала задается уровень значимости α, затем из множества Sα всех S-критериев с уровнем значимости α выбирается критерий S*, для которого мощность при θ = θ1 принимает наибольшее значение, т.е.
Такой критерий называется оптимальным или наиболее мощным.
Теорема Неймана-Пирсона.
Для любого 0≤α≤1 существует число С такое, что , тогда и эта вероятность минимальна среди всех критериев с уровнем значимости α.
№25 Построение оптимального критерия для проверки гипотез о параметрах нормального распределения.
Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально подобранной случайной величины— критерия согласия.
Критерием согласия называют критерий проверки гипотезы о предполагаемом законе неизвестного распределения.
Имеется несколько критериев согласия: («хи квадрат») К. -Пирсона, Колмогорова, Смирнова и др. Ограничимся описанием применения критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом состоит его достоинство). С этой целью будем сравнивать эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Обычно эмпирические и теоретические частоты различаются. Например
эмп. частоты .... .6 13 38 74 106 85 30 10 4
теорет. частоты... 3 14 42 82 99 76 37 11 2
Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется тем, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.
Правило. Для того чтобы при заданном уровне значимости проверить нулевую гипотезу Н0. генеральная
совокупность распределена нормально, надо сначала выделить теоретические частоты, а затем наблюдаемое значение критерия:
(**)
по таблице критических точек распределения χ2, по сданному уровню значимости а и числу степеней свободы k=s—3 найти критическую точку
Если < —нет оснований отвергнуть нулевую гипотезу.
Если > —нулевую гипотезу отвергают.
Замечание 1. Объем выборки должен быть достаточно велик, во всяком случае .не менее 50. Каждая группа должна содержать не менее 5—8 вариант; малочисленные группы следует объединять в одну суммируя частоты.
Замечание 2. Поскольку возможны ошибки первого и второго рода, в особенности если согласование теоретических и эмпирических частот «слишком хорошее», следует проявлять осторожность. Например, можно повторить опыт, увеличить число наблюдений, воспользоваться другими критериями, построить график распределения, вычислить асимметрию и эксцесс (см. гл. XVII, § 8).
Замечание 3. Для контроля вычислений формулу (**)преобразуют к виду