Методика проверки статистических гипотез

Статистические гипотезы

• Нулевая гипотеза (null hypothesis) – гипотеза об отсутствии различий (утверждение об

отсутствии различий в значениях или об отсутствии связи в генеральной совокупности)

• Согласно нулевой гипотезе (Н0), различие между значениями недостаточно значительно, а

независимая переменная не оказывает никакого влияния

Альтернативная гипотеза (alternative hypothesis) – гипотеза о значимости различий

(утверждает наличие различий или существование связи)

• Альтернативная гипотеза (HА) является «рабочей» гипотезой исследования. В

соответствии с этой гипотезой, различия достаточно значимы и обусловлены влиянием

независимой переменной

• Ненаправленная и направленная альтернативы

Н0: μ=50

НА: μ≠50

НА: μ>50

НА: μ<50

• Нулевая и альтернативная гипотезы представляют полную группу несовместных событий:

отклонение одной влечет принятие другой

• Основной принцип метода проверки гипотез состоит в том, что выдвигается нулевая

гипотеза Н0, с тем чтобы попытаться опровергнуть ее и тем самым подтвердить

альтернативную гипотезу HА. Если результаты статистического теста, используемого для

анализа разницы между средними, окажутся таковы, что позволят отклонить Н0, это будет

означать, что верна НА, т.е. выдвинутая рабочая гипотеза подтверждается

• Не можем отклонить нулевую гипотезу - не значит «принять» альтернативную

(нулевая гипотеза никогда не может быть абсолютно подтверждена!)

Пусть задана случайная выборка Методика проверки статистических гипотез - student2.ru — последовательность Методика проверки статистических гипотез - student2.ru объектов из множества Методика проверки статистических гипотез - student2.ru . Предполагается, что на множестве Методика проверки статистических гипотез - student2.ru существует некоторая неизвестная вероятностная мера Методика проверки статистических гипотез - student2.ru .

Методика состоит в следующем.

1. Формулируется нулевая гипотеза Методика проверки статистических гипотез - student2.ru о распределении вероятностей на множестве Методика проверки статистических гипотез - student2.ru . Гипотеза формулируется исходя из требований прикладной задачи. Чаще всего рассматриваются две гипотезы —основная или нулевая Методика проверки статистических гипотез - student2.ru и альтернативная Методика проверки статистических гипотез - student2.ru . Иногда альтернатива не формулируется в явном виде; тогда предполагается, что Методика проверки статистических гипотез - student2.ru означает «не Методика проверки статистических гипотез - student2.ru ». Иногда рассматривается сразу несколько альтернатив. В математической статистике хорошо изучено несколько десятков «наиболее часто встречающихся» типов гипотез, и известны ещё сотни специальных вариантов и разновидностей. Примеры приводятся ниже.

2. Задаётся некоторая статистика (функция выборки) Методика проверки статистических гипотез - student2.ru , для которой в условиях справедливости гипотезы Методика проверки статистических гипотез - student2.ru выводится функция распределения Методика проверки статистических гипотез - student2.ru и/или плотность распределения Методика проверки статистических гипотез - student2.ru . Вопрос о том, какую статистику надо взять для проверки той или иной гипотезы, часто не имеет однозначного ответа. Есть целый ряд требований, которым должна удовлетворять «хорошая» статистика Методика проверки статистических гипотез - student2.ru . Вывод функции распределения Методика проверки статистических гипотез - student2.ru при заданных Методика проверки статистических гипотез - student2.ru и Методика проверки статистических гипотез - student2.ru является строгой математической задачей, которая решается методами теории вероятностей; в справочниках приводятся готовые формулы для Методика проверки статистических гипотез - student2.ru ; в статистических пакетах имеются готовые вычислительные процедуры.

3. Фиксируется уровень значимости — допустимая для данной задачи вероятность ошибки первого рода, то есть того, что гипотеза на самом деле верна, но будет отвергнута процедурой проверки. Это должно быть достаточно малое число Методика проверки статистических гипотез - student2.ru . На практике часто полагают Методика проверки статистических гипотез - student2.ru .

4. На множестве допустимых значений статистики Методика проверки статистических гипотез - student2.ru выделяется критическое множество Методика проверки статистических гипотез - student2.ru наименее вероятных значений статистики Методика проверки статистических гипотез - student2.ru , такое, что Методика проверки статистических гипотез - student2.ru . Вычисление границ критического множества как функции от уровня значимости Методика проверки статистических гипотез - student2.ru является строгой математической задачей, которая в большинстве практических случаев имеет готовое простое решение.

5. Собственно статистический тест (статистический критерий) заключается в проверке условия:

§ если Методика проверки статистических гипотез - student2.ru , то делается вывод «данные противоречат нулевой гипотезе при уровне значимости Методика проверки статистических гипотез - student2.ru ». Гипотеза отвергается.

§ если Методика проверки статистических гипотез - student2.ru , то делается вывод «данные не противоречат нулевой гипотезе при уровне значимости Методика проверки статистических гипотез - student2.ru ». Гипотеза принимается.

Итак, статистический критерий определяется статистикой Методика проверки статистических гипотез - student2.ru и критическим множеством Методика проверки статистических гипотез - student2.ru , которое зависит от уровня значимости Методика проверки статистических гипотез - student2.ru .

Процедура проверки статистической гипотезы

• Сформулировать нулевую и альтернативной гипотезы

• Выбрать соответствующий статистический тест

• Выбрать требуемый уровень значимости (α=0.05, 0.01, 0.025, …)

• Вычислить эмпирическое значение критерия по тесту

• Сравнить с критическим значением критерия по тесту

• Принять решение (для большинства тестов приемлемо

правило: если вычисленное значение больше, чем критическое,

нулевая гипотеза отклоняется)

Критерий согласия Пирсона

Критерий согласия Пирсона (χ2) применяют для проверки гипотезы о соответствии эмпирического распределения предполагаемому теоретическому распределению F(x) при большом объеме выборки (n ≥ 100). Критерий применим для любых видов функции F(x), даже при неизвестных значениях их параметров, что обычно имеет место при анализе результатов механических испытаний. В этом заключается его универсальность.

Использование критерия χ2 предусматривает разбиение размаха варьирования выборки на интервалы и определения числа наблюдений (частоты) nj для каждого из e интервалов. Для удобства оценок параметров распределения интервалы выбирают одинаковой длины.

Число интервалов зависит от объема выборки. Обычно принимают: при n = 100 e = 10 ÷ 15, при n = 200 e = 15 ÷ 20, при n = 400 e = 25 ÷ 30, при n = 1000 e = 35 ÷ 40.

Интервалы, содержащие менее пяти наблюдений, объединяют с соседними. Однако, если число таких интервалов составляет менее 20 % от их общего количества, допускаются интервалы с частотой nj ≥ 2.

Статистикой критерия Пирсона служит величина
Методика проверки статистических гипотез - student2.ru , (3.91)
где pj - вероятность попадания изучаемой случайной величины в j-и интервал, вычисляемая в соответствии с гипотетическим законом распределением F(x). При вычислении вероятности pj нужно иметь в виду, что левая граница первого интервала и правая последнего должны совпадать с границами области возможных значений случайной величины. Например, при нормальном распределении первый интервал простирается до -∞, а последний - до +∞.

Нулевую гипотезу о соответствии выборочного распределения теоретическому закону F(x) проверяют путем сравнения вычисленной по формуле (3.91) величины с критическим значением χ2α, найденным по табл. VI приложения для уровня значимости α и числа степеней свободы k = e1 - m - 1. Здесь e1 - число интервалов после объединения; m - число параметров, оцениваемых по рассматриваемой выборке. Если выполняется неравенство
χ2 ≤ χ2α (3.92)
то нулевую гипотезу не отвергают. При несоблюдении указанного неравенства принимают альтернативную гипотезу о принадлежности выборки неизвестному распределению.

Недостатком критерия согласия Пирсона является потеря части первоначальной информации, связанная с необходимостью группировки результатов наблюдений в интервалы и объединения отдельных интервалов с малым числом наблюдений. В связи с этим рекомендуется дополнять проверку соответствия распределений по критерию χ2 другими критериями. Особенно это необходимо при сравнительно малом объеме выборки (n ≈ 100).

Критерий согласия Пирсона Методика проверки статистических гипотез - student2.ru – один из основных:
Методика проверки статистических гипотез - student2.ru
где k – число групп, на которые разбито эмпирическое распределение,
Методика проверки статистических гипотез - student2.ru – наблюдаемая частота признака в i-й группе,
Методика проверки статистических гипотез - student2.ru – теоретическая частота.

Наши рекомендации