Статистические гипотезы и критерии для их проверки

Одной из основных процедур получения выводов при использовании опытных данных является процедура проверки статистических гипотез.

Статистической гипотезой называют любое предположение, касающееся неизвестного распределения случайной величины в совокупности.

Идея формирования и проверки статистических гипотез состоит в следующем. Пусть для некоторого числового параметра распределения случайной величины Q по выборке объема N вычислена некоторая оценка Статистические гипотезы и критерии для их проверки - student2.ru , называемая статистикой для проверки гипотез. Пусть имеется причина предположить, что истинное значение параметра Q, т.е. его значение в генеральной совокупности, равно Q0 . Это предположение следует проверить по имеющимся опытным данным выборки. Такое проверяемое предположение называют нулевой гипотезой (обозначают Н0) и записывают в виде соотношения Н0: Q=Q0. Даже если нулевая гипотеза справедлива, то статистика Статистические гипотезы и критерии для их проверки - student2.ru обычно не совпадает точно с Q0 , поскольку она является лишь одним из конкретных значений случайной величины Статистические гипотезы и критерии для их проверки - student2.ru , порожденным случайной выборкой объема N. Если известна функция распределения оценки Статистические гипотезы и критерии для их проверки - student2.ru , построенная теоретически в предположении справедливости нулевой гипотезы, то с ее помощью с заданной доверительной вероятностью р можно построить доверительный интервал для оцениваемого параметра Q=Q0 (при проверке статистических гипотез доверительный интервал обычно называют областью принятия нулевой гипотезы). Области значений статистики Статистические гипотезы и критерии для их проверки - student2.ru , не входящие в доверительный интервал, называют критической областью. Вероятность попадания статистики Статистические гипотезы и критерии для их проверки - student2.ru в критическую область a=1-рназываютуровнем значимости.Обычно такая вероятность имеет малое значение (0.05, 0.025 и т.п.).

Рассчитанное по опытным данным действительное значение статистики Статистические гипотезы и критерии для их проверки - student2.ru может попасть либо в область принятия нулевой гипотезы, либо в критическую область. Если Статистические гипотезы и критерии для их проверки - student2.ru принадлежит области принятия нулевой гипотезы, то с вероятностью р следует считать нулевую гипотезу Н0: Q=Q0 справедливой. Если же Статистические гипотезы и критерии для их проверки - student2.ru принадлежит критической области, то с вероятностью р нулевую гипотезу Н0 следует отвергнуть.

Нулевой гипотезой называют любую статистическую гипотезу, подлежащую проверке.

В большинстве реальных статистических ситуаций можно высказать сразу несколько гипотез. Обычно в качестве нулевой гипотезы используют гипотезу, наиболее вероятную или имеющую наиболее важное значение в проводимом исследовании.

Нулевую гипотезу выдвигают и затем проверяют с помощью статистических критериев в целях выявления оснований для ее отклонения и принятия альтернативной гипотезы.

Альтернативная гипотеза – это каждая допустимая гипотеза, отличная от нулевой.Ее обозначают НА или Н1.

Статистический критерий – однозначно определенный способ проверки статистических гипотез.

Такой способ (статистический критерий) включает в себя:

- формулу или способ расчета статистики, используемые для проверки данной конкретной нулевой гипотезы;

- известное теоретическое распределение, которому подчиняется данная статистика;

- способ определения границы критической области и способ определения местоположения критической области.

Статистикой для проверки гипотез называют функцию результатов наблюдений, составляющих выборку, однозначно связанную с принятым статистическим критерием и определяемую им.

Все возможные значения статистики для проверки гипотезы при помощи границы критической области делятся на две части: область принятия нулевой гипотезы и критическую область.

Критической областью называют область со следующими свойствами: если значения применяемой статистики принадлежит данной области, то отвергают нулевую гипотезу; в противном случае ее принимают.

По существу, проверка гипотезы сводится к выяснению того, в какую область попало рассчитанное значение статистики: если оно попало в критическую область, то нулевая гипотеза отвергается, а если в область принятия нулевой гипотезы, то принимается.

Наиболее часто границу критической области определяют по статистическим таблицам как квантиль некоторого известного теоретического распределения в зависимости от используемого критерия, принятого (самостоятельно в зависимости от целей исследования) уровня значимости α и числа степеней свободы ν.

Уровнем значимости называют вероятность отвергнуть объективно верную нулевую гипотезу (вероятность совершить ошибку первого рода). Наиболее часто принимают a=0.05, реже – a=0.01, a=0.1.

Критические области бывают односторонние и двусторонние. Смысл этих областей показан на рис. 2.7.

Если хотят убедиться в том, что одна случайная величина строго больше другой (или строго меньше другой), то используют одностороннюю критическую область.

В этом случае Н0: Q=Q0,

Н1: Q>Q0 или Н1: Q<Q0.

Если проверяют как положительные, так и отрицательные расхождения между изучаемыми величинами, то используют двусторонние критические области.

В этом случае Н0: Q=Q0,

Н1: Q¹Q0.

Статистические гипотезы и критерии для их проверки - student2.ru Рис. 2.7. Критические области:

а – правосторонняя; б – левосторонняя; в – двусторонняя

Всю процедуру проверки статистических гипотез можно в значительной степени формализовать, применяя один и тот же подход, определяемый некоторым алгоритмом, например следующим:

Алгоритм проверки статистических гипотез:

1) формулируют нулевую гипотезу Н0;

2) формулируют альтернативную гипотезу Н1;

3) выбирают критерий для проверки Н0;

4) рассчитывают статистику, относящуюся к выбранному критерию;

5) находят границы критической области при выбранной альтернативной гипотезе Н1, определяют местоположение критической области (слева или справа от границы);

6) проверяют попадание рассчитанной статистики в критическую область и делают вывод о справедливости выдвинутой нулевой гипотезы.

Из перечисленных процедур неформальными являются следующие:

- формулирование нулевой и альтернативной гипотез. Это одна из наиболее важных, сложных и ответственных процедур. Фактически она сводится к формализации поставленной задачи, описанию цели проведения исследования при помощи терминов и понятий, применяемых в математической статистике. Решение этой задачи достаточно эффективно может быть приведено только человеком, с одной стороны, хорошо знающим данную конкретную область (например, технологию и оборудование, применяемые для обработки металлов давлением), а с другой стороны, глубоко разбирающимся с вопросах статистического описания опытных данных;

- определение местоположения критической области (где она расположена, слева или справа от границы, определенной по таблице). Наиболее простое решение этого вопроса может быть получено следующим образом: 1) предположить, что нулевая гипотеза справедлива; 2) установить, какие значения при этом могут принимать случайные величины, входящие в формулу, для расчета статистики (удобно использовать некоторые предельные или граничные значения); 3) подставить эти значения в формулу для расчета статистики и рассчитать ее значение; 4) определить, в какую область (справа или слева от границы) попала статистика; 5) обозначить эту область как область принятия нулевой гипотезы, а другую область (отделенную границей) – как критическую.

Остальные процедуры, приведенные в алгоритме, по своей сути являются формальными и могут быть произведены с помощью справочных материалов.

В настоящее время в рамках теоретической и прикладной статистики известно большое количество методов анализа и сопоставления опытных данных, позволяющих получить вывод в очень широком спектре статистических ситуаций. Для этого разработано большое количество разнообразных статистических критериев. Небольшая часть таких ситуаций и критериев, широко и часто применяемых на практике, приведена в табл. 2.1. В таблице указаны применяемые в этих критериях статистики, правила определения границ критических областей и их местоположения. Для определения численных значений границ критических областей следует использовать соответствующие статистические таблицы, приведенные в приложении.

В таблице приняты следующие обозначения:

N – объем выборки (количество опытных данных);

ν – число степеней свободы;

α – уровень значимости;

μ – математическое ожидание, определяемое выражением (2.7);

s2 – генеральная дисперсия (2.8);

s – генеральное среднеквадратическое отклонение (2.9).

Статистические гипотезы и критерии для их проверки - student2.ru – выборочное среднее арифметическое (2.14);

s2 – выборочная дисперсия (2.15);

s – выборочное среднеквадратическое отклонение (2.17).

Наши рекомендации