Глава 5. Проверка статистических гипотез

Глава 5. Проверка статистических гипотез

В научных исследованиях для доказательства достоверности результатов эксперимента необходимо оценивать их значимость. Приходится сравнивать данные опыта с контрольными данными, причем о преимуществе одной из сравниваемых групп судят по разности выборочных средних. Так как значения выборочных средних (или других выборочных характеристик) являются случайными величинами, варьирующимися около значений параметров генеральной совокупности, то разница между сравниваемыми выборочными параметрами может возникнуть вследствие случайности, не из-за систематического воздействия на изучаемый признак. Установление значимости различия (является ли различие систематическим или случайным) осуществляется проверкой статистической гипотезы.

§5.1. Статистические гипотезы

Статистические гипотезы.

Статистической гипотезой называется предположение о виде неизвестного распределения или о значениях параметров распределения наблюдаемых в эксперименте случайных величин.

Нулевой (основной) называется выдвинутая гипотеза, которая обозначается Н0. Альтернативной (конкурирующей) называется гипотеза, которая противоречит основной (обозначение: Н1).

Если производится сравнение одной выборки, генеральный параметр которой z1, с другой выборкой, генеральный параметр которой z2, то основная гипотеза формулируется обычно так: генеральные параметры сравниваемых выборок равны, то есть различия между выборочными параметрами носят не систематический, а исключительно случайный характер. Основную гипотезу принято записывать в виде: Н0: z1=z2.

Альтернативные гипотезы могут иметь один из следующих видов: а) Н1: z1>z2; б) Н1: z1<z2; в) Н1: z1¹z2. Гипотезы (а) и (б) называются направленными, а гипотеза вида (в) – ненаправленной.

Проверка гипотезы позволяет сделать вывод о том, противоречит ли выдвинутая гипотеза эмпирическим данным, или нет. Нулевую гипотезу проверяют на основании данных выборки. В следствие случайности выборки возможны следующие виды ошибок:

1) ошибка первого рода имеет место тогда, когда отвергается правильная гипотеза;

2) ошибка второго рода имеет место тогда, когда принимается неправильная гипотеза.

Вероятность совершить ошибку первого рода называется уровнем значимости a. В прикладных исследованиях обычно принимается уровень значимости a=0,05, и в особых случаях, требующих высокой точности, полагают a=0,01.

Статистический критерий. Критические области.

Статистическим критерием (или просто критерием) называется специально выработанная случайная величина К с известной функцией распределения, которая служит для проверки основной гипотезы. Значение критерия, вычисленное по выборке, называется наблюдаемым значением критерия и обозначается Глава 5. Проверка статистических гипотез - student2.ru .

Критической областью называется множество значений критерия, при которых отвергается основная гипотеза. Границы критической области называются критическими точками kc.

Виды критических областей:

1) правосторонняя: если К>kc; применяется, если Н1: z1>z2;

2) левосторонняя: если К<-kc; применяется, если Н1: z1<z2;

3) двусторонняя: если К<kc1 и К>kc2, причем kc2>kc1; применяется, если Н1: z1¹z2. (правосторонняя или левосторонняя область называется односторонней).

Критерий Фишера.

Для оценки значимости различия исправленных дисперсий Глава 5. Проверка статистических гипотез - student2.ru и Глава 5. Проверка статистических гипотез - student2.ru (пусть Глава 5. Проверка статистических гипотез - student2.ru > Глава 5. Проверка статистических гипотез - student2.ru ), рассчитанных по двум выборкам из генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, используется критерий Фишера (или F-критерий).

Требуется проверить основную гипотезу Н0: Глава 5. Проверка статистических гипотез - student2.ru = Глава 5. Проверка статистических гипотез - student2.ru .

Наблюдаемое значение критерия Фишера вычисляется по формуле:

Глава 5. Проверка статистических гипотез - student2.ru . (4.1)

В числителе (4.1) всегда должна быть та дисперсия, которая больше!

Критерий Стьюдента.

Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной независимой выборке. Вычисленные по этим выборкам средние значения Глава 5. Проверка статистических гипотез - student2.ru и Глава 5. Проверка статистических гипотез - student2.ru , как правило, различаются. В силу случайности выборки это различие может быть случайным, и генеральные средние Глава 5. Проверка статистических гипотез - student2.ru и Глава 5. Проверка статистических гипотез - student2.ru могут совпадать.

Требуется проверить основную гипотезу Н0: Глава 5. Проверка статистических гипотез - student2.ru = Глава 5. Проверка статистических гипотез - student2.ru . Значимость различия между двумя выборочными средними Глава 5. Проверка статистических гипотез - student2.ru и Глава 5. Проверка статистических гипотез - student2.ru определяется с помощью критерия Стьюдента (или t – критерия).

Наблюдаемое значение критерия Стьюдента вычисляется по формуле:

Глава 5. Проверка статистических гипотез - student2.ru , (4.3)

где величина Глава 5. Проверка статистических гипотез - student2.ru называется ошибкой разности выборочных средних. Вычисление Глава 5. Проверка статистических гипотез - student2.ru зависит от объемов выборок и того, предполагаются ли равными или нет неизвестные дисперсии генеральных совокупностей:

· если объемы выборок nх и nу примерно одинаковые и достаточно большие, т.е. nх>30 и nу>30, то

Глава 5. Проверка статистических гипотез - student2.ru ,

где Глава 5. Проверка статистических гипотез - student2.ru и Глава 5. Проверка статистических гипотез - student2.ru – дисперсии выборок из двух генеральных совокупностей Х и Y;

· если объемы выборок nх и nу малы, т.е. nх<30 и nу<30, а дисперсии генеральных совокупностей неизвестны и предполагаются равными, то

Глава 5. Проверка статистических гипотез - student2.ru ,

где Глава 5. Проверка статистических гипотез - student2.ru и Глава 5. Проверка статистических гипотез - student2.ru – исправленные дисперсии выборок из двух генеральных совокупностей Х и Y.

Поэтому перед вычислением критерия Стьюдента всегда следует проверить гипотезу о равенстве генеральных дисперсий с помощью критерия Фишера.

Глава 5. Проверка статистических гипотез

В научных исследованиях для доказательства достоверности результатов эксперимента необходимо оценивать их значимость. Приходится сравнивать данные опыта с контрольными данными, причем о преимуществе одной из сравниваемых групп судят по разности выборочных средних. Так как значения выборочных средних (или других выборочных характеристик) являются случайными величинами, варьирующимися около значений параметров генеральной совокупности, то разница между сравниваемыми выборочными параметрами может возникнуть вследствие случайности, не из-за систематического воздействия на изучаемый признак. Установление значимости различия (является ли различие систематическим или случайным) осуществляется проверкой статистической гипотезы.

§5.1. Статистические гипотезы

Статистические гипотезы.

Статистической гипотезой называется предположение о виде неизвестного распределения или о значениях параметров распределения наблюдаемых в эксперименте случайных величин.

Нулевой (основной) называется выдвинутая гипотеза, которая обозначается Н0. Альтернативной (конкурирующей) называется гипотеза, которая противоречит основной (обозначение: Н1).

Если производится сравнение одной выборки, генеральный параметр которой z1, с другой выборкой, генеральный параметр которой z2, то основная гипотеза формулируется обычно так: генеральные параметры сравниваемых выборок равны, то есть различия между выборочными параметрами носят не систематический, а исключительно случайный характер. Основную гипотезу принято записывать в виде: Н0: z1=z2.

Альтернативные гипотезы могут иметь один из следующих видов: а) Н1: z1>z2; б) Н1: z1<z2; в) Н1: z1¹z2. Гипотезы (а) и (б) называются направленными, а гипотеза вида (в) – ненаправленной.

Проверка гипотезы позволяет сделать вывод о том, противоречит ли выдвинутая гипотеза эмпирическим данным, или нет. Нулевую гипотезу проверяют на основании данных выборки. В следствие случайности выборки возможны следующие виды ошибок:

1) ошибка первого рода имеет место тогда, когда отвергается правильная гипотеза;

2) ошибка второго рода имеет место тогда, когда принимается неправильная гипотеза.

Вероятность совершить ошибку первого рода называется уровнем значимости a. В прикладных исследованиях обычно принимается уровень значимости a=0,05, и в особых случаях, требующих высокой точности, полагают a=0,01.

Наши рекомендации