Статистические гипотезы, выдвижение и проверка гипотез в научных исследованиях.
В физическом воспитании и спорте часто при анализе какого-либо явления приходится по некоторым изменениям показателя делать обобщающий вывод. Например, после тренировочного занятия 18 легкоатлетов у трёх наблюдается неполное восстановление. Можно ли на этом основании судить о трудности тренировочного процесса или это случайность?
Так как указанные выводы делаются на основании относительно небольшого числа результатов измерения показателя (n ≤ 30), необходима проверка достоверности (бесспорности) таких выводов.
Для этого применяются статистические гипотезы.
Статистической гипотезой называется предположение о свойстве генеральной совокупности, которое можно проверить, опираясь на данные выборки. Статистическую гипотезу обозначают символом H.
Обычно выдвигают и проверяют две противоречащие друг другу гипотезы:
1) нулевую (основную) H0;
2) конкурирующую (альтернативную) H1.
Примеры статистических гипотез:
1. Нулевая гипотеза H0: закон распределения результатов измерения является нормальным. Конкурирующая гипотеза H1: закон распределения результатов измерения отличен от нормального.
2. Нулевая гипотеза H0: среднее арифметическое значение генеральной совокупности результатов измерения показателя после цикла тренировок не изменилось. Конкурирующая гипотеза H1: среднее арифметическое значение увеличилось (эффективна или нет методика тренировок).
3. Нулевая гипотеза H0: генеральная дисперсия спортивных результатов спортсмена в результате проведения тренировок не изменилась. Конкурирующая гипотеза H1: генеральная дисперсия уменьшилась (изменилась или нет стабильность результатов спортсмена).
Для проверки выдвинутых нулевых гипотез используют специальные статистические критерии, разработанные математиками (Колмогоровым, Смирновым, Стьюдентом, Фишером, Пирсоном и др.).
Статистическим критерием называют определённое правило, задающее условия, при которых проверяемую нулевую гипотезу следует либо отклонить, либо принять.
Критерии подразделяются на три типа:
1. Критерии значимости, которые служат для проверки гипотез о параметрах распределений генеральной совокупности (чаще всего нормального распределения). Эти критерии называются параметрическими (критерии Стьюдента, Фишера и др.).
2. Критерии, которые для проверки гипотез не используют предположений о распределении генеральной совокупности. Эти критерии не требуют знания параметров распределений, поэтому называются непараметрическими (критерии Уилкоксона, Ван дер Вардена, Манна-Уитни).
3. Критерии, служащие для проверки гипотез о согласии распределении генеральной совокупности, из которой получена выборка, с ранее принятой теоретической моделью (чаще всего нормальным распределением), называются критериями согласия (критерий Шапиро и Уилка, хи-квадрат критерий).
С помощью критериев (обозначим их буквой К) выбирают одну из гипотез: нулевую или конкурирующую. Значение критерия, вычисленное по данным выборки, называют наблюдаемым значением критерия (Кнабл). Совокупность значений критерия, при которых отвергают нулевую гипотезу, называют критической областью. Совокупность значений критерия, при которых нулевую гипотезу принимают, называют областью принятия гипотезы (областью допустимых значений). Указанные области разграничены критическим (граничным) значением критерия, который находится по соответствующей таблице.
Основной принцип проверки статистических гипотез заключается в том, что если наблюдаемое значение критерия принадлежит критической области, то нулевую гипотезу отвергают и принимают конкурирующую. Если же оно принадлежит области принятия гипотезы – нулевую гипотезу принимают и отвергают конкурирующую.
В ходе проверки статистических гипотез мы имеем дело с односторонней или двусторонней критической областью.
1. Односторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть только больше (или только меньше) другой величины. В зависимости от выбранного критерия односторонняя критическая область может быть правосторонней или левосторонней.
Схема правосторонней критической области:
Область принятия гипотезы Принимается Н0 |
Критическая область Принимается Н1 |
Ккрит |
К |
Схема левосторонней критической области:
Критическая область Принимается Н1 |
Область принятия гипотезы Принимается Н0 |
Ккрит |
К |
2. Двусторонняя критическая область используется, если, согласно конкурирующей гипотезе, одна рассматриваемая величина может быть как больше, так и меньше (не равна) другой.
Критическая область Принимается Н1 |
Критическая область Принимается Н1 |
Область принятия гипотезы Принимается Н0 |
К1крит |
К2крит |
К |
При проверке статистической гипотезы решение экспериментатора никогда не принимается с уверенностью, т.е. всегда существует некоторый риск принять неправильное решение. Исключить на 100 % этот риск невозможно. Экспериментатор может выбрать вероятность или уровень значимости. Самыми распространенными уровнями являются 0,001; 0,01; 0,05; 0,1.
Величину p = 1 – α называют доверительной вероятностью (при уровне значимости 0,05 доверительная вероятность равна 0,95).
Ошибки, допускаемые при проверке гипотез, удобно разделить на два вида: 1) отклонение гипотезы Н0, когда она верна, – ошибка первого рода; 2) принятие гипотезы Н0, когда в действительности она не верна, – ошибка второго рода.
Вероятность ошибки первого рода и есть уровень значимости a. Величина a называется уровнем значимости критерия, по которому проверяется справедливость гипотезы Н0. Иными словами, уровень значимости a – это вероятность попадания критерияК в критическую область, если верна нулевая гипотеза. Он служит для определения по таблицам критических значений критерия (Ккрит), которые указывают положение критических точек, отделяющих критическую область от области принятия гипотезы. Обычно величина a выбирается малой. Поэтому попадание критерияК в критическую область при справедливости нулевой гипотезы мало вероятно.
Чаще всего a принимают равной 0,05. Это означает, что вероятность ошибочно принять гипотезу H1 при справедливости гипотезы H0равна только 5 %.
1. Исходя из задач исследования, формулируются статистические гипотезы.
2. Выбирается уровень значимости, на котором будут проверяться гипотезы.
3. На основе выборки, полученной из результатов измерения, определяется статистическая характеристика гипотезы.
4. Выбирается критерий для проверки статистической гипотезы.
5. Вычисляется наблюдаемое (фактическое) значение статистического критерия.
6. Определяется критическое значение статистического критерия по соответствующей таблице на основании выбранного уровня значимости и объема выборки.
7. На основе сравнения наблюдаемого и критического значения критерия в зависимости от результатов проверки нулевая гипотеза либо принимается, либо отклоняется в пользу альтернативной.