Проверка гипотезы о равенстве среднего генеральной совокупности некоторому заданному значению
Один из самых простых случаев проверки статистической гипотезы заключается в проверке равенства между средним генеральной совокупности и некоторым заданным значением. Заданное значение представляет собой некоторое фиксированное число µ0, полученное не из выборочных данных. Гипотезы имеют следующий вид.
Н0: µ = µ0 – нулевая гипотеза утверждает, что неизвестное среднее значение генеральной совокупности µ в точности равно заданному значению µ0.
Н1: µ µ0 - альтернативная гипотеза утверждает, что неизвестное среднее значение генеральной совокупности µ не равно заданному значению µ0.
Обратите внимание, что фактически здесь фигурируют три различных числа, имеющих отношение к среднему:
§ µ - неизвестное среднее генеральной совокупности, которое вас интересует;
§ µ0 — заданное значение, в отношении которого проверяют гипотезу;
§ — известное выборочное среднее, которое используют для вынесения решения о принятии гипотезы. Из указанных трех чисел только это значение является случайной величиной, так как оно рассчитано из данных выборки. Заметим, что является оценкой и, следовательно, представляет µ.
Проверка гипотезы заключается в сравнении двух известных величин и µ0. Если эти значения отличаются сильнее, чем можно было бы ожидать исходя из случайности, то нулевую гипотезу µ = µ0 отклоняют, так как предоставляет информацию о неизвестном среднем µ. Если значения и µ0 достаточно близки, то нулевую гипотезу µ = µ0 принимают. Но что означает “значения близки”? Где находится необходимая граница? Близость должна определяться на основе значения , поскольку эта стандартная ошибка определяет степень случайности . Таким образом, если и µ0 отстоят друг от друга на расстоянии достаточного количества стандартных ошибок, то это является убедительным доказательством того, что µ не равно µ0.
Существуют два различных метода проверки гипотезы и получения результата. Первый метод использует доверительные интервалы, о которых шла речь в предыдущей главе. Это более простой метод, потому что (а) вы уже знаете, как строить и интерпретировать доверительный интервал, и (б) доверительный интервал интерпретируется непосредственно, поскольку он выражен в тех же единицах измерения, что и данные (например, в долларах, количестве людей, количестве поломок). Второй метод (основанный на t-статистике) является более традиционным, но интуитивно менее понятным, поскольку заключается в том, чтобы вычислить показатель, измеренный не в тех же единицах, что и данные, сравнить полученное значение с соответствующим критическим значением из t- таблицы и затем сделать вывод.
Не имеет значения, какой метод использовать для проверки гипотезы (на основе доверительного интервала или на основе t-статистики), поскольку оба метода дают всегда одинаковые результаты. Может, вам захочется чаще использовать метод на основе доверительного интервала, так как он быстрее, проще и дает больше информации о ситуации. В то же время вы можете захотеть узнать об использовании метода на основе t-статистики, так как именно этот метод обычно применяют на практике. Поскольку два этих метода приводят к одному результату, оба их называют t-тестом.