Тема 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

На разных стадиях статистического исследования и моделирования возникает необходимость в формулировке и экспериментальной проверке некоторых предположений (гипотез) относительно природы и величины неизвестных параметров анализируемой генеральной совокупности (совокупностей). Например, исследователь высказывает предположение: "выборка извлечена из нормальной генеральной совокупности" или "генеральная средняя анализируемой совокупности равна пяти". Такие предположения называются статистическими гипотезами.

Сопоставление высказанной гипотезы относительно генеральной совокупности с имеющимися выборочными данными, сопровождаемое количественной оценкой степени достоверности получаемого вывода, осуществляется с помощью того или иного статистического критерия и называется проверкой статистических гипотез.

Выдвинутая гипотеза называется нулевой (основной). Ее принято обозначать Н0.

По отношению к высказанной (основной) гипотезе всегда можно сформулировать альтернативную (конкурирующую), противоречащую ей. Альтернативную (конкурирующую) гипотезу принято обозначать Н1.

Цель статистической проверки гипотез состоит в том, чтобы на основании выборочных данных принять решение о справедливости основной гипотезы Н0.

Если выдвигаемая гипотеза сводится к утверждению о том, что значение некоторого неизвестного параметра генеральной совокупности в точности равно заданной величине, то эта гипотеза называется простой, например: "среднедушевой совокупный доход населения России составляет 650 рублей в месяц"; "уровень безработицы (доля безработных в численности экономически активного населения) в России равна 9%" . В других случаях гипотеза называется сложной.

В качестве нулевой гипотезы Н0 принято выдвигать простую гипотезу, т.к. обычно бывает удобнее проверять более строгое утверждение.

По своему содержанию статистические гипотезы можно подразделить на несколько основных типов[6]:

- гипотезы о виде закона распределения исследуемой случайной величины;

- гипотезы о числовых значениях параметров исследуемой генеральной совокупности[7];

- гипотезы об однородности двух или нескольких выборок или некоторых характеристик анализируемых совокупностей;

- гипотезы об общем виде модели, описывающей статистическую зависимость между признаками и др.

Так как проверка статистических гипотез осуществляется на основании выборочных данных, т.е. ограниченного ряда наблюдений, решения относительно нулевой гипотезы Н0 имеют вероятностный характер. Другими словами, такое решение неизбежно сопровождается некоторой, хотя возможно и очень малой, вероятностью ошибочного заключения как в ту, так и в другую сторону.

Так, в какой-то небольшой доле случаев α нулевая гипотеза Н0 может оказаться отвергнутой, в то время как в действительности в генеральной совокупности она является справедливой. Такую ошибку называют ошибкой первого рода. А ее вероятность принято называтьуровнем значимости и обозначать α.

Наоборот, в какой-то небольшой доле случаев β нулевая гипотеза Н0 принимается, в то время как на самом деле в генеральной совокупности она ошибочна, а справедлива альтернативная гипотеза Н1. Такую ошибку называют ошибкой второго рода. Вероятность ошибки второго рода принято обозначать β. Вероятность 1 - β называют мощностью критерия.

При фиксированном объеме выборки можно выбрать по своему усмотрению величину вероятности только одной из ошибок α или β. Увеличение вероятности одной из них приводит к снижению другой. Принято задавать вероятность ошибки первого рода α - уровень значимости. Как правило, пользуются некоторыми стандартными значениями уровня значимости α: 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Тогда, очевидно, из двух критериев, характеризующихся одной и той же вероятностью α отклонить правильную в действительности гипотезу Н0, следует принять тот, который сопровождается меньшей ошибкой второго рода β, т.е. большей мощностью. Снижения вероятностей обеих ошибок α и β можно добиться путем увеличения объема выборки.

Правильное решение относительно нулевой гипотезы Н0 также может быть двух видов:

- будет принята нулевая гипотеза Н0, тогда как и на самом деле в генеральной совокупности верна нулевая гипотеза Н0 ; вероятность такого решения 1 - α;

- нулевая гипотеза Н0 будет отклонена в пользу альтернативной Н1, тогда как и на самом деле в генеральной совокупности нулевая гипотеза Н0 отклоняется в пользу альтернативной Н1; вероятность такого решения 1 - β - мощность критерия.

Результаты решения относительно нулевой гипотезы можно проиллюстрировать с помощью таблицы 8.1.

Таблица 8.1

Нулевая гипотеза Н0 Результаты решения относительно нулевой гипотезы Н0
отклонена принята
верна ошибка первого рода, ее вероятность Р(Н10) = α правильное решение, его вероятность Р(Н00) = 1 - α
не верна правильное решение, его вероятность Р(Н11) = 1 - β ошибка второго рода, ее вероятность Р(Н01) = β

Проверка статистических гипотез осуществляется с помощью статистического критерия (назовем его в общем виде К), являющего функцией от результатов наблюдения.

Статистический критерий - это правило (формула), по которому определяется мера расхождения результатов выборочного наблюдения с высказанной гипотезой Н0.

Статистический критерий, как и всякая функция от результатов наблюдения, является случайной величиной и в предположении справедливости нулевой гипотезы Н0подчинена некоторому хорошо изученному (и затабулированному) теоретическому закону распределения с плотностью распределения f(k).

Выбор критерия для проверки статистических гипотез может быть осуществлен на основании различных принципов. Чаще всего для этого пользуются принципом отношения правдоподобия, который позволяет построить критерий наиболее мощный среди всех возможных критериев. Суть его сводится к выбору такого критерия К с известной функцией плотности f(k) при условии справедливости гипотезы Н0, чтобы при заданном уровнем значимости α можно было бы найти критическую точку Ккр.распределения f(k), которая разделила бы область значений критерия на две части: область допустимых значений, в которой результаты выборочного наблюдения выглядят наиболее правдоподобными, и критическую область, в которой результаты выборочного наблюдения выглядят менее правдоподобными в отношении нулевой гипотезы Н0.

Если такой критерий К выбран, и известна плотность его распределения, то задача проверки статистической гипотезы сводится к тому, чтобы при заданном уровне значимости α рассчитать по выборочным данным наблюдаемое значение критерия Кнабл. и определить является ли оно наиболее или менее правдоподобным в отношении нулевой гипотезы Н0.

Проверка каждого типа статистических гипотез осуществляется с помощью соответствующего критерия, являющегося наиболее мощным в каждом конкретном случае. Например, проверка гипотезы о виде закона распределения случайной величины может быть осуществлена с помощью критерия согласия Пирсона χ2; проверка гипотезы о равенстве неизвестных значений дисперсий двух генеральных совокупностей - с помощью критерия F - Фишера; ряд гипотез о неизвестных значениях параметров генеральных совокупностей проверяется с помощью критерия Z - нормальной распределенной случайной величины и критерия T- Стьюдента и т.д.

Значение критерия, рассчитываемое по специальным правилам на основании выборочных данных, называется наблюдаемым значением критерия (Кнабл.).

Значения критерия, разделяющие совокупность значений критерия на область допустимых значений (наиболее правдоподобных в отношении нулевой гипотезы Н0) и критическую область (область значений, менее правдоподобных в отношении таблицам распределения случайной величины К, выбранной в качестве критерия, называются критическими точками(Ккр.).

Областью допустимых значений (областью принятия нулевой гипотезы Н0) называют совокупность значений критерия К, при которых нулевая гипотеза Н0 не отклоняется.

Критической областью называют совокупность значений критерия К, при которых нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.

Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области.

Если конкурирующая гипотеза - правосторонняя, например, Н1: а > а0, то и критическая область - правосторонняя (рис 1). При правосторонней конкурирующей гипотезе критическая точка (Ккр. правосторонняя)принимает положительные значения.

Если конкурирующая гипотеза - левосторонняя, например, Н1: а < а0, то и критическая область - левосторонняя (рис 2). При левосторонней конкурирующей гипотезе критическая точка принимает отрицательные значения (Ккр. левосторонняя).

Если конкурирующая гипотеза - двусторонняя, например, Н1: а ¹ а0, то и критическая область - двусторонняя (рис 3). При двусторонней конкурирующей гипотезе определяются две критические точки (Ккр. левосторонняя и Ккр. правосторонняя).

 
  Тема 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ - student2.ru

Область допустимых Критическая

значений область

К

0 Ккр.

Рис 8.1. Правосторонняя критическая область.

 
  Тема 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ - student2.ru

Критическая Область допустимых

область значений

К

кр. 0 Ккр.

Рис 8.2. Левосторонняя критическая область.

 
  Тема 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ - student2.ru

Критическая Область допустимых Критическая

область значений область

К

кр. 0 Ккр.

Рис 8.3. Двусторонняя критическая область.

Основной принцип проверки статистических гипотез состоит в следующем:

- если наблюдаемое значение критерия (Кнабл.) принадлежит критической области, то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1;

- если наблюдаемое значение критерия (Кнабл.) принадлежит области допустимых значений, то нулевую гипотезу Н0 нельзя отклонить.

Можно принять решение относительно нулевой гипотезы Н0 путем сравнения наблюдаемого (Кнабл.) и критического значений критерия (Ккр.).

При правосторонней конкурирующей гипотезе:

Если Кнабл. £ Ккр., то нулевую гипотезу Н0 нельзя отклонить;

если Кнабл. > Ккр., то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.

При левосторонней конкурирующей гипотезе:

Если Кнабл. ³ - Ккр., то нулевую гипотезу Н0 нельзя отклонить;

если Кнабл. < - Ккр., то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.

При двусторонней конкурирующей гипотезе:

Если - Ккр. £ Кнабл. £ Ккр., то нулевую гипотезу Н0 нельзя отклонить;

если Кнабл. > Ккр. или Кнабл. < - Ккр., то нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1.

Алгоритм проверки статистических гипотез сводится к следующему:

1. Сформулировать нулевую Н0 и альтернативную Н1 гипотезы;

2. Выбрать уровень значимости a;

3. В соответствии с видом выдвигаемой нулевой гипотезы Н0 выбрать статистический критерий для ее проверки, т.е. - специально подобранную случайную величину К, точное или приближенное распределение которой заранее известно;

4. По таблицам распределения случайной величины К, выбранной в качестве статистического критерия, найти его критическое значение Ккр. (критическую точку или точки);

5. На основании выборочных данных по специальному алгоритму вычислитьнаблюдаемое значение критерия Кнабл.;

6. По виду конкурирующей гипотезы Н1 определить тип критической области;

7. Определить, в какую область (допустимых значений или критическую) попадает наблюдаемое значение критерия Кнабл., и в зависимости от этого - принять решение относительно нулевой гипотезы Н0.

Следует заметить, что даже в том случае, если нулевую гипотезу Н0 нельзя отклонить, это не означает, что высказанное предположение о генеральной совокупности является единственно подходящим: просто ему не противоречат имеющиеся выборочные данные, однако таким же свойством наряду с высказанной могут обладать и другие гипотезы.

Можно интерпретировать результаты проверки нулевой гипотезы следующим образом:

- если в результате проверки нулевую гипотезу Н0 нельзя отклонить, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью отклонить нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 больше α, а конкурирующей Н1 - меньше 1 - α;

- если в результате проверки нулевая гипотеза Н0 отклоняется в пользу конкурирующей Н1, то это означает, что имеющиеся выборочные данные не позволяют с достаточной уверенностью принять нулевую гипотезу Н0, вероятность нулевой гипотезы Н0 меньше α, а конкурирующей Н1 - больше 1 - α.

В справочной таблице приведены критерии проверки гипотез.

Наши рекомендации