Проверка статистических гипотез
Практическое занятие № 3
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Цель работы: изучить приёмы работы с инструментами Пакета анализа и встроенными функциями MS Excel для проверки статистических гипотез.
Основные положения
Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке.
Выдвинутая гипотеза называется нулевой (или основной) и обозначается H0. Гипотеза, которая противоречит нулевой, называется конкурирующей (или альтернативной) и обозначается H1. Для проверки нулевой гипотезы используют критерий ‒ специально подобранную случайную величину, распределение которой известно. Значение критерия, вычисленное по выборкам, называется наблюдаемым (или экспериментальным) значением и обозначается Zнабл. Множество возможных значений критерия разбивается на два непересекающихся подмножества: одно из них содержит значения, при которых нулевая гипотеза отвергается (критическая область), а другое – при которых она принимается (область допустимых значений или область принятия гипотезы).
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Если наблюдаемое значение критерия принадлежит критической области, то основная гипотеза H0 отклоняется и принимается альтернативная гипотеза H1, если же Zнабл. принадлежит области допустимых значений, то принимается H0, отвергается H1.
Схема проверки гипотезы:
1. Формирование нулевой гипотезы H0 и конкурирующей гипотезы H1.
2. Выбор вероятности a − уровня значимости нулевой гипотезы H0.
3. Вычисление соответствующего уровню значимости критического значения статистики (статистического критерия) Zкр.
4. Вычисление по выборкам наблюдаемого значения критерия Zнабл..
5. Сравнение наблюдаемого значения критерия с критическим (проверка попадания критерия в критическую область). Если Zнабл. попадает в критическую область, то нулевая гипотеза H0 отвергается и принимается конкурирующая гипотеза H1. Если же нет, то нет оснований отвергать нулевую гипотезу.
В статистических пакетах обычно не используется значения задаваемого уровня значимости a. В выходных данных содержатся выборочные значения Zнабл. статистики критерия Z и вероятность того, что случайная величина Z (при условии, что верна гипотеза H0) превышает выборочное значение Zнабл., т. е. значение
Эта вероятность называется p-значением (p-level).
При двусторонней проверке p-значение равно
.
Таким образом, p – минимальный уровень значимости, при котором гипотеза может быть отвергнута.
Если p > a, где a − заданный уровень значимости, гипотеза H0 принимается на уровне значимости p. Если p < a − гипотеза H0 отклоняется, так как Zнабл. попадает в критическую область, причём вероятность ошибки первого рода равна p.
В MS Excel проверить некоторые гипотезы можно несколькими способами: с использованием встроенных функций и с помощью инструментов Пакета анализа.
Практическое занятие № 3
ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ
Цель работы: изучить приёмы работы с инструментами Пакета анализа и встроенными функциями MS Excel для проверки статистических гипотез.
Основные положения
Под статистической гипотезой понимают всякое высказывание о генеральной совокупности, проверяемое по выборке.
Выдвинутая гипотеза называется нулевой (или основной) и обозначается H0. Гипотеза, которая противоречит нулевой, называется конкурирующей (или альтернативной) и обозначается H1. Для проверки нулевой гипотезы используют критерий ‒ специально подобранную случайную величину, распределение которой известно. Значение критерия, вычисленное по выборкам, называется наблюдаемым (или экспериментальным) значением и обозначается Zнабл. Множество возможных значений критерия разбивается на два непересекающихся подмножества: одно из них содержит значения, при которых нулевая гипотеза отвергается (критическая область), а другое – при которых она принимается (область допустимых значений или область принятия гипотезы).
Различают одностороннюю (правостороннюю или левостороннюю) и двустороннюю критические области. Если наблюдаемое значение критерия принадлежит критической области, то основная гипотеза H0 отклоняется и принимается альтернативная гипотеза H1, если же Zнабл. принадлежит области допустимых значений, то принимается H0, отвергается H1.
Схема проверки гипотезы:
1. Формирование нулевой гипотезы H0 и конкурирующей гипотезы H1.
2. Выбор вероятности a − уровня значимости нулевой гипотезы H0.
3. Вычисление соответствующего уровню значимости критического значения статистики (статистического критерия) Zкр.
4. Вычисление по выборкам наблюдаемого значения критерия Zнабл..
5. Сравнение наблюдаемого значения критерия с критическим (проверка попадания критерия в критическую область). Если Zнабл. попадает в критическую область, то нулевая гипотеза H0 отвергается и принимается конкурирующая гипотеза H1. Если же нет, то нет оснований отвергать нулевую гипотезу.
В статистических пакетах обычно не используется значения задаваемого уровня значимости a. В выходных данных содержатся выборочные значения Zнабл. статистики критерия Z и вероятность того, что случайная величина Z (при условии, что верна гипотеза H0) превышает выборочное значение Zнабл., т. е. значение
Эта вероятность называется p-значением (p-level).
При двусторонней проверке p-значение равно
.
Таким образом, p – минимальный уровень значимости, при котором гипотеза может быть отвергнута.
Если p > a, где a − заданный уровень значимости, гипотеза H0 принимается на уровне значимости p. Если p < a − гипотеза H0 отклоняется, так как Zнабл. попадает в критическую область, причём вероятность ошибки первого рода равна p.
В MS Excel проверить некоторые гипотезы можно несколькими способами: с использованием встроенных функций и с помощью инструментов Пакета анализа.