Нахождение доверительных интервалов для распределений Пуассона, биномиального, нормального.
asdasdasd
28.
Статистическая проверка статистических гипотез.
Часто необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но имеются основания предположить, что он имеет определенный вид (назовем его A), выдвигают гипотезу: генеральная совокупность распределена по закону A. Таким образом, в этой гипотезе речь идет о виде предполагаемого распределения.
Возможен случай, когда закон распределения известен, а его параметры неизвестны. Если есть основания предположить, что неизвестный параметр q равен определенному значению q*, выдвигают гипотезу q = q*. Таким образом, в этой гипотезе речь идет о предполагаемой величине параметра одного известного распределения.
Возможны и другие гипотезы: о равенстве параметров двух или нескольких распределений, о независимости выборок и другие.
Статистической называют гипотезу о виде неизвестного распределения, или о параметрах известных распределений.
Например, статистическими являются гипотезы:
1. генеральная совокупность распределена по закону Пуассона;
2. дисперсии двух нормальных совокупностей равны между собой.
В первой гипотезе сделано предположение о виде неизвестного распределения, во второй – о параметрах двух известных распределений.
Гипотеза «на Марсе есть жизнь» не является статистической, поскольку в ней не идет речь ни о виде, ни о параметрах распределения.
Наряду с выдвинутой гипотезой рассматривают и противоречивую ей гипотезу. Если выдвинутая гипотеза будет отвергнута, то имеет место противоречивая гипотеза. По этой причине эти гипотезы целесообразно различать.
Нулевой (основной) называют выдвинутую гипотезу H0.
Конкурирующей (альтернативной) называют гипотезу H1, которая противоречит нулевой.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание a нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что a != 10. Коротко это записывают так: H0: a =10, H1: a != 10.
Различают гипотезы, которые содержат только одно и более одного предположений.
Простой называют гипотезу, содержащую только одно предположение. Например, если λ – параметр показательного распределения, то гипотеза H0: λ = 5 – простая. Гипотеза H0: математическое ожидание нормального распределения равно 3 (σ известно) - простая.
Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, сложная гипотеза H: λ > 5 состоит из бесчисленного множества простых вида Hi: λ = bi, где bi – любое число большее пяти. Гипотеза H0: математическое ожидание нормального распределения равно 3 (σ неизвестно) – сложная.
Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверку. Поскольку проверку производят статистическими методами, ее называют статистической. В итоге статистической проверки гипотезы о двух случаях может быть принято неправильное решение, т. е. могут быть допущены ошибки двух родов.
Ошибки первого и второго рода.
Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза.
Ошибка второго рода состоит в том, что будет принята неправильная гипотеза.
Последствия этих ошибок могут оказаться весьма различными. Например, если отвергнуто правильное решение «продолжать строительство жилого дома», то эта ошибка первого рода понесет за собой материальный ущерб; если же принято неправильное решение «продолжать строительство», несмотря на опасность обвала стройки, то эта ошибка второго рода может повлечь гибель людей. Можно привести примеры, когда ошибка первого рода влечет более тяжелые последствия, чем ошибка второго рода.
29.
Оптимальный критерий.
Статистическим критерием (или просто критерием) называют случайную величину K, которая служит для проверки нулевой гипотезы.
Например, если проверяют гипотезу о равенстве дисперсий двух нормальных генеральных совокупностей, то в качестве критерия К принимает отношение исправленных выборочных дисперсий. Это величина случайная потому, что в различных опытах дисперсии принимают различные значения.
Для проверки гипотез по данным выборок вычисляют частные значения входящих в критерий величин и таким образом получают (наблюдаемое) частное значение критерия.
Мы строим критическую область, исходя из требования, чтобы вероятность попадания в нее критерия была равна a при условии, что нулевая гипотеза справедлива. Оказывается целесообразным ввести вероятность попадания критерия в критическую область при условия, что нулевая гипотеза неверна и, следовательно, справедлива конкурирующая.
Мощностью критерия называют вероятность попадания критерия в критическую область при условии, что справедлива конкурирующая гипотеза. Другими словами, мощность критерия есть вероятность того, что нулевая гипотеза будет отвергнута, если верна конкурирующая гипотеза.
Тогда, если уровень значимости уже выбран, то критическую область следует строить так, чтобы мощность критерия была максимальной. Выполнение этого требования должно обеспечить минимальную ошибку второго рода, что конечно, желательно. Наиболее мощный критерий и есть оптимальный.
Теорема Неймана-Пирсона.
При сделанных предположениях существует наиболее мощный критерий проверки гипотезы H0. Этот критерий задается критической областью
где критическая граница c определяется из условия ϕ(c) = α, – это статистика отношения правдоподобия
.
30.
Непараметрические критерии.
Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид (назовем его A), то проверяют нулевую гипотезу: генеральная совокупность распределена по закону A.
Проверка гипотезы о предполагаемом законе неизвестного распределения производится так же, как и проверка гипотезы о параметрах распределения, т. е. при помощи специально отобранной случайной величины – критерия согласия.
Критерием согласия называют критерий проверки гипотезы о законе неизвестного распределения.
Имеется несколько критериев согласия: Пирсона, Колмогорова, Смирнова и др.
Критерий Колмогорова.
Критерий согласия Колмогорова используется для того, чтобы определить, подчиняются ли два эмпирических распределения одному закону, либо определить, подчиняется ли полученно
Критерий для эмпирической функции распределения определяется следующим образом:
где — точная верхняя грань множества , F(x) - предполагаемая модель.
Если статистика превышает процентную точку распределения Колмогорова заданного уровня значимости , то нулевая гипотеза (о соответствии закону ) отвергается. Иначе гипотеза принимается на уровне .е распределение предполагаемой модели.
31.
Критерий Пирсона.
Ограничимся описанием критерия Пирсона к проверке гипотезы о нормальном распределении генеральной совокупности (критерий аналогично применяется и для других распределений, в этом и состоит его достоинство). С этой целью будем сравниваем эмпирические (наблюдаемые) и теоретические (вычисленные в предположении нормального распределения) частоты.
Обычно теоретические и эмпирические частоты различаются.
Случайно ли расхождение частот? Возможно, что расхождение случайно (незначимо) и объясняется либо малым числом наблюдений, либо способом их группировки, либо другими причинами. Возможно, что расхождение частот неслучайно (значимо) и объясняется там, что теоретические частоты вычислены исходя из неверной гипотезы о нормальном распределении генеральной совокупности.
Критерий Пирсона отвечает на поставленный выше вопрос. Правда, как и любой другой критерий, он не доказывает справедливость гипотезы, а лишь устанавливает на принятом уровне значимости ее согласие или несогласие с данными наблюдений.
Пусть по выборке объема n получено эмпирическое распределение.
Допустим, что в предположении нормального распределения генеральной совокупности вычислены теоретические частоты . При уровне значимости a требуется проверить нулевую гипотезу: генеральная совокупность распределена нормально.
В качестве критерия проверки нулевой гипотезы примем случайную величину
.
Критическую точку находим по таблице по заданному уровню значимости a и числу степеней свободы k = s – 1 – r (s – число групп выборки, r – число параметров предполагаемого распределения), после чего сравниваем наблюдаемое значение критерия с критической точкой.
Если - нет оснований отвергнуть нулевую гипотезу.
Если – нулевую гипотезу отвергают.