Глава 3. Проверка статистических гипотез
Глава 3. Проверка статистических гипотез
Статистическая гипотеза
Статистической гипотезой называют предположение либо о виде распределения генеральной совокупности (закон распределения неизвестен), либо о значениях неизвестных параметров известного закона распределения. Например, статистическими являются гипотезы:
1) генеральная совокупность распределена по закону Пуассона;
2) математическое ожидание а нормально распределенной генеральной совокупности равно числу а0;
3) дисперсии двух нормальных совокупностей равны между собой.
Статистические гипотезы делятся на параметрические (в них говорится о значениях параметров известного распределения) и непараметрические (в них высказывается предположение о виде закона распределения). Например, гипотеза 1) является непараметрической, а гипотезы 2) и 3) – параметрическими.
Наряду с проверяемой гипотезой (ее называют нулевой или основной Н0.) рассматривают и противоречащую ей гипотезу (ее называют конкурирующей или альтернативной Н1). Нулевая и альтернативная гипотеза взаимно исключают друг друга. Процедура проверки применяется к нулевой гипотезе Н0. Если в результате проверки нулевую гипотезу Н0 оказывается целесообразней отвергнуть, то принимается альтернативная гипотеза.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что а ¹10. Коротко это записывают так: Н0: а=10; Н1: а¹10.
Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Нулевая гипотеза– это простая гипотеза, в ней говорится о конкретных значениях параметров или о конкретном распределении. Альтернативная гипотеза сложная, в ней подразумевается бесконечно много возможностей.
Критерий согласия Пирсона
Пусть эмпирическое распределение задано в виде последовательности интервалов одинаковой длины h и соответствующих им частот . Требуется, используя критерий Пирсона, проверить нулевую гипотезу о том, что’ генеральная совокупность Х распределена нормально, при конкурирующей гипотезе о том, что генеральная совокупность Х не распределена нормально.
Для того чтобы при уровне значимости проверить гипотезу о нормальном распределении генеральной совокупности, необходимо:
1. Вычислить, например методом произведений, выборочное среднее и выборочное среднее квадратическое отклонение , Причем в качестве вариант берут середину i–того частичного интервала ( , где s – число интервалов эмпирическом распределении).
2. Пронормировать Х, т. е. перейти к случайной величине , и вычислить концы интервалов: , , причем наименьшее значение Z, т. е. z0, полагают равным , а наибольшее, т. е. zs, полагают равным .
3. Вычислить теоретические частоты , где n – объем выборки; – вероятность попадания Х в интервалы , – функция Лапласа.
4. Сравнить эмпирические и теоретические частоты с помощью критерия Пирсона. Для этого:
а) находят наблюдаемое значение критерия Пирсона ;
б)по таблице критических точек распределения по заданному уровню значимости и числу степеней свободы (s – число интервалов выборки) находят критическую точку правосторонней критической области .
Если , то нет оснований отвергнуть гипотезу о нормальном распределении генеральной совокупности (эмпирические данные согласуются с нормальным распределением). Если , то нулевую гипотезу отвергают (эмпирические данные не согласуются с нормальным распределением).
Замечание. Интервалы, содержащие малочисленные эмпирические частоты ( <5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле следует в качестве s принять число интервалов, оставшихся после объединения интервалов.
Пример.При уровне значимости 0,05 проверить гипотезу о нормальном распределении генеральной совокупности, если известны эмпирические и теоретические частоты:
эмп. частоты | ||||||||
теорет. частоты |
Решение. Вычислим , для чего составим расчетную таблицу:
-1 -4 -8 -7 | 0,07 0,38 0,78 0,49 1,07 1,32 0,08 | 12,07 34,38 66,78 113,49 95,07 24,32 15,08 | |||||
373,19 |
Контроль: :
Вычисления произведены правильно.
Найдем число степеней свободы, учитывая, что число групп выборки (число различных вариант) ; .
По таблице критических точек распределения , по уровню значимости и числу степеней свободы k=5 находим .
Так как - нет оснований отвергнуть нулевую гипотезу. Другими словами, расхождение эмпирических и теоретических частот незначимое. Следовательно, данные наблюдений согласуются с гипотезой о нормальном распределении генеральной совокупности.
Глава 3. Проверка статистических гипотез
Статистическая гипотеза
Статистической гипотезой называют предположение либо о виде распределения генеральной совокупности (закон распределения неизвестен), либо о значениях неизвестных параметров известного закона распределения. Например, статистическими являются гипотезы:
1) генеральная совокупность распределена по закону Пуассона;
2) математическое ожидание а нормально распределенной генеральной совокупности равно числу а0;
3) дисперсии двух нормальных совокупностей равны между собой.
Статистические гипотезы делятся на параметрические (в них говорится о значениях параметров известного распределения) и непараметрические (в них высказывается предположение о виде закона распределения). Например, гипотеза 1) является непараметрической, а гипотезы 2) и 3) – параметрическими.
Наряду с проверяемой гипотезой (ее называют нулевой или основной Н0.) рассматривают и противоречащую ей гипотезу (ее называют конкурирующей или альтернативной Н1). Нулевая и альтернативная гипотеза взаимно исключают друг друга. Процедура проверки применяется к нулевой гипотезе Н0. Если в результате проверки нулевую гипотезу Н0 оказывается целесообразней отвергнуть, то принимается альтернативная гипотеза.
Например, если нулевая гипотеза состоит в предположении, что математическое ожидание а нормального распределения равно 10, то конкурирующая гипотеза, в частности, может состоять в предположении, что а ¹10. Коротко это записывают так: Н0: а=10; Н1: а¹10.
Простой называют гипотезу, содержащую только одно предположение. Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез.
Нулевая гипотеза– это простая гипотеза, в ней говорится о конкретных значениях параметров или о конкретном распределении. Альтернативная гипотеза сложная, в ней подразумевается бесконечно много возможностей.