Проверка гипотез о законе распределения
В большинстве случаев закон распределения изучаемой случайной величины Х неизвестен, но существуют основания предполагать, что он имеет вполне определенный вид: нормальный, экспоненциальный или какой-либо другой.
В качестве статистического критерия проверки гипотезы о предполагаемом законе неизвестного распределения используют критерий согласия, который используют для проверки согласия предполагаемого вида распределения с опытными данными на основе исследуемой выборки. В статистике используют различные критерии согласия: Пирсона, Колмогорова, Фишера и др.
Критерий Пирсона
Наиболее часто при проверке гипотезы о предполагаемом законе неизвестного распределения пользуются критерием Пирсона.
Пусть задана выборка из генеральной совокупности в виде статистического интервального ряда.
Необходимо проверить нулевую гипотезу о том, что генеральная совокупность распределена по нормальному закону, пользуясь критерием Пирсона.
Правило проверки:
1. Вычисляют и (формулы 1.10-1.12, 1.16).
2. Находят теоретические частоты .
Вычислить теоретические частоты можно по формуле:
, (1.45)
где – объем выборки,
– шаг,
; (1.46)
(1.47)
- функция Гаусса, значение которой в точке , находится по таблице (приложение 3).
(1.48)
- вероятность попадания значений случайной величины в -й интервал.
Для определения составляют вспомогательную таблицу (табл. 1.8).
Таблица 1.8
3. Сравнивают эмпирические ( ) и теоретические ( ) частоты с использованием критерия Пирсона по алгоритму:
1) составляется расчетная табл.1.9, из которой определяется наблюдаемое значение критерия по формуле:
. (1.49)
Таблица 1.9
2) Определяется число степеней свободы на основании формулы:
, (1.50)
где – число интервалов;
– число параметров предполагаемого распределения.
Для нормального распределения число степеней свободы равно в виду того, что - нормальный закон распределения характеризуется двумя параметрами и .
4. По данным таблицы критических точек (квантилей) распределение (приложение 4) по заданному уровню значимости и числу степеней свободы определяют правосторонней критической области.
Когда то отвергнуть гипотезу о нормальном распределении генеральной совокупности оснований не существует.
В случае если – гипотеза отвергается.
Замечание:
1) Объем изучаемой выборки должен быть достаточно большой .
2) Малочисленные частоты при следует объединять, в том числе и соответствующие им теоретические частоты.
В случае, когда производилось объединение частот при определении числа степеней свободы по формуле в качестве необходимо принимать число интервалов, оставшихся после объединения частот.
Критерий Колмогорова
На практике кроме критерия часто используют критерий Колмогорова, в котором в качестве меры расхождения между теоретическим и эмпирическим распределениями рассматривается максимальное значение абсолютной величины разности между эмпирической функцией распределения и соответствующей ей теоретической функцией распределения:
, (1.51)
называемой статистикой критерия Колмогорова.
Критерий Колмогорова в своем классическом виде является более мощным, чем критерий Пирсона и может быть использован для проверки гипотезы о соответствии эмпирического распределения любому теоретическому непрерывному распределению с заранее известными параметрами.
Доказано, что какой бы ни была функция распределения непрерывной случайной величины , при неограниченном увеличении числа наблюдений вероятность неравенства стремится к пределу:
. (1.52)
Задавая уровень значимости , из соотношения (1.53):
, (1.53)
можно определить соответствующее критическое значение .
При этом график функции K(l) имеет следующий вид:
Значения K(l) находят, пользуясь данными табл. 1.10.
Таблица 1.10
l | K(l) | l | K (l) |
0,30 | 1,0000 | 1,10 | 0,1777 |
0,35 | 0,9997 | 1,20 | 0,1122 |
0,40 | 0,9972 | 1,30 | 0,681 |
0,45 | 0,9874 | 1,40 | 0,397 |
0,50 | 0,9639 | 1,50 | 0,222 |
0,55 | 0,9228 | 1,60 | 0,120 |
0,60 | 0,8643 | 1,70 | 0,052 |
0,70 | 0,7112 | 1,90 | 0,015 |
0,75 | 0,6272 | 2,00 | 0,007 |
0,80 | 0,5441 | 2,10 | 0,0003 |
0,85 | 0,4653 | 2,20 | 0,0001 |
0,90 | 0,3927 | 2,30 | 0,0001 |
0,95 | 0,3275 | 2,40 | 0,0000 |
1,00 | 0,2700 | 2,50 | 0,0000 |
Если найденному значению соответствует очень малая вероятность, то есть , то расхождение между эмпирическим и теоретическим распределениями нельзя считать случайным. Следовательно, рассматриваемая выборка не подчиняется нормальному закону распределения.
Если вероятность , то расхождение между частотами может быть случайным, и распределения хорошо соответствуют одно другому.
Схема применения критерия Колмогорова следующая:
1. Строят эмпирическую функцию распределения и предполагаемую теоретическую функцию распределения .
2. Определяют меру расхождения между теоретическим и эмпирическим распределениями с использованием формулы (1.54) и вычисляют величину :
. (1.54)
где – максимум абсолютного значения разности между накопленными эмпирическими частотами М и накопленными теоретическими частотами ,
n – объем выборки.
3. Если вычисленное значение больше критического , определенного при уровне значимости , то нулевая гипотеза о том, что случайная величина имеет заданный закон распределения, отвергается (односторонний критерий). Если же , то считают, что гипотеза не противоречит опытным данным и принимается.
Замечание:
Можно отметить, что решение подобных задач можно было бы найти с помощью критерия . Потенциальное преимущества критерия Колмогорова в том, что он не требует группирования данных (с неизбежной потерей информации), а дает возможность рассматривать индивидуальные наблюдаемые значения. Этот критерий можно успешно применять для малых выборок. Считается, что его мощность выше, чем у критерия .