Проверка гипотезы о законе распределения случайной величины

Закон распределения случайной величины определяют согласно известным критериям проверки статистических гипотез Персона (χ²), Мизеса (ω²). Причем, когда идет речь о выборке данных небольшого объема (до 100 значений) рекомендуется проверять гипотезу о законе распределения случайной величины согласно критерию Мізеса (ω²), в противном случае – . Персона (χ²).

В основе отмеченных критериев лежит сравнение (приглаживание) эмпирической и теоретической функции распределения.

Эмпирическая функция распределения имеет вид ступенчатой ломаной линии. Эмпирическая функция распределения может быть построена за вариационным рядом полученной реализации случайной величины из соотношения:

Проверка гипотезы о законе распределения случайной величины - student2.ru ,

где: Проверка гипотезы о законе распределения случайной величины - student2.ru – полученные реализации случайной величины T, образующие вариационный ряд.

Построив эмпирическую функцию распределения, высказывается нулевая гипотеза о законе распреледения случайной величины Т.

Неизвестный закон подбирается исходя из вида эмпирической функции распределения и потом проверяется на согласие с помощью разных критериев.

Критерий ω² Мизеса. В качестве меры отклонения эмпирической функции распределения Q_n^*(t) от гипотетической Q(t) принята среднеквадратичная метрика, то есть средний квадрат отклонений по всем возможным значениями аргумента (4). Решение (4) для ступенчатой функции распределения можно записать в виде соотношения:

Проверка гипотезы о законе распределения случайной величины - student2.ru (9)

Из (9) видно, что данный критерий учитывает индивидуальные члены выборки. На практике предлагается использовать следующую формулу для определения статистики:

Проверка гипотезы о законе распределения случайной величины - student2.ru , (10)

где: Q(t_i) – значение гипотетической функции распределения при Проверка гипотезы о законе распределения случайной величины - student2.ru . Полученное значение статистики (10) сравнивается с критическим значением nω_n²(α), табл. 1 (значение статистики nω_n² совпадает из значения статистики критерия Андерсена). Если Проверка гипотезы о законе распределения случайной величины - student2.ru , то гипотеза Н₀ принимается, в пртивном случае – отклоняется.

Критерий χ² К.Пирсона. Данный критерий часто применяется на практике статистических исследований. Результаты статистических испытаний n значений исходной выборки случайной величины Т разбиваются на k интервалов Δ₁, Δ₂,.. Δ_n и получают статистический ряд в виде представленном в табл. 3.

Таблица 2

Статистический ряд разбивки выборки по ячейкам

Δ_i	x₁; x₂;x₃	x₄; x₅;x₆	…	x_n-2; x_n-1;x_n
p_i^*	p_i^*	p_i^*	…	p_i^*

Зная теоретический (гипотетический) закон распределения Q(t_i), находят теоретические вероятности попадания случайной величины Т в каждый из интервалов р₁, р₂,. .р_n при этом их сумма должна равняться единице. Проверка согласованности теоретического и статистического распределений заключается в проверке расхождений между теоретическими вероятностями р_і и полученными частотами. Как меру расхождения целесообразно принять сумму квадратов отклонения (р_і*– р_і), взятых с некоторыми взвешивающими коэффициентами С_и. К Пирсон предложил как взвешивающие коэффициенты принять величину

Проверка гипотезы о законе распределения случайной величины - student2.ru .

При таком выборе коэффициентов С_i мера расхождения будет

Проверка гипотезы о законе распределения случайной величины - student2.ru , (11)

где: Проверка гипотезы о законе распределения случайной величины - student2.ru – частота появления событий в і-ом интервале;

n_i – число значений величины Т, которые попали в i-й интервал;

n – общее число значений в выборке t₁, t₂,.. t_n.

Статистика (11) практически не зависит от функции распределения Q(t) и от объема выборки n, а зависит только от числа разрядов (интервалов) k, и с увеличением n закон распределения этой статистики приближается к распределению χ² из r=k-1 степенью свободы, для которого есть специальные таблицы.

Для проверки исходной гипотезы Н₀ при заданном или избранном уровне значимости α полученная статистика (11) сравнивается с критическим значением χ_r²(α) и если χ2 < χr2(α), то принимается гипотеза о согласии теоретического и статистического законов распределения, если же χ² > χ_r²(α), то гипотеза Н₀ отклоняется.

Данный критерий применяется при большом объеме выборки и при числе реализаций в интервале не менее 5-10. При таких условиях вероятность β ошибки второго рода будет минимальной.

К изъянам критерия χ² стоит отнести произвольность распределения данных на разряды и потерю информации при группировке выходных данных/

Как при использовании критерия Мизеса, так и при использовании критерия К. Персона стоит задача оценки параметров неизвестного (гипотетического) распределения. В общем случае предлагается применять для решения этой задачи метод максимального правдоподобия.

2 КОНТРОЛЬНЫЕ ВОПРОСЫ

1. Что называется выборкой, вариационным рядом. Какие требования относятся к выборке?

2 Доложить порядок статистической обработки информации по надежности;

3 Что называется уровнем значимости?

4 Для чего применяется критерий Андерсена?

5 Критерий К.Пирсона и Мизеса: условия применения, преимущества и недостатки этих критериев.

6. Методика построения гистограммы.

7. Формирование гипотезы о распределении ошибок и проверка ее истинности