Проверка адекватности теоретического распределения

Как бы хорошо ни была подобрана функция теоретического распределения Проверка адекватности теоретического распределения - student2.ru , сглаживающая эмпирическое распределение (гистограмму), между ней и статистическим распределением всегда имеется различие (см. рис. 3.4).

– Чем это обусловлено?

Возможно это случайность, которая проявляется как выборочная ошибка вследствие ограниченности количества измерений, а возможно, что расхождение весьма существенно и обусловлено неправильно выбранным распределением Проверка адекватности теоретического распределения - student2.ru , неудовлетворительно отражающим статистическое распределение. Следовательно, задача состоит в обнаружении некоторого «согласия» между исходными данными и ожидаемыми теоретическими значениями. Для решения этой задачи используют так называемые «критерии согласия».

Для выявления «согласия» между подобранной функцией Проверка адекватности теоретического распределения - student2.ru и экспериментальным (статистическим) распределением выдвигается нулевая гипотеза Проверка адекватности теоретического распределения - student2.ru , которая заключается в предположении, что нет существенного различия между указанными распределениями, а любое зафиксированное отклонение случайно и объясняется лишь выборочной ошибкой, то есть ограниченностью числа измерений реализаций случайной величины. Кроме того, выдвигается конкурирующая (альтернативная) гипотеза Проверка адекватности теоретического распределения - student2.ru , которая противоречит нулевой.

Затем осуществляется проверка состоятельности гипотезы Проверка адекватности теоретического распределения - student2.ru . Для этого используют статистические критерии. Под статистическим критерием понимают случайную величину Проверка адекватности теоретического распределения - student2.ru , которая служит для проверки гипотезы. Всю совокупность значений критерия разделяют на две области:

– область принятия гипотезы – область значений критерия, при которых нулевую гипотезу принимают;

– критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают (может быть левосторонней, правосторонней и двусторонней).

Граничная точка между двумя указанными областями представляет собой критическую точку (границу) Проверка адекватности теоретического распределения - student2.ru .

При проверке гипотезы могут быть допущены ошибки первого и второго рода:

– ошибка первого рода – отвергнута правильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают Проверка адекватности теоретического распределения - student2.ru .

– ошибка второго рода – принята неправильная нулевая гипотеза. Вероятность ошибки второго рода обозначают Проверка адекватности теоретического распределения - student2.ru . Вероятность события, заключающегося в отсутствии ошибки второго рода Проверка адекватности теоретического распределения - student2.ru называют мощностью критерия.

Статистический критерий для проверки нулевой гипотезы применяется следующим образом:

– Вычисляют наблюдаемые (эмпирические) значения критерия Проверка адекватности теоретического распределения - student2.ru по эмпирическим выборкам.

– Отыскивают критическую область критерия. Для чего задаются уровнем значимости Проверка адекватности теоретического распределения - student2.ru и ищут критические точки из следующих соотношений:

а) для правосторонней критической области:

Проверка адекватности теоретического распределения - student2.ru , (3.29)

б) для левосторонней критической области:

Проверка адекватности теоретического распределения - student2.ru , (3.30)

в) для двусторонней симметричной области:

Проверка адекватности теоретического распределения - student2.ru . (3.31)

Чаще всего при решении задач статистической проверки гипотез используют критерий Проверка адекватности теоретического распределения - student2.ru (хи-квадрат) или, иначе, критерий согласия Пирсона.

Количественной мерой расхождения между теоретическим и экспериментальным распределением является величина так называемой статистики Проверка адекватности теоретического распределения - student2.ru , рассчитываемая по выражению:

Проверка адекватности теоретического распределения - student2.ru , (3.32)

где Проверка адекватности теоретического распределения - student2.ru – количество измеренных значений случайной величины, попавших в q-ый интервал гистограммы;

Проверка адекватности теоретического распределения - student2.ru – общее количество измерений;

Проверка адекватности теоретического распределения - student2.ru – теоретическая вероятность попадания случайной величины в q-ый интервал, определяемая по функции Проверка адекватности теоретического распределения - student2.ru .

Распределение Проверка адекватности теоретического распределения - student2.ru зависит, кроме переменной, от параметра Проверка адекватности теоретического распределения - student2.ru , называемого числом степеней свободы. Число степеней свободы Проверка адекватности теоретического распределения - student2.ru определяется как разность между количеством разрядов рассматриваемой гистограммы Проверка адекватности теоретического распределения - student2.ru и числом независимых условий, использованных при подборе теоретического распределения Проверка адекватности теоретического распределения - student2.ru . К таким условиям относятся: равенство единице суммы площадей всех столбцов гистограммы (должно выполняться всегда), равенство моментов теоретического распределения их соответствующим статистическим оценкам (математическое ожидание, дисперсия и т.д.). А также иных, использованных при подборе вида функции Проверка адекватности теоретического распределения - student2.ru . Если число таких условий Проверка адекватности теоретического распределения - student2.ru , то для числа степеней свободы распределения Проверка адекватности теоретического распределения - student2.ru имеем:

Проверка адекватности теоретического распределения - student2.ru . (3.33)

Схема применения критерия Пирсона о согласованности эмпирического и теоретического распределений Проверка адекватности теоретического распределения - student2.ru следующая:

– По формуле (4.32) вычисляется наблюдаемое значение критерия Проверка адекватности теоретического распределения - student2.ru .

– Определяется число степеней свободы. Для полученной гистограммы с учетом указанных допущений оно равно: Проверка адекватности теоретического распределения - student2.ru .

– Задаются уровнем значимости и по таблице критических точек находят Проверка адекватности теоретического распределения - student2.ru . Уровень значимости следует задать: Проверка адекватности теоретического распределения - student2.ru , тогда Проверка адекватности теоретического распределения - student2.ru .

– Если Проверка адекватности теоретического распределения - student2.ru гипотеза отвергается, как несостоятельная, следовательно, необходимо для «сглаживания» воспользоваться иным теоретическим распределением, например одним из представленных в таблице 4.7.

Важно заметить, что статистические критерии лишь указывают на то, что подобранная теоретическая функция распределения при справедливости нулевой гипотезы не противоречит результатам наблюдений. В частности, это означает, что она не является единственно возможной гипотезой, и не исключено, что какая-то другая функция лучше опишет наблюдаемые значения.

Если статистическая проверка подтвердила состоятельность гипотезы, то, учитывая случайный характер параметра Проверка адекватности теоретического распределения - student2.ru , описываемого подобранным теоретическим распределением, далее следует задать интервальную оценку. Цель интервальной оценки – указание интервала, за пределы которого случайная величина Проверка адекватности теоретического распределения - student2.ru не выйдет с заданной вероятностью.

Наши рекомендации