Проверка адекватности теоретического распределения
Как бы хорошо ни была подобрана функция теоретического распределения , сглаживающая эмпирическое распределение (гистограмму), между ней и статистическим распределением всегда имеется различие (см. рис. 3.4).
– Чем это обусловлено?
Возможно это случайность, которая проявляется как выборочная ошибка вследствие ограниченности количества измерений, а возможно, что расхождение весьма существенно и обусловлено неправильно выбранным распределением , неудовлетворительно отражающим статистическое распределение. Следовательно, задача состоит в обнаружении некоторого «согласия» между исходными данными и ожидаемыми теоретическими значениями. Для решения этой задачи используют так называемые «критерии согласия».
Для выявления «согласия» между подобранной функцией и экспериментальным (статистическим) распределением выдвигается нулевая гипотеза , которая заключается в предположении, что нет существенного различия между указанными распределениями, а любое зафиксированное отклонение случайно и объясняется лишь выборочной ошибкой, то есть ограниченностью числа измерений реализаций случайной величины. Кроме того, выдвигается конкурирующая (альтернативная) гипотеза , которая противоречит нулевой.
Затем осуществляется проверка состоятельности гипотезы . Для этого используют статистические критерии. Под статистическим критерием понимают случайную величину , которая служит для проверки гипотезы. Всю совокупность значений критерия разделяют на две области:
– область принятия гипотезы – область значений критерия, при которых нулевую гипотезу принимают;
– критическая область – совокупность значений критерия, при которых нулевую гипотезу отвергают (может быть левосторонней, правосторонней и двусторонней).
Граничная точка между двумя указанными областями представляет собой критическую точку (границу) .
При проверке гипотезы могут быть допущены ошибки первого и второго рода:
– ошибка первого рода – отвергнута правильная нулевая гипотеза. Вероятность ошибки первого рода называют уровнем значимости и обозначают .
– ошибка второго рода – принята неправильная нулевая гипотеза. Вероятность ошибки второго рода обозначают . Вероятность события, заключающегося в отсутствии ошибки второго рода называют мощностью критерия.
Статистический критерий для проверки нулевой гипотезы применяется следующим образом:
– Вычисляют наблюдаемые (эмпирические) значения критерия по эмпирическим выборкам.
– Отыскивают критическую область критерия. Для чего задаются уровнем значимости и ищут критические точки из следующих соотношений:
а) для правосторонней критической области:
, (3.29)
б) для левосторонней критической области:
, (3.30)
в) для двусторонней симметричной области:
. (3.31)
Чаще всего при решении задач статистической проверки гипотез используют критерий (хи-квадрат) или, иначе, критерий согласия Пирсона.
Количественной мерой расхождения между теоретическим и экспериментальным распределением является величина так называемой статистики , рассчитываемая по выражению:
, (3.32)
где – количество измеренных значений случайной величины, попавших в q-ый интервал гистограммы;
– общее количество измерений;
– теоретическая вероятность попадания случайной величины в q-ый интервал, определяемая по функции .
Распределение зависит, кроме переменной, от параметра , называемого числом степеней свободы. Число степеней свободы определяется как разность между количеством разрядов рассматриваемой гистограммы и числом независимых условий, использованных при подборе теоретического распределения . К таким условиям относятся: равенство единице суммы площадей всех столбцов гистограммы (должно выполняться всегда), равенство моментов теоретического распределения их соответствующим статистическим оценкам (математическое ожидание, дисперсия и т.д.). А также иных, использованных при подборе вида функции . Если число таких условий , то для числа степеней свободы распределения имеем:
. (3.33)
Схема применения критерия Пирсона о согласованности эмпирического и теоретического распределений следующая:
– По формуле (4.32) вычисляется наблюдаемое значение критерия .
– Определяется число степеней свободы. Для полученной гистограммы с учетом указанных допущений оно равно: .
– Задаются уровнем значимости и по таблице критических точек находят . Уровень значимости следует задать: , тогда .
– Если гипотеза отвергается, как несостоятельная, следовательно, необходимо для «сглаживания» воспользоваться иным теоретическим распределением, например одним из представленных в таблице 4.7.
Важно заметить, что статистические критерии лишь указывают на то, что подобранная теоретическая функция распределения при справедливости нулевой гипотезы не противоречит результатам наблюдений. В частности, это означает, что она не является единственно возможной гипотезой, и не исключено, что какая-то другая функция лучше опишет наблюдаемые значения.
Если статистическая проверка подтвердила состоятельность гипотезы, то, учитывая случайный характер параметра , описываемого подобранным теоретическим распределением, далее следует задать интервальную оценку. Цель интервальной оценки – указание интервала, за пределы которого случайная величина не выйдет с заданной вероятностью.