Принцип отношения правдоподобия
Выясним, как конкретно получаются те функции от результатов наблюдения (критические статистики ), по значениям которых принимается окончательное решение о том, соответствует ли проверяемая гипотеза имеющимся у нас данным или противоречит им.
Сущность принципа отношения правдоподобия
в общем случае представление о сравнительной правдоподобности имеющихся наблюдений (в отношении проверяемой и альтернативной гипотез) дает нам сопоставление соответствующих функций правдоподобия и, в частности, их отношение
, (1)
где и
– значения функций правдоподобия наблюдений
, вычисленные в предположении справедливости соответственно гипотез
и
. Очевидно, чем правдоподобнее наблюдения в условиях гипотезы
, тем больше функция правдоподобия
и тем меньше величина
. Если
– плотность распределения статистики
при условии справедливости гипотезы
, то построение критерия проверки гипотезы
с заданным уровнем значимости
сводится к определению
-ой точки
распределения
и к реализации следующего правила:
если , то гипотеза
отвергается с вероятностью ошибиться, равной
, так как в соответствии с законом
и при справедливости гипотезы
возможно осуществление события
с вероятностью
, т.е.
;
если , то гипотеза
не отвергается.
Критерии, основанные на статистиках вида (1) и процедуре, рассмотренной выше, называются критерии отношения правдоподобия. Их практическая реализуемость и предпочтительность по отношению к другим возможным критериям основаны на следующих фактах.
· Критерии отношения правдоподобия являются наиболее мощными среди всех других возможных критериев.
· Плотность распределения критической статистики
, как правило, без труда восстанавливается по функции правдоподобия
наблюдаемой случайной величины.
Методы проверки статистических гипотез: примеры статистических критериев
Критерии согласия
Критерии согласия предназначены для статистической проверки гипотез о модельном виде закона распределения вероятностей исследуемой случайной величины.
Критерий согласия Пирсона
Этот критерий позволяет проверять гипотезы вида как для дискретных, так и для непрерывных случайных величин, когда параметры
известны или являются неизвестными. Если гипотеза
истинна, то при некоторых, достаточно общих условиях распределение критической статистики
(2)
сходится (при ) к
-распределению.
В непрерывном случае статистика (2) строится по группированным данным. – это общее число интервалов;
– число выборочных данных, попавших в
-ый интервал;
– векторный параметр, который участвует в выражении модельной функции распределения
, а
– его состоятельная оценка (более корректным способом оценивания считается тот, при котором в качестве
используется оценка максимального правдоподобия, построенная по группированным данным);
– число неизвестных параметров, оцениваемых по выборке (в случае известных значений параметров
);
– это результат модельного расчета вероятности попасть в
-ый интервал, т.е.
, (3)
где – соответственно левый и правый концы в
-го интервала.
Случай анализа дискретной случайной величины отличается от предыдущего тем, что мы работаем с исходной (а не группированной) выборкой; – число выборочных данных, равных
-му возможному значению
,
– число всех возможных значений случайной величины;
. (4)
Процедура проверки гипотезы критерием Пирсона.
1. По данным выборки найти состоятельную оценку
параметров
.
2. вычислить значение критической статистики .
3. по заданному уровню значимости критерия из таблиц процентных точек
-распределения находим
и
-ые точки
и
«хи-квадрат» распределения с
степенями свободы.
4. если , то гипотеза не отклоняется; если же
или
, то гипотеза отклоняется. Отвержение выдвинутой гипотезы в случае «слишком маленьких» значений статистики критерия
на первый взгляд противоречит здравому смыслу. Действительно, статистика
характеризует степень отклонения эмпирического распределения случайной величины
от гипотетического
; чем меньше
, тем меньше это отклонение. Но хотя
и является мерой отклонения гипотетического закона
от истинного, но мерой случайной, т.е. величиной, подверженной обязательному неконтролируемому рассеянию. В этом отношении одинаково неправдоподобными следует считать как слишком большие значения
, так и слишком малые. Слишком малые значения
могут говорить о неудачном выборе закона
(искусственное завышение числа параметров, от которых этот закон зависит). Другими причинами могут являться нарушения корректности или объективности техники выборочного обследования.