Принцип отношения правдоподобия
Выясним, как конкретно получаются те функции от результатов наблюдения (критические статистики ), по значениям которых принимается окончательное решение о том, соответствует ли проверяемая гипотеза имеющимся у нас данным или противоречит им.
Сущность принципа отношения правдоподобия
в общем случае представление о сравнительной правдоподобности имеющихся наблюдений (в отношении проверяемой и альтернативной гипотез) дает нам сопоставление соответствующих функций правдоподобия и, в частности, их отношение
, (1)
где и – значения функций правдоподобия наблюдений , вычисленные в предположении справедливости соответственно гипотез и . Очевидно, чем правдоподобнее наблюдения в условиях гипотезы , тем больше функция правдоподобия и тем меньше величина . Если – плотность распределения статистики при условии справедливости гипотезы , то построение критерия проверки гипотезы с заданным уровнем значимости сводится к определению -ой точки распределения и к реализации следующего правила:
если , то гипотеза отвергается с вероятностью ошибиться, равной , так как в соответствии с законом и при справедливости гипотезы возможно осуществление события с вероятностью , т.е.
;
если , то гипотеза не отвергается.
Критерии, основанные на статистиках вида (1) и процедуре, рассмотренной выше, называются критерии отношения правдоподобия. Их практическая реализуемость и предпочтительность по отношению к другим возможным критериям основаны на следующих фактах.
· Критерии отношения правдоподобия являются наиболее мощными среди всех других возможных критериев.
· Плотность распределения критической статистики , как правило, без труда восстанавливается по функции правдоподобия наблюдаемой случайной величины.
Методы проверки статистических гипотез: примеры статистических критериев
Критерии согласия
Критерии согласия предназначены для статистической проверки гипотез о модельном виде закона распределения вероятностей исследуемой случайной величины.
Критерий согласия Пирсона
Этот критерий позволяет проверять гипотезы вида как для дискретных, так и для непрерывных случайных величин, когда параметры известны или являются неизвестными. Если гипотеза истинна, то при некоторых, достаточно общих условиях распределение критической статистики
(2)
сходится (при ) к -распределению.
В непрерывном случае статистика (2) строится по группированным данным. – это общее число интервалов; – число выборочных данных, попавших в -ый интервал; – векторный параметр, который участвует в выражении модельной функции распределения , а – его состоятельная оценка (более корректным способом оценивания считается тот, при котором в качестве используется оценка максимального правдоподобия, построенная по группированным данным); – число неизвестных параметров, оцениваемых по выборке (в случае известных значений параметров ); – это результат модельного расчета вероятности попасть в -ый интервал, т.е.
, (3)
где – соответственно левый и правый концы в -го интервала.
Случай анализа дискретной случайной величины отличается от предыдущего тем, что мы работаем с исходной (а не группированной) выборкой; – число выборочных данных, равных -му возможному значению , – число всех возможных значений случайной величины;
. (4)
Процедура проверки гипотезы критерием Пирсона.
1. По данным выборки найти состоятельную оценку параметров .
2. вычислить значение критической статистики .
3. по заданному уровню значимости критерия из таблиц процентных точек -распределения находим и -ые точки и «хи-квадрат» распределения с степенями свободы.
4. если , то гипотеза не отклоняется; если же или , то гипотеза отклоняется. Отвержение выдвинутой гипотезы в случае «слишком маленьких» значений статистики критерия на первый взгляд противоречит здравому смыслу. Действительно, статистика характеризует степень отклонения эмпирического распределения случайной величины от гипотетического ; чем меньше , тем меньше это отклонение. Но хотя и является мерой отклонения гипотетического закона от истинного, но мерой случайной, т.е. величиной, подверженной обязательному неконтролируемому рассеянию. В этом отношении одинаково неправдоподобными следует считать как слишком большие значения , так и слишком малые. Слишком малые значения могут говорить о неудачном выборе закона (искусственное завышение числа параметров, от которых этот закон зависит). Другими причинами могут являться нарушения корректности или объективности техники выборочного обследования.