Критерий для проверки гипотезы о сравнении двух дисперсий
Пусть имеются две нормально распределенные генеральные совокупности Х и Y. Из них извлечены независимые выборки объемов соответственно и , по которым вычислены исправленные выборочные дисперсии и . Требуется при заданном уровне значимости проверить нулевую гипотезу о равенстве дисперсий рассматриваемых генеральных совокупностей. Учитывая несмещенность исправленных выборочных дисперсий, нулевая гипотеза запишется в виде:
Замечание. Исправленные дисперсии, вычисленные по выборкам, обычно оказываются различными. При проверке гипотезы выясняется, является ли это различие незначимым и обусловленным случайными причинами (в случае принятия нулевой гипотезы) или оно является следствием того, что сами генеральные дисперсии различны.
В качестве критерия примем случайную величину:
определяющую отношение большей выборочной дисперсии к меньшей. Она имеет распределение Фишера-Снедекора со степенями свободы и где – объем выборки, по которой вычислена большая исправленная дисперсия, а – объем второй выборки.
Рассмотрим два вида конкурирующих гипотез:
- пусть Наблюдаемым значением критерия будет отношение большей из исправленных дисперсий к меньшей: . По таблице критических точек распределения Фишера-Снедекора находим критическую точку При
нулевая гипотеза принимается, при отвергается.
- если то критическая область является двусторонней и определяется неравенствами где При этом достаточно найти правую критическую точку Тогда при нулевая гипотеза принимается, при отвергается.
Критерий Пирсона.
1. Проверка гипотезы о нормальном распределении.
Пусть имеется выборка достаточно большого объема п с большим количеством различных значений вариант. Доя удобства ее обработки разделим интервал от наименьшего до наибольшего из значений вариант на s равных частей и будем считать, что значения вариант, попавших в каждый интервал, приближенно равны числу, задающему середину интервала. Подсчитав число вариант, попавших в каждый интервал, составим так называемую сгруппированную выборку:
варианты……….. … ,
частоты…………. … ,
где – значения середин интервалов, а – число вариант, попавших в i-й интервал (эмпирические частоты).
По полученным данным вычислим выборочное среднее и выборочное среднее квадратическое отклонение . Проверим предположение, что генеральная совокупность распределена по нормальному закону с параметрами , . Найдём количество чисел из выборки объема п, которое должно оказаться в каждом интервале при этом предположении (т.е. теоретические частоты). Для этого по таблице значений функции Лапласа найдем вероятность попадания в i-й интервал:
,
где и - границы i-го интервала. Умножив полученные вероятности на объем выборки, найдем теоретические частоты: .Сравним эмпирические и теоретические частоты, которые, конечно, отличаются друг от друга, и выясним, являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении исследуемой случайной величины, или они настолько велики, что противоречат этой гипотезе. Для этого используется критерий в виде случайной величины
. (5.1)
Сформулируем её смысл: суммируются части, которые квадраты отклонений эмпирических частот от теоретических составляют от соответствующих теоретических частот.
Можно доказать, что вне зависимости от реального закона распределения генеральной совокупности закон распределения случайной величины (5.1) при стремится к закону распределения с числом степеней свободы , где – число параметров предполагаемого распределения, оцененных по данным выборки.
Нормальное распределение характеризуется двумя параметрами, поэтому . Для выбранного критерия строится правосторонняя критическая область, определяемая условием
где – уровень значимости. Следовательно, критическая область задается неравенством а область принятия гипотезы - .
Таким образом, для проверки нулевой гипотезы , (в случае нормально распределённой генеральной совокупности) – необходимо вычислить по выборке наблюдаемое значение критерия:
,
а по таблице критических точек распределения найти критическую точку , используя известные значения и . Если - нулевую гипотезу принимают, при ее отвергают.
2. Проверка гипотезы о равномерном распределении.
При использовании критерия Пирсона для проверки гипотезы о равномерном распределении генеральной совокупности с предполагаемой плотностью вероятности
необходимо, вычислив по имеющейся выборке значение , оценить параметры а и b по формулам:
, (5.2)
где и - оценки а и b. Действительно, для равномерного распределения ; , откуда получаем систему для определения и : решением которой являются выражения (5.2).
Затем, предполагая, что находим теоретические частоты по формулам
где s – число интервалов, на которые разбита выборка.
Наблюдаемое значение критерия Пирсона вычисляется по формуле:
,
а критическое – по таблице с учетом того, что число степеней свободы После этого границы критической области определяются так же, как и для проверки гипотезы о нормальном распределении.
3. Проверка гипотезы о показательном распределении.
В этом случае, разбив имеющуюся выборку на равные по длине интервалы, рассмотрим последовательность вариант , равноотстоящих друг от друга (при этом считается, что все варианты, попавшие в й интервал, принимают значение, совпадающее с его серединой), и соответствующих им частот (число вариант выборки, попавших в й интервал). Вычислим по этим данным и примем в качестве оценки параметра λ величину . Тогда теоретические частоты вычисляются по формуле:
Сравним наблюдаемое и критическое значение критерия Пирсона с учетом того, что число степеней свободы .
Достоинством критерия Пирсона является его универсальность: с его помощью можно проверять гипотезы о различных законах распределения.
Критерий Колмогорова.
Этот критерий применяется для проверки простой гипотезы о том, что независимые одинаково распределенные случайные величины имеют заданную непрерывную функцию распределения .
Найдем функцию эмпирического распределения и будем искать границы двусторонней критической области, определяемой условием:
.
А.Н.Колмогоров доказал, что в случае справедливости гипотезы распределение статистики не зависит от функции , и при
где
- критерий Колмогорова, значения которого можно найти в соответствующих таблицах.
Критическое значение критерия вычисляется по заданному уровню значимости как корень уравнения .
Можно показать, что приближенное значение вычисляется по формуле:
,
где z – корень уравнения На практике для вычисления значения статистики используется равенство
,
где
а - вариационный ряд, построенный по выборке .
Можно дать следующее геометрическое истолкование критерия Колмогорова: если изобразить на плоскости графики функций , то гипотеза верна, если график функции не выходит за пределы области, лежащей между графиками функций и