Критерий согласия Пирсона (критерий хи-квадрат)

Назначение критерия χ² - критерия Пирсона Критерий χ² применяется в двух целях: 1) для сопоставления эмпирического распределения признака с теоретическим - равномерным, нормальным или каким-то иным; 2) для сопоставления двух, трех или более эмпирических распределений одного и того же признака. Описание критерия Критерий χ² отвечает на вопрос о том, с одинаковой ли частотой встречаются разные значения признака в эмпирическом и теоретическом распределениях или в двух и более эмпирических распределениях. Преимущество метода состоит в том, что он позволяет сопоставлять распределения признаков, представленных в любой шкале, начиная от шкалы наименований. В самом простом случае альтернативного распределения "да - нет", "допустил брак - не допустил брака", "решил задачу - не решил задачу" и т. п. мы уже можем применить критерий χ². Чем больше расхождение между двумя сопоставляемыми распределениями, тем больше эмпирическое значение χ². Автоматический расчет χ² - критерия Пирсона Чтобы произвести автоматический расчет χ² - критерия Пирсона, необходимо выполнить действия в два шага: Шаг 1. Указать количество эмпирических распределений (от 1 до 10); Шаг 2. Занести в таблицу эмпирические частоты; Шаг 3. Получить ответ.

Достоинством критерия Пирсона является его универсальность: с его помощью можно проверять гипотезы о различных законах распределения.

1. Проверка гипотезы о нормальном распределении.

Пусть получена выборка достаточно большого объема п с большим количеством различных значений вариант. Для удобства ее обработки разделим интервал от наименьшего до наибольшего из значений вариант на s равных частей и будем считать, что значения вариант, попавших в каждый интервал, приближенно равны числу, задающему середину интервала. Подсчитав число вариант, попавших в каждый интервал, составим так называемую сгруппированную выборку:

варианты………..х₁ х₂ … х_s

частоты………….п₁ п₂ … п_s ,

где х_i – значения середин интервалов, а п_i – число вариант, попавших в i-й интервал (эмпирические частоты).

По полученным данным можно вычислить выборочное среднее Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru и выборочное среднее квадратическое отклонение σ_В. Проверим предположение, что генеральная совокупность распределена по нормальному закону с параметрами M(X) = Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , D(X) = . Тогда можно найти количество чисел из выборки объема п, которое должно оказаться в каждом интервале при этом предположении (то есть теоретические частоты). Для этого по таблице значений функции Лапласа найдем вероятность попадания в i-й интервал:

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru ,

где а_i и b_i - границы i-го интервала. Умножив полученные вероятности на объем выборки п, найдем теоретические частоты: п_i =n·p_i.Наша цель – сравнить эмпирические и теоретические частоты, которые, конечно, отличаются друг от друга, и выяснить, являются ли эти различия несущественными, не опровергающими гипотезу о нормальном распределении исследуемой случайной величины, или они настолько велики, что противоречат этой гипотезе. Для этого используется критерий в виде случайной величины

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru . (20.1)

Смысл ее очевиден: суммируются части, которые квадраты отклонений эмпирических частот от теоретических составляют от соответствующих теоретических частот. Можно доказать, что вне зависимости от реального закона распределения генеральной совокупности закон распределения случайной величины (20.1) при Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru стремится к закону распределения (см. лекцию 12) с числом степеней свободы k = s – 1 – r, где r – число параметров предполагаемого распределения, оцененных по данным выборки. Нормальное распределение характеризуется двумя параметрами, поэтому k = s – 3. Для выбранного критерия строится правосторонняя критическая область, определяемая условием

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru (20.2)

где α – уровень значимости. Следовательно, критическая область задается неравенством Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru а область принятия гипотезы - .

Итак, для проверки нулевой гипотезы Н₀: генеральная совокупность распределена нормально – нужно вычислить по выборке наблюдаемое значение критерия:

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , (20.1`)

а по таблице критических точек распределения χ² найти критическую точку Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , используя известные значения α и k = s – 3. Если - нулевую гипотезу принимают, при ее отвергают.

2. Проверка гипотезы о равномерном распределении.

При использовании критерия Пирсона для проверки гипотезы о равномерном распределении генеральной совокупности с предполагаемой плотностью вероятности

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru

необходимо, вычислив по имеющейся выборке значение Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , оценить параметры а и b по формулам:

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , (20.3)

где а* и b* - оценки а и b. Действительно, для равномерного распределения М(Х) = Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , , откуда можно получить систему для определения а* и b*: , решением которой являются выражения (20.3).

Затем, предполагая, что Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , можно найти теоретические частоты по формулам

Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru

Здесь s – число интервалов, на которые разбита выборка.

Наблюдаемое значение критерия Пирсона вычисляется по формуле (20.1`), а критическое – по таблице с учетом того, что число степеней свободы k = s – 3. После этого границы критической области определяются так же, как и для проверки гипотезы о нормальном распределении.

3. Проверка гипотезы о показательном распределении.

В этом случае, разбив имеющуюся выборку на равные по длине интервалы, рассмотрим последовательность вариант Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru , равноотстоящих друг от друга (считаем, что все варианты, попавшие в i – й интервал, принимают значение, совпадающее с его серединой), и соответствующих им частот n_i (число вариант выборки, попавших в i – й интервал). Вычислим по этим данным Критерий согласия Пирсона (критерий хи-квадрат) - student2.ru и примем в качестве оценки параметра λ величину . Тогда теоретические частоты вычисляются по формуле