Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ»

1. Постановка задачи проверки гипотез о законе рапределения

2. Критерий χ2-Пирсона

3. Критерий ω2

ЛИТЕРАТУРА

1. Морозов Ю.В. Основы высшей математики и статистики. М., «Медицина», 2004, §§ 11.1-11.6.

2. Павлушков И.В. и др. Основы высшей математики и математической статистики. М., «ГЭОТАР-Медиа», 2006, § 8.5.

1) Эмпирические законы распределения вероятностей имеют дискретный характер независимо от того, является ли эта величина дискретной или непрерывной. Использование такого закона в различных расчётах оказывается не всегда удобным. Поэтому возникает задача замены его неко-

торым теоретическим законом распределения, который был бы в определённом смысле близким к эмпирическому закону. Эта задача решается следующим образом. По виду гистограммы, полигона или графика эмпирической функции распределения по справочникам выбирается подходящий теоретический закон распределения и выдвигается гипотеза (H0) о том, что именно этот выбранный закон является истинным законом распределения изучаемой величины. Затем по определённому критерию близости теоретического и эмпирического законов распределений выдвинутая гипотеза принимается или отвергается. Сами критерии близости могут быть различными, поэтому истинность вы-двинутой гипотезы можно проверить различным образом.

2) Одним из наиболее распространённых критериев является критерий χ2-Пирсона. Вся широта эмпирического распределения разбивается на r частичных интервалов, и сравниваются вероятности попадания измеренных значений случайной величины в эти интервалы для случая эмпирического распределения и для случая теоретического распределения. В качестве меры отклонения берётся величина

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru , (1)

где n – объём выборки, ni – число элементов, попавших в i-й интервал, pi – вероятность попадания в i-тый интервал, вычисленная на основе теоретического распределения.

Смысл величины χ2 заключается в следующем. В качестве меры отклонения эмпирического распределения от теоретического в i-м интервале можно взять квадрат разности между эмпирической и теоретической вероятностью попадания изучаемой величины в этот интервал:

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru

Если теперь суммировать квадраты отклонений по всем интервалам, то все отклонения будут учтены с одинаковым весом независимо от величины pi. При одном и том же абсолютном отклонении относительная величина отклонения будет тем больше, чем меньше вероятность pi. Целесообразно ввести весовые коэффициенты, обратно пропорциональные вероятностям pi. Выбор коэффициентов в виде n/pi приводит к формуле (1).

Вероятности pi вычисляются по теоретической (гипотетической) функции распределения F(x) или по соответствующей плотности f(x):

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru

где zi–1 и zi – левая и правая границы i-ого интервала.

Оказывается, что если гипотеза верна, то величина χ2 распределена по закону χ2 с k = r – 1 степенями свободы. Этим фактом объясняется выбор структуры весового коэффициента. По таблицам распределения χ2 решается уравнение относительно значения χ2α :

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru , (2)

где α – малая величина, выбираемая в пределах 0,01 ÷ 0,1. Эта величина (уровень значимости) по смыслу является вероятностью отвергнуть истинную гипотезу, т.е. вероятностью ошибки первого рода. Величина χ2α– критическое значение величины χ2. Она является нижней границей односторонней критической области Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru данного критерия. Правило принятия решения основывается на сравнении вычисленного значения χ2 с критическим значением χ2α . Если Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru , то гипотеза о соответствии эмпирического и теоретического законов принимается, в противном случае, когда вычисленное χ2 попадает в критическую область, эта гипотеза отвергается.

Идея этого критерия заключается в следующем. Величина χ2 распределена по закону χ2 только в том случае, когда гипотеза H0 является истинной. Именно при этом условии было определено критическое значение

χ2α таким образом, что вероятность выполнения неравенства Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru очень мала. Предположим теперь, что это неравенство, тем не менее, выполнилось, т. е. вычисленное значение χ2 попало в критическую область. Это значит, что произошло маловероятное событие. Если все наши рассуждения верны, то такой результат является достаточно редким. Поэтому мы подвергаем сомнению наши рассуждения. Мы могли сделать ошибку лишь тогда, когда предположили истинность проверяемой гипотезы H0. Следовательно, эту гипотезу нужно отвергнуть. Принимая такое решение, мы можем совершить ошибку с вероятностью α, поскольку именно с этой вероятностью указанное маловероятное событие может произойти.

Если теоретическое распределение содержит неизвестные параметры, то перед вычислением вероятностей pi, эти параметры (например, математическое ожидание, дисперсия и т.п.) оцениваются по той же самой выборке. В таком случае число степеней свободы k распределения χ2 уменьшается: k = r – s – 1, где s – число оценённых параметров.

Число частичных интервалов следует брать не менее 8, однако, если для некоторых интервалов при вычислениях оказывается npi < 5, то их нужно объединять с соседними интервалами, чтобы было npi ≥ 5 (в ответственных случаях не допускается npi < 10). Общее число интервалов при этом, естественно, сокращается.

3)Недостатком критерия χ2-Пирсона является то, что для его применения необходим большой объём выборки. Это связано с тем, что в критерии используется интервальный вариационный ряд, при получении которого имела место частичная потеря информации (за счёт группирования данных). В случае малых объёмов выборок целесообразно использовать критерии, непосредственно опирающиеся на измерения исследуемой величины. Наиболее распространённым критерием такого типа является критерий ω2 (и его модификации). В этом критерии в качестве меры отклонения эмпирического распределения от теоретического применяется величина

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru

где F*(x) – эмпирическая функция распределения вероятностей; F(x) – теоретическая (гипотетическая) функция. Интегрирование приводит к следующему выражению:

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru , (3)

где xi – элементы выборки. Доказано, что распределение величины nω2 при возрастании n достаточно быстро сходится к некоторому предельному распределению, для которого составлена таблица.

Практически критерием можно пользоваться уже при n > 40, что выгодно отличает этот критерий от критерия χ2. Схема принятия решения аналогична схеме, рассмотренной выше. Решается уравнение

Лекция №6: «ПРОВЕРКА ГИПОТЕЗ О РАСПРЕДЕЛЕНИЯХ» - student2.ru (4)

т.е. по заданному уровню значимости α по таблицам находится критическое значение zα.

Если оказывается, что nω2 < zα, т о гипотеза о соответствии эмпирического и теоретического распределений принимается, в противном случае – отвергается.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1. Как решается задача замены эмпирического закона распределения теоретическим?

2. В чем заключается смысл величины χ2 ?

3. Почему для применения χ2-критерия требуется большой объем выборки?

4. Что принимается в качестве меры отклонения в ω2-критерии?

5. Какова схема принятия решения при использования критерия χ2 ?

Наши рекомендации