Проверка гипотезы о равенстве дисперсий - двухвыборочный f-tect для дисперсий
На практике задача сравнения дисперсий возникает, если требуется сравнить точность приборов, инструментов, самих методов измерений и т.д. Очевидно, предпочтительнее тот прибор, инструмент и метод, который обеспечивает наименьшее рассеивание результатов измерений, т.е. наименьшую дисперсию.
Проверяемая гипотеза называется нулевой и обозначается Н0. Альтернативная гипотеза Н1 - эта гипотеза, противоречащая нулевой.
Пусть генеральные совокупности Х и У распределены нормально. По независимым выборкам объемов п1, и п2, извлеченным из этих совокупностей, определены несмещенные статистические оценки дисперсий и :
Требуется по этим дисперсиям при заданном уровне значимости α проверить нулевую гипотезу, состоящую в том, что генеральные дисперсии рассматриваемых совокупностей равны между собой.
Если окажется, что нулевая гипотеза справедлива, т.е. генеральные дисперсии одинаковы, то различие вычисленных дисперсий незначимо и объясняется случайными причинами, в частности случайным отбором объектов выборки. Например, если различие вычисленных дисперсий результатов измерений, выполненных двумя приборами, оказалось незначимым, то приборы имеют одинаковую точность.
Если нулевая гипотеза будет отвергнута, т.е. генеральные дисперсии не одинаковы, то различие вычисленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Например, если различие вычисленных дисперсий результатов измерений, произведенных двумя приборами, оказалось значимым, тоточность приборов различна.
Критическая область строится в зависимости от вида конкурирующей гипотезы, при этом рассматривают два случая.
1. Нулевая гипотеза H0: D[X] = D[Y].
Конкурирующая гипотеза H1: D[X] > D[ У].
Вычисляется наблюдаемое значение критерия (отношение большей дисперсии к меньшей) (2.1):
FB= (2.1)
По таблице критических точек распределения Фишера (см. приложения 1) по заданному уровню значимости α и числам степеней свободы f1=n1-1, f2 =n2-1 (f1 — число степеней свободы большей дисперсии) определяют критическую точку Fkp (α, f1, f2).
Если FB< Fкр, нет оснований отвергнуть нулевую гипотезу.
Если FB > Fкр, нулевую гипотезу отвергают.
2 Нулевая гипотеза Н0: D[X] = D[Y].
Конкурирующая гипотеза Н1: D[X] D[Y].
Вычисляется наблюдаемое значение критерия по формуле (2.1).
Критическую точку FКР (α/2, f1, f2) определяют по уровню значимости α/2, так как критическая область двусторонняя.
Если FB < Fкр, нет оснований отвергнуть нулевую гипотезу.
Если FB> Fкр, нулевую гипотезу отвергают.
Для измерения значимости рассматриваемого критерия (например, FB) при отклонении нулевой гипотезы Н0 используется односторонняя вероятность значимости P(F f), которая определяет вероятность принадлежности критерия множеству области принятия гипотезы в предположении, что верна нулевая гипотеза H0. В этом случае выборка согласуется с нулевой гипотезой H0, когда вероятность значимости в определенном смысле велика, и не согласуется, когда эта вероятность мала.
Чем меньше значение односторонней вероятности значимости P(F f), тем сильнее это свидетельствует против гипотезы H0. С помощью вероятности значимости измеряют так называемую степень недоверия к основной гипотезе H0. Она представляет собой дополнительную к вероятности значимости величину:
SH=1-P(F f).
Близкая к нулю вероятность значимости интерпретируется как близость степени недоверия к единице, т.е. как очень сильный довод против гипотезы H0. Близкая же к единице вероятность значимости показывает, что степень недоверия близка к нулю, т.е. доводы против H0 слабы, что фактически указывает на согласие выборки с гипотезой H0.
Вероятность значимости для первого случая проверки гипотезы определяется как:
P[F(n1-l, n2 -1) ],
для второго случая: 2Р[F(n1-l, n2 -1) ], с использованием таблиц критических точек распределения Фишера.
Пример 2.1. Имеются две независимые выборки измерений точности размеров деталей обуви, полученных на двух прессах Х и У (табл. 1):
Таблица 1. Результаты замеров
Пресс 1- X | 6,63 | 6,64 | 4,56 | 9,73 | 11,56 | 14,99 | 14,77 | 6,33 | 4,61 | 5,73 |
Пресс 2 - У | 5,05 | 5,84 | 5,74 | 6,44 | 7,09 | 9,82 | 9,11 | 7,50 | 2,89 | 6,55 |
При уровне значимости α = 0,1 проверить нулевую гипотезу H0:
D[X]=D[У] о равенстве генеральных дисперсий при конкурирующей гипотезе H1: D[X] D[Y].
Решение.
Рассчитываем средние значения выборок:
Рассчитываем статистические оценки дисперсий:
=1/9 ∙[(6,63-8,65)2+ (6,64-8,65)2+(4,56-8,65)2+(9,73-8,65)2+(11,56-8,65)2+(14,99-8,65)2+(14,77-8,65)2+(6,33-8,65)2+(4,61-8,65)2+(5,73-8,65)2=15,81
=1/9 ∙[(5,05-6,60)2+(5,84-6,60)2+(5,74-6,60)2+(6,44-6,60)2+(7,09-6,60)2+(9,82-6,60)2+(9,11-6,60)2+(7,50-6,60)2+(2,89-6,60)2+(6,55-6,60)2=3,92
Вычисляем наблюдаемое значение критерия
FB= =15,81/3,92=4,03
По таблице критических точек распределения Фишера (см. приложение 1) по заданному уровню значимости α = 0,05 и числам степеней свободы f1 = п1 - 1 = 9 и f2 = п2 - 1 = 9 определяем критическую точку F = 3,18. Так как FB > FKp, нулевую гипотезу о равенстве генеральных дисперсий отвергаем.
Вероятность значимости определяется по таблице критических точек распределения Фишера P[F(9,9) 4,04] = 0,025, при этом используем следующие данные таблицы:
п1 = 9 | ||
п2=9 | α = 0,05 | 3,18 |
α = 0,01 | 5,35 |
Впакете «Анализ данных»инструмент «ДвухвыборочныйF-тест длядисперсий» применяется для сравнения дисперсий двух генеральных совокупностей (рис. 2.1).
Рис. 2.1. Окно Двухвыборочный F-тест для дисперсий
Алгоритм действий в Excel:
1. Формируем таблицу исходных данных:
А | В | С | D | Е | F | G | Н | J | K | ||
Пресс 1 -Х | 6,63 | 6,64 | 4,56 | 9,73 | 11,56 | 14,99 | 14,77 | 6,33 | 4,61 | 5,73 | |
Пресс 2 -У | 5,05 | 5,84 | 5,74 | 6,44 | 7,09 | 9.82 | 9.11 | 7,5 | 2.89 | 6,55 |
2. Открыть Сервис / Анализ данных / Двухвыборочный F-тест для дисперсий / ОК.
3.Интервал переменной 1: $А$1:$К$1.
4. Интервал переменной 2: $А$2:$К$2.
5. Альфа: 0,05.
6.Выходной интервал: $А$6. И ОК.
Excel представит результаты решения в следующем виде (рис. 2.2).
Двухвыборочный F-тест для дисперсии | |||
Х | У | ||
Среднее | 8,555 | 6,603 | |
Дисперсия | 15,80814 | 3,91449 | |
Наблюдения | |||
df= п1 - 1 | |||
F | 4,038365 | ||
P(F<=f) одностороннее | 0,024765 | ||
F критическое одностороннее | 3,178893 |
Рис. 2.2. Результаты решения задачи с помощью инструмента Двухвыборочный F-тест для дисперсий
Так как F > FKp, нулевую гипотезу о равенстве генеральных дисперсий отвергаем. Так как нулевая гипотеза отвергнута, и генеральные дисперсии не одинаковы, то различие вычисленных дисперсий значимо и не может быть объяснено случайными причинами, а является следствием того, что сами генеральные дисперсии различны. Следовательно, качество деталей на 1 и 2 прессах различно.
При использовании данного Двухвыборочный F-тест для дисперсий рассчитывается только односторонний критерий, т.е. соответствующий первому случаю проверки гипотезы. Когда необходимо использовать двусторонний критерий, надо уровень значимостиα уменьшить в два раза и использовать полученное значение для двустороннего критерия.
САМОСТОЯТЕЛЬНАЯ РАБОТА ПО ТЕМЕ 2.1
Задание 2.1. Исследуются результаты деталей кроя на двух раскройных столах. В качестве контролируемого параметра взяли длину плечевого среза. Предполагается, что раскроя одинакова, т.е. что дисперсии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом столе и 24 деталей на втором. Результаты представлены (табл.2.2). Уровень значимости α= 0,05.
Таблица 2.2. Результаты замеров деталей
результаты замеров | результаты замеров | ||||
№ п/п | стол 1 | стол 2 | № п/п | стол 1 | стол 2 |
12,26 | 12,56 | 12,26 | 12,68 | ||
12,29 | 12,66 | 12,29 | 12,62 | ||
12,54 | 12,69 | 12,54 | 12,71 | ||
12,55 | 12,77 | 12,26 | 12,55 | ||
12,95 | 12,84 | 12,28 | 12,66 | ||
12,52 | 12,46 | 12,52 | 12,45 | ||
12,33 | 12,75 | 12,55 | 12,96 | ||
12,25 | 12,56 | 12,63 | 12,53 | ||
12,29 | 12,75 | 12,63 | 12,65 | ||
12,54 | 12,54 | 12,33 | 12,62 | ||
12,30 | 13,06 | 12,59 | |||
13,05 | 12,63 | 12,75 |
Проверьте гипотезу о равенстве дисперсий расчетным методом и при помощи электронных таблиц Excel (пакет «Анализ данных» инструмент Двухвыборочный F-тест для дисперсий). Сделайте вывод по полученным результатам.
Задание 2.2. Исследуются результаты обработки деталей обуви на двух станках. Предполагается, что точность обработки одинакова, т.е. что дисперсии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом станке и 24 деталей на втором (табл. 2.3). Проверьте гипотезу о равенстве дисперсий расчетным методом и при помощи электронных таблиц Excel (пакет «Анализ данных» инструмент Двухвыборочный F-тест для дисперсий). Сделайте вывод по полученным результатам.
Таблица 2.3. Результаты замеров
результаты замеров | результаты замеров | ||||
№ п/п | станок 1 | станок 2 | № п/п | станок 1 | станок 2 |
10,06 | 10,36 | 10,06 | 10,48 | ||
10,09 | 10,46 | 10,09 | 10,42 | ||
10,34 | 10,49 | 10,34 | 10,51 | ||
10,35 | 10,57 | 10,06 | 10,35 | ||
10,75 | 10,64 | 10,08 | 10,46 | ||
10,32 | 10,26 | 10,32 | 10,25 | ||
10,13 | 10,55 | 10,35 | 10,56 | ||
10,05 | 10,36 | 10,43 | 10,33 | ||
10,09 | 10,55 | 10,43 | 10,45 | ||
10,34 | 10,34 | 10,13 | 10,42 | ||
10,10 | 10,86 | 10,39 | |||
10,85 | 10,43 | 10,25 |