Дисперсии которых неизвестны и одинаковы

(малые независимые выборки)

Даны две генеральные совокупности Х и Y, имеющие нормальное распределение. Есть основание выдвинуть гипотезу о равенстве генеральных средних этих совокупностей, то есть дисперсии которых неизвестны и одинаковы - student2.ru или Н0: М(Х) = М(Y). При заданном уровне значимости a требуется проверить нулевую гипотезу.

Сделаем независимые выборки, объем которых nx и ny ( nx , ny <30), по данным выборок вычислим выборочные средние дисперсии которых неизвестны и одинаковы - student2.ru , а также выборочные исправленные дисперсии дисперсии которых неизвестны и одинаковы - student2.ru и дисперсии которых неизвестны и одинаковы - student2.ru .

Выборочные средние, как правило, различаются. Тогда возникает вопрос: значимо (существенно) или незначимо (несущественно) различаются выборочные средние?

Различие между выборочными средними будет значимым, если нулевая гипотеза несправедлива, то есть генеральные средние неодинаковы, что и вызвало различие выборочных средних. А если нулевая гипотеза справедлива, то различие выборочных средних незначимо, оно объясняется случайными причинами.

Для того чтобы выявить значимость различий выборочных средних, воспользуемся случайной величиной

дисперсии которых неизвестны и одинаковы - student2.ru .

Можно показать, что эта случайная величина имеет распределение Стьюдента с k = nx + ny - 2 степенями свободы.

Однако нулевую гипотезу можно проверить по этому критерию только в том случае, если дисперсии данных генеральных совокупностей одинаковы. Поэтому если в условии задачи ничего не известно о генеральных дисперсиях, то предварительно проверяется вспомогательная гипотеза о равенстве генеральных дисперсий. Если получим, что дисперсии равны, то далее проверяется основная гипотеза по критерию Стьюдента, в противном случае решение задачи прекращается.

Итак, если проверка показала, что генеральные дисперсии равны, то находим наблюдаемое значение критерия по данным выборок:

дисперсии которых неизвестны и одинаковы - student2.ru .

Затем нужно найти критическую точку. Для этого необходимо знать критическую область, которая строится в зависимости от вида конкурирующей гипотезы. Возможны несколько способов выбора гипотезы Н1.

1. Н0: М(Х) = М(Y) ; Н1: М(Х) > М(Y).

Такой вид гипотезы Н1 возможен только если по данным выборок дисперсии которых неизвестны и одинаковы - student2.ru . В этом случае конкурирующая гипотеза определяет правостороннюю критическую область дисперсии которых неизвестны и одинаковы - student2.ru , которая строится при справедливости нулевой гипотезы, исходя из требования дисперсии которых неизвестны и одинаковы - student2.ru (Т>tкрит .пр (a, k))=a .

Правосторонняя критическая точка находится по таблице критических точек распределения Стьюдента (прил. 5) при уровне значимости a, помещенном в нижней строке таблицы, и по числу степеней свободы k = nx + ny - 2. Затем, сравнивая Тнабл с tкрит. пр(a, k), делают вывод.

Если Тнабл > tкрит. пр(a, k), то есть наблюдаемое значение критерия попало в критическую область (рис. 2), то нулевая гипотеза отвергается, справедлива конкурирующая гипотеза Н1: М(Х) > М(Y); расхождение между выборочными средними значимо (существенно).

А если Тнабл < tкрит. пр(a, k), то есть наблюдаемое значение критерия попало в область принятия гипотезы, то нет оснований отвергать нулевую гипотезу, по данным наблюдения она принимается. Расхождение между выборочными средними несущественно (случайное).

2. Н0: М(Х) = М(Y); Н1: М(Х) < М(Y).

Такой вид гипотезы Н1 возможен только если по данным выборок дисперсии которых неизвестны и одинаковы - student2.ru . Конкурирующая гипотеза определяет левостороннюю критическую область дисперсии которых неизвестны и одинаковы - student2.ru . Критическая точка tкрит. л(a, k) вычисляется, исходя из требования дисперсии которых неизвестны и одинаковы - student2.ru (Т<tкрит. л(a, k))=a.

Распределение Стьюдента симметрично относительно нуля, тогда tкрит. л = -tкрит. пр. В силу этого предварительно следует найти tкрит. пр (a, k), как было описано в случае 1, а затем уже tкрит. л(a, k))=- tкрит. пр (a, k). Далее сравнивается Тнабл с tкрит. л(a, k).

Если Тнабл < tкрит. л(a, k), то есть наблюдаемое значение критерия попало в критическую область (рис. 4), то нулевая гипотеза отвергается, справедлива конкурирующая гипотеза Н1: М(Х) < М(Y). Расхождение между выборочными средними значимо.

А если Тнабл > tкрит. л(a, k) , то есть наблюдаемое значение критерия попало в область принятия гипотезы, то нет оснований отвергать нулевую гипотезу по данным наблюдения М(Х) = М(Y). Расхождение между выборочными средними случайное (за счет случайности выборки).

3. Н0: М(Х) = М(Y); Н1: М(Х) дисперсии которых неизвестны и одинаковы - student2.ru М(Y).

Эта конкурирующая гипотеза может быть выдвинута при любом соотношении между дисперсии которых неизвестны и одинаковы - student2.ru и дисперсии которых неизвестны и одинаковы - student2.ru . Она определяет двустороннюю критическую область дисперсии которых неизвестны и одинаковы - student2.ru Т<tкрит. л(a, k) или Т>tкрит. пр (a, k), которая строится, исходя из требования дисперсии которых неизвестны и одинаковы - student2.ru (Т<tкрит. л(a, k))+ дисперсии которых неизвестны и одинаковы - student2.ru (Т>tкрит. пр (a, k))=a.

Так как распределение Стьюдента симметрично относительно нуля, то и критические точки симметричны относительно нуля, то есть tкрит. л(a, k) = -tкрит.пр (a, k). Поэтому критическая область становится симметричной, а критические точки tкрит. л и tкрит. пр при справедливости нулевой гипотезы находят из условия

дисперсии которых неизвестны и одинаковы - student2.ru (Т<tкрит. л(a, k))= дисперсии которых неизвестны и одинаковы - student2.ru (Т>tкрит. пр(a, k))= дисперсии которых неизвестны и одинаковы - student2.ru .

Отсюда следует, что достаточно найти только tкрит. дв(a, k) = tкрит. пр(a, k). Критическая точка двусторонней критической области tкрит.дв находится по таблице критических точек распределения Стьюдента при заданном уровне значимости a, помещенном в верхней строке таблицы, и по числу степеней свободы k = nx + ny - 2 (прил. 5). Далее сравниваем Тнабл с tкрит. дв(a, k) и делаем вывод.

Если дисперсии которых неизвестны и одинаковы - student2.ru > tкрит. дв(a, k), то есть наблюдаемое значение критерия попало в критическую область (рис. 3), то нулевая гипотеза отвергается, справедлива конкурирующая гипотеза Н1 : М(Х) дисперсии которых неизвестны и одинаковы - student2.ru М(Y). Расхождение между выборочными средними значимо (существенно).

А если дисперсии которых неизвестны и одинаковы - student2.ru < tкрит. дв(a, k), то есть наблюдаемое значение критерия попало в область принятия гипотезы, то нет оснований отвергать нулевую гипотезу по данным наблюдения М(Х) = М(Y). Расхождение между выборочными средними случайное.

Рассмотренный критерий имеет широкое практическое применение, например, при сравнении размеров двух партий деталей, изготовленных на двух одинаково настроенных станках, или при сравнении средней производительности труда рабочих двух бригад, работающих в одинаковых условиях, и т.д.

дисперсии которых неизвестны и одинаковы - student2.ru

Рис. 2

дисперсии которых неизвестны и одинаковы - student2.ru дисперсии которых неизвестны и одинаковы - student2.ru

Рис. 3 Рис. 4

Замечание. При проверке гипотезы о равенстве генеральных средних при заданном уровне значимости a контролируется лишь ошибка первого рода, но нельзя ничего сказать о степени риска, связанного с принятием неверной гипотезы, то есть с возможностью ошибки второго рода.

Пример 3. По двум независимым выборкам, объемы которых nx = 12 и ny = 18, извлеченным из нормально распределенных генеральных совокупностей Х и Y, найдены выборочные средние дисперсии которых неизвестны и одинаковы - student2.ru в = 31,2 и дисперсии которых неизвестны и одинаковы - student2.ru в = 29,2 и исправленные дисперсии дисперсии которых неизвестны и одинаковы - student2.ru = 0,84 и дисперсии которых неизвестны и одинаковы - student2.ru = 0,40. При уровне значимости 0,01 проверить гипотезу о равенстве генеральных средних.

Решение. Даны совокупности Х и Y, имеющие нормальный закон распределения. Требуется проверить гипотезу Н0: М(Х) = М(Y).

Так как о генеральных дисперсиях ничего не известно, то с помощью случайной величины дисперсии которых неизвестны и одинаковы - student2.ru , которая имеет распределение Фишера - Снедекора с k1 = nх - 1 = 11 и k2 = ny - 1 = 17 степенями свободы (n1 = nх, так как дисперсии которых неизвестны и одинаковы - student2.ru - большая), предварительно проверим вспомогательную нулевую гипотезу:

Н0: D(Х) = D(Y) при Н1: D(Х) > D(Y).

Находим Fнабл = дисперсии которых неизвестны и одинаковы - student2.ru = 2,1. Fкрит (a,k1,k2) = Fкрит (0,01;11;17) = 3,52. Сравниваем Fнабл и Fкрит(0,01; 11; 17).

Так как Fнабл < Fкрит (0,01; 11; 17), то есть Fнабл попало в область принятия гипотезы, нет оснований отвергать нулевую гипотезу по данным наблюдения D(Х) = D(Y); расхождение между исправленными выборочными дисперсиями случайное. Следовательно, можно проверить основную гипотезу.

Предварительно выбираем конкурирующую гипотезу. В данном случае их может быть две: 1) Н1: М(Х) № М(Y); 2) Н1: М(Х) > М(Y), так как дисперсии которых неизвестны и одинаковы - student2.ru в > дисперсии которых неизвестны и одинаковы - student2.ru в.

Проверяем гипотезу Н0 в первом случае:

Н0: М(Х) = М(Y),

Н1: М(Х) № М(Y).

Воспользуемся случайной величиной

дисперсии которых неизвестны и одинаковы - student2.ru

которая имеет распределение Стьюдента с k=nx+ny-2 = 12+18-2 = 28 степенями свободы.

По данным выборок найдем

Тнабл дисперсии которых неизвестны и одинаковы - student2.ru » 7,09.

По таблице критических точек распределения Стьюдента находим tкрит.дв(0,01; 28) = 2,76 (при двусторонней критической области). Сравниваем Тнабл и tкрит.дв(0,01; 28). Так как ЅТнаблЅ> tкрит.дв(0,01; 28), то есть Тнабл попало в критическую область (рис. 3), нулевая гипотеза отвергается, справедлива конкурирующая: Н1:М(Х) № М(Y), а следовательно, расхождение между выборочными средними значимо.

Проверим гипотезу Н0 во втором случае:

Н0: М(Х) = М(Y),

Н1: М(Х) > М(Y).

Тнабл » 7,09; tкрит.пр(0,01, 28) = 2,46 (при правосторонней критической области).

Тнабл > tкрит.пр(0,01; 28) (рис. 2), вывод такой же, как и в первом случае.

Пример 4. Из двух партий изделий, изготовленных на двух одинаково настроенных станках, извлечены малые выборки, объемы которых 10 и 12. Получены следующие результаты:

  Размер изделий первого станка, см 3,4 3,5 3,7 3,9  
  Число изделий  
  Размер изделий второго станка, см 3,2 3,4 3,6  
  Число изделий  
               

При уровне значимости 0,05 проверить гипотезу о равенстве средних размеров изделий, предполагая, что результаты измерений имеют нормальный закон распределения.

Решение. Признак Х - размер изделий, изготовленных на первом станке. Признак Y - размер изделий, изготовленных на втором станке. Признаки имеют нормальный закон распределения. Требуется проверить гипотезу Н0: М(Х) = М(Y).

Для проверки нулевой гипотезы сделаны выборки объемами nx = 10 и ny = 12. По выборочным данным найдем точечные оценки параметров данных распределений. Расчеты приведем в таблице:

xi дисперсии которых неизвестны и одинаковы - student2.ru xi дисперсии которых неизвестны и одинаковы - student2.ru дисперсии которых неизвестны и одинаковы - student2.ru дисперсии которых неизвестны и одинаковы - student2.ru yj дисперсии которых неизвестны и одинаковы - student2.ru yj дисперсии которых неизвестны и одинаковы - student2.ru дисперсии которых неизвестны и одинаковы - student2.ru дисперсии которых неизвестны и одинаковы - student2.ru
3,4 3,5 3,7 3,9 6,8 10,5 14,8 3,9 23,12 36,75 54,76 15,21 3,2 3,4 3,6 - - 6,4 6,8 28,8 - 20,48 23,12 103,68 -
Итого 36,0 129,84 - 42,0 147,28

дисперсии которых неизвестны и одинаковы - student2.ru

дисперсии которых неизвестны и одинаковы - student2.ru

дисперсии которых неизвестны и одинаковы - student2.ru дисперсии которых неизвестны и одинаковы - student2.ru

дисперсии которых неизвестны и одинаковы - student2.ru

Так как о генеральных дисперсиях ничего не известно, предварительно проверим вспомогательную нулевую гипотезу Н0: D(Х) = D(Y) при конкурирующей Н1: D(Х) > D(Y). По выборочным данным проверяем гипотезу с помощью случайной величины дисперсии которых неизвестны и одинаковы - student2.ru , которая имеет распределение Фишера - Снедекора с k1 = nх - 1 = 9 и k2 = ny -
- 1 = 11 степенями свободы.

Находим Fнабл = дисперсии которых неизвестны и одинаковы - student2.ru » 1,05. По таблице критических точек распределения Фишера - Снедекора имеем Fкрит(0,05; 9, 11) = 2,90.

Так как Fнабл < Fкрит (a, k1, k2), то есть наблюдаемое значение критерия попало в область принятия гипотезы, нет оснований отвергать нулевую гипотезу по данным наблюдения D(Х) = D(Y), расхождение между исправленными дисперсиями случайное. Следовательно, можно проверить основную гипотезу. Для ее проверки выбираем конкурирующую гипотезу. В данном случае можно взять

Н1: М(Х) № М(Y), либо Н1 :М(Х) > М(Y).

Односторонняя критическая область дает более точный результат проверки гипотезы, поэтому берем вторую конкурирующую гипотезу.

Итак, Н0: М(Х) = М(Y), Н1: М(Х) > М(Y).

Проверяем нулевую гипотезу с помощью случайной величины

дисперсии которых неизвестны и одинаковы - student2.ru

которая имеет распределение Стьюдента с k = nx+ny -2 = 10 + 12 -
-2 = 20 степенями свободы. По выборочным данным находим

Тнабл дисперсии которых неизвестны и одинаковы - student2.ru » 14,49 .

По таблице критических точек распределения Стьюдента находим tкрит.пр(0,05, 20) = 1,73.

Так как Тнабл > tкрит.пр (0,05; 20), то есть наблюдаемое значение критерия попало в критическую область (рис. 2), то нулевая гипотеза отвергается, а принимается конкурирующая гипотеза Н1:М(Х) > М(Y); расхождение между выборочными средними значимо, а следовательно, средние размеры изделий, изготовленных на двух одинаково настроенных станках, различные.

Наши рекомендации