Сравнение средних генеральных совокупностей
Пусть имеются две генеральные совокупности СВ Х и СВ Y объемами N и М соответственно. Предположим, что известны генеральные дисперсии и .
Сформулируем нулевую гипотезу Н0: генеральные средние совокупностей Х и Y равны, т.е. = .
В качестве конкурирующей гипотезы можно выбрать одну из трех возможных гипотез:
а) Н1: > ,
б) Н1: < ,
в) Н1: ¹ .
При достаточно больших объемах выборочные совокупности, составленные из совокупностей Х и Y, в силу закона больших чисел имеют приближенно нормальный закон распределения с параметрами , и , соответственно. Пусть объемы выборок n и m соответственно. Несложно показать, что в случае справедливости гипотезы Н0 статистика
имеет стандартное нормальное распределение (а = 0, s2 = 1)*. Эту статистику можно взять в качестве критерия.
Для альтернативных гипотез Н1 (а) и (б) критическая область строится из условия
Ф(tкр) = Ф(t1 - 2a) = 1 - 2a.
Для альтернативной гипотезы Н1 (в) выполнится условие
Ф(tкр) = 1 - a.
Если модуль экспериментального значения критерия |tЭ| больше tкр, то гипотезу Н0 следует отвергнуть, если |tЭ| < tкр, то нет оснований отвергнуть нулевую гипотезу.
П р и м е р .1. По двум независимым выборкам, объемы которых
n = 100 и m = 80 соответственно, найдены выборочные средние = 125,
= 127. Известно, что данные выборки извлечены из нормально распределенных генеральных совокупностей с дисперсиями = 200 и = 160. При уровне значимости a = 0,05 проверить нулевую гипотезу Н0: = , при конкурирующей Н1: ¹ .
Решение. Найдем экспериментальное значение критерия
.
Границу критической области найдем из соотношения
Ф(tкр) = 1 - a = 0,95.
Используя таблицу II приложений, получим tкр = 1,96. Поскольку |tЭ| < tкр,
(1 £ 1,96), то нет оснований отвергнуть гипотезу Н0 и можно считать, что генеральные средние изучаемых совокупностей равны.
Изложенный критерий сравнения генеральных средних применим для достаточно больших (n, m ³ 100) выборок и в случае, когда дисперсии неизвестны и вместо них можно взять выборочные дисперсии и .
В случае выборок малого объема нельзя получить хорошей оценки генеральной дисперсии по выборочной дисперсии. В данном случае используется статистика
,
где исправленное среднее квадратическое отклонение, рассчитанное по объединенной (смешанной) совокупности объемом n1 = n + m.
Доказано, что статистика t имеет t-распределение Стьюдента. Однако, в общем случае число степеней свободы определяется приближенно достаточно сложным образом. Подсчет степеней свободы значительно упрощается, если известно, что генеральные дисперсии равны между собой. В этом случае статистика
имеет t-распределение с k = n + m – 2 степенями свободы.
Само правило проверки гипотезы Н0 в остальном остается таким же, как и для выборок большого объема.
На практике, естественно, достаточно редко известно о равенстве генеральных дисперсий. Поэтому для эффективного применения предложенной статистической проверки справедливости гипотезы Н0: = для малых выборок необходимо уметь сравнивать дисперсии двух или более генеральных совокупностей. Надо заметить, что поставленная задача имеет большое прикладное значение и в отрыве от задачи сравнения двух генеральных средних.
Рассмотрим две генеральные совокупности Х и Y, имеющие нормальное распределение. По независимым выборкам объемами n и m соответственно вычислены исправленные выборочные дисперсии и . Требуется по исправленным дисперсиям при заданном значении a проверить гипотезу Н0: s2(Х) = s2(Y) или М( ) = М( ).
Предположим, что ³ . В качестве статистики рассмотрим СВ
.
В случае справедливости гипотезы Н0 величина F имеет распределение Фишера – Снедекора со степенями свободы k1 = n – 1 и k1 = m – 1 (см. приложение V).
В качестве альтернативных гипотез можно выбрать следующие:
а) Н1: s2(Х) > s2(Y);
б) Н1: s2(Х) ¹ s2(Y).
В случае а) гипотеза Н0 отвергается, если FЭ > . В случае б) границы двусторонней критической области определяются значениями и .
Заметим, что для распределения Фишера – Снедекора справедливо равенство
.
Гипотеза Н0 отвергается, если FЭ < или FЭ > .
П р и м е р 2. Произведены две выборки урожая ржи, чтобы выяснить влияние новой технологии на урожайность. Одна выборка была произведена на 7 участках, где применялась новая технология. При этом средняя урожайность составила = 18 ц/га, а дисперсия = 16,2. Для выборки, произведенной на 8 участках, на которых новая технология не применялась, соответствующие показатели составили = 15,1 ц/га, = 8,1. На уровне значимости 0,05 выяснить влияние новой технологии на среднее значение урожайности.
Решение. Сформулируем гипотезу Н0: новая технология не влияет на урожайность, т.е. = . В качестве альтернативной выдвинем гипотезу Н1: > .
В данном случае объемы выборок составляют n = 7 и m = 8. Следовательно, в качестве критерия для проверки гипотезы выберем СВ
Для вычисления числа степеней свободы k проверим следующую гипотезу : = , против альтернативной гипотезы : > .
Используем в качестве критерия СВ
,
которая в случае справедливости гипотезы имеет распределение Фишера– Снедекора. Найдем экспериментальное значение критерия
.
По таблице V приложений найдем = F0,05; 7; 6 = 3,87. Поскольку
2 < 4,21, т.е. FЭ < , то нет оснований отвергнуть гипотезу Н0 и можно считать, что в данном опыте дисперсии выборок одинаковы.
В этом случае число степеней свободы для СВ t, которая в случае справедливости гипотезы Н0 имеет распределение Стьюдента, находится по формуле k = n + m – 2 = 13.
Найдем наблюдаемое значение критерия t
.
По таблице IV приложений найдем значение t0,9; 13 = 1,77 (значение g = 0,9 нашли по формуле g = 1 – 2a).
Так как tЭ < t0,9; 13, то можно считать, что = , т.е. новая технология не влияет на среднюю урожайность.