Правило принятия решения при использовании критерия Фишера.
Если альтернативная гипотеза Н1: > , то по таблице критических точек распределения Фишера (или вычисляется в Excel) для заданного уровня значимости a и чисел степеней свободы распределения Фишера, равных
kх=nх -1 и kу=nу -1, (4.2)
где nх и nу - объемы выборок, находится критическая точка распределения Фишера Fa(kх, kу) правосторонней критической области. Это значение сравнивается с наблюдаемым значением критерия Фишера:
· если <Fa(kх, kу), то нет оснований отвергнуть основную гипотезу, то есть различие между выборочными дисперсиями признается случайным и экспериментальные данные не противоречат предположению о равенстве генеральных дисперсий;
· если ³Fa(kх, kу), то основная гипотеза отвергается, то есть различие между выборочными дисперсиями признается существенным.
Сравнение дисперсий необходимо в различных случаях, например, для сравнения точности измерительных приборов, самих методов измерения. Очевидно, что предпочтительнее тот измерительный прибор или метод, который дает меньший разброс результатов измерений, то есть наименьшую дисперсию. Устанавливать, являются ли генеральные дисперсии двух выборок одинаковыми или различными, следует перед использованием критерия Стьюдента.
Сравнение дисперсий двух выборок средствами Excel.
Наиболее удобным и быстрым способом сравнения дисперсий двух выборок в Excel является использование Пакета анализа. Для этого в Пакете анализа имеется инструмент анализа под названием Двухвыборочный F-тест для дисперсии.
Вызов этого инструмента осуществляется выполнением команд Сервис®Анализ данных. После этого, в появившемся диалоговом окне Анализ данных следует выбрать среди инструментов анализа нужный вам Двухвыборочный F-тест для дисперсии и нажать ОК. В результате появится новое диалоговое окно Двухвыборочный F-тест для дисперсии.
В этом окне следует:
· в группе Входные данные в поле Интервал переменной 1 ввести адрес интервала ячеек, содержащих данные первой измеренной величины (первая выборка), а в поле Интервал переменной 2ввести адрес интервала ячеек, содержащих данные второй измеренной величины (вторая выборка);
· в поле Альфа установить уровень значимости (по умолчанию установлено a=0,05);
· в группе Параметры вывода, если вы хотите вывести результаты вычислений на текущем рабочем листе этого файла, то необходимо активизировать переключатель Выходной интервал и указать его адрес в поле справа;
· если вы хотите вывести результаты вычислений на другой рабочий лист, то следует активизировать переключатель Новый рабочий лист и ввести его адрес в поле справа;
· если вы хотите вывести результаты вычислений в новый файл, то следует активизировать переключатель Новая рабочая книга.
После того, как установлены все необходимые параметры, следует закрыть диалоговое окно нажатием на ОК.
В результате появится таблица, в которой будут содержаться вычисленные выборочные средние, дисперсии, для каждой выборки: число степеней свободы (4.2) для каждой выборки (в строке: df), наблюдаемое значение критерия Фишера (4.1) (в строке: F), вероятность того, что наблюдаемое значение критерия будет меньше критической точки односторонней критической области (в строке: Р(F<=f) одностороннее), критическая точка распределения односторонней критической области (в последней строке: F критическое одностороннее).
Для принятия решения следует сравнить наблюдаемое значение критерия Фишера, находящееся в строке F данной таблицы, с критической точкой распределения Фишера, находящейся в последней строке данной таблицы.
После проведения F-теста может оказаться, что дисперсия первой переменной меньше дисперсия второй переменной (что соответствует тому, что в формуле (4.1) в числителе оказалась меньшая дисперсия). Действительно, в Excel первой переменной считается та, наблюдаемые значения которой расположены в левом столбце (или верхней строке), а дисперсия первой выборки может оказаться меньше. Тогда в этом случае правило принятия решения меняется:
· если >Fa, то нет оснований отвергнуть основную гипотезу;
· если <Fa, то основная гипотеза отвергается.
В Excel в этом случае вычисляются значения критерия Фишера для проверки другой альтернативной гипотезы: Н1: < .
§5.3. Критерий Стьюдента (t-тест) сравнения выборочных средних двух независимых выборок
Критерий Стьюдента.
Пусть из двух генеральных совокупностей Х и Y, имеющих распределение, близкое к нормальному, извлечено по одной независимой выборке. Вычисленные по этим выборкам средние значения и , как правило, различаются. В силу случайности выборки это различие может быть случайным, и генеральные средние и могут совпадать.
Требуется проверить основную гипотезу Н0: = . Значимость различия между двумя выборочными средними и определяется с помощью критерия Стьюдента (или t – критерия).
Наблюдаемое значение критерия Стьюдента вычисляется по формуле:
, (4.3)
где величина называется ошибкой разности выборочных средних. Вычисление зависит от объемов выборок и того, предполагаются ли равными или нет неизвестные дисперсии генеральных совокупностей:
· если объемы выборок nх и nу примерно одинаковые и достаточно большие, т.е. nх>30 и nу>30, то
,
где и – дисперсии выборок из двух генеральных совокупностей Х и Y;
· если объемы выборок nх и nу малы, т.е. nх<30 и nу<30, а дисперсии генеральных совокупностей неизвестны и предполагаются равными, то
,
где и – исправленные дисперсии выборок из двух генеральных совокупностей Х и Y.
Поэтому перед вычислением критерия Стьюдента всегда следует проверить гипотезу о равенстве генеральных дисперсий с помощью критерия Фишера.