Краткие теоретические сведения. При дисперсионном анализе одновременно обрабатывают данные нескольких выборок (вариантов), составляющих единый статистический комплекс
При дисперсионном анализе одновременно обрабатывают данные нескольких выборок (вариантов), составляющих единый статистический комплекс, оформленный в виде специальной рабочей таблицы. Структура статистического комплекса и его последующий анализ определяются схемой и методикой эксперимента.
Сущностью дисперсионного анализа является расчленение общей суммы квадратов отклонений и общего числа степеней свободы
на части – компоненты, соответствующие структуре эксперимента, и оценка значимости действия и взаимодействия изучаемых факторов по F–критерию.
Если обрабатывают однофакторные статистические комплексы, состоящие из нескольких независимых выборок, например
l – вариантов в вегетационном опыте, то общая изменчивость результативного признака, измеряемая общей суммой квадратов СY, расчленяется на два компонента: варьирование между выборками (вариантами) СV и внутри выборок Cz. Следовательно, в общей форме изменчивость признака может быть представлена выражением:
.
Здесь вариация между выборками (вариантами) представляет ту часть общей дисперсии, которая обусловлена действием изучаемых факторов, а дисперсия внутри выборок характеризует случайное варьирование изучаемого признака, т. е. ошибку эксперимента.
Общее число степеней свободы (N – l) также расчленяется на две части – степени свободы для вариантов (l – 1) и для случайного варьирования (N – l).
Суммы квадратов отклонений по данным эксперимента – статистического комплекса с l-вариантами – обычно находят в такой последовательности. При общем числе наблюдений N определяются суммы по вариантам V и общая сумма всех наблюдений ΣХ. Затем вычисляются:
- корректирующий фактор (поправка) ;
- общая сумма квадратов ;
- сумма квадратов для вариантов ;
- сумма квадратов для ошибки (остаток) .
Две последние суммы квадратов СY и CZ делятся на соответствующие им степени свободы, т. е. приводятся к сравниваемому виду – одной степени свободы вариации. В результате получают два средних
квадрата:
- вариантов ;
- ошибки .
Эти средние квадраты и используют в дисперсионном анализе для оценки значимости действия изучаемых факторов. Оценка проводится путем сравнения дисперсии вариантов с дисперсией ошибки по критерию Фишера:
.
Таким образом, за базу – единицу сравнения принимают средний квадрат случайной дисперсии, которая определяет случайную ошибку эксперимента. При этом проверяемой нулевой гипотезой служит предположение: все выборочные средние являются оценками одной генеральной средней и, следовательно, различия между ними несущественны. Если Fфакт < Fтеop, то нулевая гипотеза Но: d = 0 не отвергается; между всеми выборочными средними нет существенных различий и на этом проверка заканчивается. Нулевая гипотеза отвергается, когда Fфакт ≥ Fтеop.
В этом случае дополнительно проводят оценку, между какими средними имеются значимые различия.
Проведение анализа
При испытании снотворного средства изучалось его действие для двух факторов: однократная доза (группа а) и двойная доза (группа b).
В каждой группе находилось по 10 подопытных объектов. Результативным признаком является продолжительность сна
(в часах).
Исходные данные для выполнения однофакторного дисперсионного анализа представлены в таблице 11.1.
Таблица 11.1 – Исходные данные
a | b |
Шаг 1. Откройте модуль Анализ данныхивыберитеопцию Однофакторный дисперсионный анализ, после чего щелкните мышкой OK.
Шаг 2. В появившемся окне выполнить операции и установки, как показано на рисунке 11.1.
Рисунок 11.1 – Стартовая панель
Шаг 3. Щелкните мышкой OK. Результат обработки появится в указанном поле (выходной интервал $D$1, таблицы 11.2, 11.3).
Таблица 11.2 – Статистические параметры
Группы | Счет | Сумма | Среднее | Дисперсия |
a | 3,7 | 2,68 | ||
b | 6,3 | 3,12 |
Таблица 11.3 – Результаты дисперсионного анализа
Источник вариации | SS | df | MS | F | P-значение | F критическое | Сила влияния, % |
Между группами | 33,8 | 33,8 | 11,7 | 0,003 | 4,4 | 39,3 | |
Внутри групп | 52,2 | 2,9 | 60,7 | ||||
Итого |
В рассмотренном примере эмпирический F-критерий (критерий Фишера) показывает, что различие между средними статистически значимо (значимо на уровне p=0,003, то есть меньше, чем критическое значение 0,05). Поскольку различие между средними значениями значимо, нулевая гипотеза о равенстве средних отвергается и принимается альтернативная гипотеза о существовании различия между средними.
Таким образом, действие снотворного в однократной и двойной дозах статистически достоверно отличаются.
Задания для выполнения
1 Введите в таблицу MS Excel исходные данные из Приложения Д (таблица Д1).
2 Выполните расчетные процедуры в соответствии с порядком операций, выполненных в настоящем разделе.
Получите результат и сделайте заключение.
Лабораторная работа 12
Однофакторный дисперсионный анализ
(однофакторный комплекс в Statistica 6)
Цель работы: научиться выполнять однофакторный дисперсионный анализ в программном продукте Statistica 6.