Глава 7. Однофакторный дисперсионный анализ
На практике часто встречается ситуация, когда можно указать один фактор, влияющий на значение исследуемого признака. Целью исследования является изучение изменчивости под влиянием фактора средних значений (например, гипотеза о их равенстве.) Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей. Дисперсии совокупностей одинаковы по предположению, если дисперсионный анализ покажет, что и математические ожидания одинаковы, то совокупности однородны. Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию и более надежные выводы.
Назначение метода.
Дисперсионный анализ – статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента. Результатом эксперимента является некоторая случайная величина , называемая результативным признаком. На значения случайной величины влияет фактор , который имеет уровней или групп .
Условия применения метода: Признак , на который воздействует фактор , измеряется количественно и имеет нормальный закон распределения.
Вторым условием применения анализа является равенство групповых генеральных дисперсий.
Гипотезы: Гипотеза утверждает, что все групповые средние равны между собой, альтернативная гипотеза говорит о том, что есть хотя бы две неравные средние.
Алгоритм метода:
Основная идея анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора и «остаточной дисперсией», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на , в этом случае средние наблюдаемых значений на каждом уровне различаются значимо. Пусть на количественный нормально распределенный признак воздействует фактор , который имеет уровней. На каждом уровне производится выборка объемом . Тогда общее число наблюдений .
Пусть - значения -ой выборки.
Вычислим:
- Сумма квадратов всех наблюдаемых значений.
- Квадрат суммы всех наблюдаемых значений.
Обозначим - общую сумму квадратов отклонений, наблюдаемых значений от общей средней: .
Вычислим:
- квадрат значений признака на уровне .
- сумма значений признака на уровне .
Обозначим - факторную сумму квадратов отклонений групповых средних от общей средней, которая характеризует расстояние «между группами».
Обозначим - остаточную сумму квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая характеризует рассеяние внутри группы.
Тогда ( по известному правилу сложения дисперсий.) Таким образом полная сумма квадратов отклонений от общего среднего разбивается на два компонента - сумма квадратов отклонений между группами и - сумма квадратов внутри групп.
Для проверки статистической гипотезы вычислим эмпирическое значение критерия по формуле: .
По таблице критических значений Фишера при заданном и степеням свободы находится критическое значение . Если тогда принимается, в противном случае отвергается.
Пример: Фирма решает вопрос о том, какую из трех систем контроля качества выбрать. Все три системы были тестированы. Результаты тестов отражены в таблице:
Номер системы | Число бракованных изделий в партии | Суммы | |
1,2,3,0,2,1 | |||
2,3,1,0,1 | |||
2,2,3,2 | |||
;
Принимаем на уровне значимости . Различия между системами не влияют на результаты контроля продукции.