Двухфакторный дисперсионный анализ
Если на исследуемый признак влияют несколько факторов одновременно, то имеет место многофакторный дисперсионный анализ, который имеет свои особенности, так как имеет место дополнительное влияние взаимодействия между факторами.
Рассмотрим на примере задачу оценки влияния двух одновременно действующих факторов. Предположим, что имеется несколько однотипных прессов, формования деталей обуви, и несколько видов сырья. Требуется выяснить, значимо ли влияние различных прессов и качество сырья в партиях на качество обрабатываемых деталей обуви. Это типичная задача двухфакторного дисперсионного анализа.
Считаем, что предпосылки дисперсионного анализа выполнены. Пусть фактор А - влияние настройки прессов, фактор В - влияние качества сырья. Имеем r станков, следовательно, r уровней фактора A, t партий сырья, следовательно, t уровней фактора В. Матрицу наблюдений представим в виде (табл. 3.8).
Таблица 3.8
Пресса, i | Партии сырья, j | ||||||
B1 | B2 | … | BJ | … | Bt | i* | |
A1 | x11 | x12 | … | … | … | x1t | 1* |
A2 | x21 | x22 | … | … | … | x2t | 2* |
… | … | … | … | … | … | … | … |
Ai | … | … | … | xij | … | … | … |
… | … | … | … | … | … | … | … |
Ar | xr1 | xr2 | … | … | … | xrt | r* |
*j | *1 | *2 | … | … | … | *t |
Пересечение i-го уровня фактора A с j-м уровнем фактора В образует ij-ю ячейку, в которую записывают наблюдения, полученные при одновременном исследовании факторов А и В на i-м и j-м уровнях.
Для простоты можно предположить, что имеем в ячейке только одно наблюдение xij. Предположим также, что между факторами А и В нет взаимодействия и что на i-м уровне фактора А наблюдения имеют среднюю βiA, а на j-м уровне фактора В наблюдения - среднюю βjB. Тогда одно наблюдение можно представить в виде
xij = µ + γi + γj +eij (3.3)
где µ - общая средняя; γi - эффект, обусловленный влиянием i-го уровня фактора А; γj — эффект, обусловленный влиянием j-го уровня фактора В; eij - вариация результатов внутри отдельной ячейки (в случае одного наблюдения вариация равна нулю).
Оценками µ, βiA , βjB - являются соответственно:
общая средняя
и средние по уровням
В двухфакторном дисперсионном анализе общая сумма квадратов отклонений от общей средней раскладывается согласно формуле (3.3) на три части: часть общей суммы квадратов, обусловленную влиянием фактора А, часть, обусловленную влиянием фактора В, и часть, обусловленную влиянием факторов взаимодействия АВ. Сумма квадратов отклонений (табл. 3.9) рассчитывается по формуле:
SS=SS1+SS2+SS3,
где SS1, представляет собой сумму квадратов разностей между средними по строкам и общим средним и характеризует изменение признака по фактору A.
SS2 представляет собой сумму квадратов разностей между средними по столбцам и общим средним и характеризует изменение признака по фактору В.
SS3 называется остаточной суммой квадратов и характеризует влияние факторов взаимодействия.
SS называется общей или полной суммой квадратов отклонений отдельных наблюдений от общей средней.
Таблица 3.9
Компоненты дисперсии | Сумма квадратов | Оценка дисперсии |
Между средними по строкам | ||
Между средними по столбцам | ||
Остаточная | ||
Полная (общая) |
В двухфакторном анализе для выяснения значимости влияния факторов А и В на исследуемый признак сравнивают дисперсии по факторам с остаточной дисперсией. Оценим дисперсии по формулам (табл. 3.9).
Для оценки существенности влияния факторов А и В и их взаимодействия АВ достаточно проверить нулевую гипотезу H0.
Для этого вычисляют критерий Фишера F1 = , с числом степеней свободы k1= r - 1 и k2 = (r-1)(t - 1) и F2 = , с числом степеней свободы k1= t - 1 и k2 = (r-1)(t - 1).
Затем по таблице F-распределения (см. таблицу распределения критерия Фишера) для уровня значимости α находят критическое значение Fкр. Если F1,2 > Fкр то нулевая гипотеза отвергается.
При F1,2 < Fкр нет основания отвергать нулевую гипотезу.
Сравнение отношений дисперсии между средними по строкам и столбцам с остаточной дисперсией, т.е. отношений и по их величине судят, насколько сильно проявляется влияние факторов на исследуемый объект.
Рассмотрим пример 3.2. В раскройном цехе работает три закройщика. Лекала конструкции одежды разрабатывали два конструктора. Требуется выяснить, значимо ли влияние качества конструкции лекал и качество работы закройщиков на качество готовой одежды. Количество настилов тканей раскроенных каждым закройщиком по лекалам конструкторов представлено в (табл. 3.10).
Таблица 3.10. Матрица наблюдений
В1 | В2 | В3 | ||
А1 | ||||
А2 | ||||
6,5 | 4,5 |
Решение.
Пусть фактор А (А1 и А2) – влияние работы конструкторов, а фактор В (В1, В2, В3) влияние качества работы закройщиков. Имеем r = 2, t = 3, п = rv = 6.
В матрице наблюдений (табл. 3.10) нижняя строка содержит средние значения по столбцам, а в правом крайнем столбце приведены средние значения по строкам, т.е. по уровням факторов. Общее среднее = 4,5.
По формулам (табл. 3.9) вычислим суммы квадратов:
SS1 = 37,5; SS2 = 13; SS3 = 3; SS= 53,5.
Рассчитаем оценки дисперсий:
= 37,5/1 = 37,5; = 13/2 = 6,5; = 3/(1 ∙ 2) = 1,5;
σ2 = 53,5/(2∙3- 1) = 10,7.
Вычисляем Fa и FВ: FА = =37,5/1,5=25
и FВ = =6,5/1,5=4,3
Для уровня значимости α = 0,05 и к2 = 2, к1 = 1 степеней свободы по таблице F-распределения (см. приложения) находим значения Fкр: FкрА=18,51 и FкрВ=19,0
Сравнивая табличные значения с вычисленными, имеем:
Fa > FKрА; FB < FкрB.
Полученные результаты позволяют сделать следующие выводы:
1 - нулевая гипотеза о равенстве средних по строкам не подтверждается, т.е. влияние фактора А на исследуемый признак значимо;
2 - нулевая гипотеза о равенстве средних по столбцам не опровергается, т.е. влияние фактора В на исследуемый признак незначимо.
Выполним расчеты в программе Excel.
В пакете Анализ данных инструмент Двухфакторный дисперсионный анализ без повторений представляет собой двухфакторный анализ дисперсии, не включающий более одной выборки на группу. Используется для проверки гипотезы о том, что средние значения двух или нескольких выборок одинаковы (выборки принадлежат одной и той же генеральной совокупности)