Двухфакторный дисперсионный анализ без повторений
Однофакторный дисперсионный анализ
Однофакторный дисперсионный анализ применяется для того, чтобы ответить на следующий вопрос: влияет ли некий качественный фактор А, имеющий несколько уровней А1, А2, …, Аk, на случайную величину X, имеющую нормальный закон распределения вероятностей с дисперсией σ2.
Находим критическое значение по таблице распределения Фишера-Снедекора.
Если , то делается вывод о том, что влияние фактора А значимо с уровнем значимости α.
Пример 1.1Определить с уровнем α = 0,05 значимость различия производительности труда в трех бригадах рабочих-токарей за десять дней работы (табл. 1.1, за каждый день приведено среднее число изготовленных за час деталей на одного рабочего).
Таблица 1.1
Дни | 1-я бригада | 2-я бригада | 3-я бригада |
Используем табличный процессор EXCEL.
Решение. Введите данные о производительности труда из табл.1.1 в диапазоне А1:С11.
Войти в меню «Анализ данных», в появившемся окне выберите «Однофакторный дисперсионный анализ», укажите в строке «Входной интервал» диапазон А1:С11, установите флажок в строке «Метки», введите в строке «Альфа» уровень значимости 0,05, в строке «Выходной интервал» введите ссылку А15 и нажмите кнопку «Ок».
Рис.1.1
В результате расчета в диапазоне А15:G29 будут выведены итоги (рис.1.2). Значение F-критерия равно 14,3571, и оно больше критического значения 3,3541.
Рис.1.2
Вывод. Различие производительности труда в бригадах значимо с уровнем значимости 0,05.
Обратите внимание на P-Значение в ячейке F26. Это число 0,0001 соответствует уровню значимости, для которого наблюденное значение F-критерия 14,3571 является критическим. Другими словами, различие в производительности труда значимо с уровнем 0,0001.
Так как P-Значение меньше уровня значимости 0,05, то различие производительности труда в бригадах значимо.
Двухфакторный дисперсионный анализ без повторений
Пусть на значения случайной величины X оказывают влияние два фактора A и B, причем эти факторы друг с другом не взаимодействуют, но влияют на математическое ожидание величины X и не влияют на её дисперсию.
Имеется выборка {xij, i = 1, 2, …, m; j = 1, 2, …, l} значений признака X, полученных при уровнях Ai и Bj факторов A и B. Каждой паре Ai и Bj значений факторов соответствует одно значение xij.
Необходимо проверить две гипотезы:
Фактор A не влияет на значение признака X;
Фактор B не влияет на значение признака X.
Пример 1.2При выращивании помидоров на тридцати участках применялись пять сортов семян и шесть технологий выращивания. В табл.1.2 приведены показатели урожайности помидоров. Влияют ли факторы (сорт семян и технология выращивания) на урожайность продукции?
Таблица 1.2
Технология 1 | Технология 2 | Технология 3 | Технология 4 | Технология 5 | Технология 6 | |
Сорт А | ||||||
Сорт Б | ||||||
Сорт В | ||||||
Сорт Г | ||||||
Сорт Д |
Решение. Введите данные из табл.1.2 в программе Excel, как показано на рис.1.3.
Рис.1.3
Войти в меню «Анализ данных», выберите процедуру «Двухфакторный дисперсионный анализ без повторений», и в открывшемся окне (рис.1.4) введите в строке «Входной интервал» диапазон А1:G6, поставьте флажок в строке «Метки», выберите в строке «Альфа» уровень значимости 0,05 и нажмите «Ок».
Рис.1.4
Результаты приведены в табл. 1.3.
Таблица 1.3
A | B | C | D | E | F | G | |
Двухфакторный дисперсионный анализ без повторений | |||||||
ИТОГИ | Счет | Сумма | Среднее | Дисперсия | |||
Сорт А | 134,33 | 30,67 | |||||
Сорт Б | 130,67 | 53,87 | |||||
Сорт В | |||||||
Сорт Г | 142,67 | 24,67 | |||||
Сорт Д | 128,5 | 44,3 | |||||
Технология 1 | 132,2 | 92,2 | |||||
Технология 2 | |||||||
Технология 3 | 130,6 | 61,8 | |||||
Технология 4 | 132,6 | 36,3 | |||||
Технология 5 | 136,2 | 50,2 | |||||
Технология 6 | 135,2 | 73,7 | |||||
Дисперсионный анализ | |||||||
Источник вариации | SS | df | MS | F | P-Значение | F критическое | |
Строки | 719,47 | 179,8667 | 4,8525 | 0,0067 | 2,8661 | ||
Столбцы | 116,17 | 23,2333 | 0,6268 | 0,6813 | 2,7109 | ||
Погрешность | 741,33 | 37,0667 | |||||
Итого | 1576,97 |
Вывод. Мы видим, что наблюденное значение F-критерия больше критического значения для строк (ячейки Е20 и G20). В ячейке F20 P-Значение равно 0,0067 и оно меньше уровня значимости 0,05 (это следует из предыдущего). Фактор «Сорт семян» влияет на урожайность помидоров.
А в строке «Столбцы» наблюденное значение F-критерия меньше критического значения для строк (ячейки Е21 и G21). (В ячейке F21 P-Значение 0,6813 больше уровня значимости 0,05.) Фактор «Технология выращивания» не влияет на урожайность помидоров.