Поняття про двофакторний дисперсійний аналіз
Припустимо, що в розглянутій задачі про якість різних (m) партій вироби виготовлялися на різних (l) верстатах і потрібно з'ясувати, чи є суттєві відмінності в якості виробів по кожному фактору: А - партія виробів, В - верстат. В результаті ми приходимо до задачі двофакторного дисперсійного аналізу.
Усі наявні дані представимо у вигляді табл. 5.4, в якій по рядках - рівні фактора А, по стовпцях - рівні чинника В, а у відповідних комірчинах таблиці знаходяться значення показника якості виробів
Двофакторна дисперсійна модель має вигляд:
, (5.14)
де - значення спостереження в осередку ij з номером k;
- загальна середня;
- ефект, обумовлений впливом i-го рівня фактора А;
- ефект, обумовлений впливом j-го рівня фактора В ;
- ефект, обумовлений взаємодією двох факторів, тобто відхилення від середнього за спостереженнями у клітинці ij від суми перших трьох доданків в моделі (5.14);
- збурення, обумовлене варіацією змінної в середині окремої комірки.
Таблиця 5.4
В А | … | … | ||||
… | … | |||||
… | … | |||||
… | … | … | … | … | … | |
… | … | |||||
… | … | … | … | … | … | |
… | … |
Вважаємо, що має нормальний закон розподілу , а всі математичні сподівання дорівнюють нулю. Групові середні знаходяться за формулами:
по клітинці – (5.15)
по рядку – (5.16)
по стовпцю – (5.17)
Загальне середнє - (5.18)
Таблиця 5.5 – таблиця дисперсійного аналізу.
Можна показати, що перевірка нульових гіпотез про відсутність впливу на розглянуту змінну факторів А, В та їх взаємодії АВ здійснюється порівнянням відношень (для моделі I з фіксованими рівнями факторів) або відношень (для випадкової моделі ІІ) з відповідними табличними значеннями F- критерію Фішера-Снедекора. Для змішаної моделі III перевірка гіпотез щодо факторів із фіксованими рівнями проводиться так само, як у моделі II, а факторів із випадковими рівнями - як в моделі I.
Якщо n = 1, тобто при одному спостереженні в осередку, то не всі нульові гіпотези можуть бути перевірені, оскільки випадає компонента із загальної суми квадратів відхилень, а з нею і середній квадрат , бо в цьому випадку не може бути мови про взаємодію чинників.
Таблиця 5.5
Компоненти дисперсії | Сума квадратів | Число степенів вільності | Середні квадрати |
Міжгрупова (фактор А) | m-1 | ||
Міжгрупова (фактор В) | l-1 | ||
Взаємодія (АВ) | (m-1)(l-1) | ||
Залишкова | mln-ml | ||
Загальна | mln-1 |
◄ Приклад 5.2. У табл. 5.6 наведені добові прирости (г) відібраних для дослідження 18 поросят в залежності від методу утримання поросят (фактор А) та якості їх годівлі (фактор В). Необхідно на рівні значущості
= 0,05 оцінити суттєвість (достовірність) впливу кожного фактора і їх взаємодії на добовий приріст ваги поросят.
Розв’язання. Маємо m = 3, l = 2, n = 3. Визначимо (в г) середні значення приросту ваги:
в осередках – за (5.15): ;
і аналогічно,
Таблиця 5.6
Кількість голів в групі (фактор А) | Вміст протеїну в кормі, г (фактор В) | |
Кількість голів в групі (фактор А) | В1=80 | В2=100 |
А1 = 30 | 530, 540, 550 | 600, 620, 580 |
А2 = 100 | 490, 510, 520 | 550, 540, 560 |
А3 = 300 | 430, 420, 450 | 470, 460, 430 |
; по рядках – за (5.16):
і, аналогічно
по стовпцях - за (5.17):
і, аналогічно
Загальний середній приріст - за (5.18):
Всі середні значення приросту (г) відобразимо у табл. 5.7. З таблиці 5.7 випливає, що зі збільшенням кількості голів у групі середній добовий приріст поросят у середньому зменшується, а при збільшенні вмісту протеїну в кормі - в середньому збільшується. Але чи є ця тенденція достовірною або пояснюється випадковими причинами? Для відповіді на це питання за формулами табл. 5.5 обчислимо необхідні суми квадратів відхилень:
Середні квадрати знаходимо діленням отриманих сум на відповідну їм кількість степенів вільності m-1= 2, l-1 = 1; (m-1) (l -1) = 2; mln - ml = 18-6 = 12; mln-1 = 18-1 = 17.
Таблиця 5.7
Кількість голів у групі (фактор А) | Вміст протеїну в кормі, г (фактор В) | ||
Результати зведемо в табл. 5.8.
Очевидно, дані фактори мають фіксовані рівні, тобто ми знаходимося в рамках моделі I. Тому для перевірки істотності впливу факторів А, В та їх взаємодії АВ необхідно знайти відношення:
і порівняти їх з табличними значеннями відповідно .
Таблиця 5.8
Компонента дисперсії | Суми квадратів | Число степенів вільності | Середні квадрати |
Міжгрупова (фактор А) Міжгрупова (фактор В) Взаємодія (АВ) | |||
Залишкова | |||
Загальна |
Оскільки і , то вплив методу утримання поросят (фактору А) та якості їх годівлі (фактора В) є істотним. В силу того що , взаємодія зазначених факторів незначна. ►
Зауваження. З точки зору техніки обчислень для знаходження сум квадратів доцільніше використовувати формули:
(5.19)
(5.20)
(5.21)
(5.22)
. (5.23)
Так, у розглянутому прикладі 5.2:
і за формулами (5.19) - (5.23):
При вирішенні реальних завдань методом дисперсійного аналізу використовуються статистичні програмні пакети.
Відхилення від основних передумов дисперсійного аналізу - нормальності розподілу досліджуваної змінної і рівності дисперсій в осередках (якщо воно не надмірне) - не позначається істотно на результатах при рівному числі спостережень в осередках, але може бути дуже чутливим при нерівному їх числі . Крім того, при нерівному числі спостережень в осередках різко зростає складність апарату дисперсійного аналізу. Тому рекомендується планувати схему з рівним числом спостережень в осередках, а якщо зустрічаються відсутні дані, то відшкодовувати їх середніми значеннями інших спостережень в осередках. При цьому, проте, штучно введені відсутні дані не слід враховувати при обчисленні степенів вільності.
Контрольні питання
1. В чому полягає сутність дисперсійного аналізу?
2. За яких умов застосовують однофакторний дисперсійний аналіз?
3. За яких умов застосовують двофакторний дисперсійний аналіз?
4. Як інтерпретувати результати дисперсійного аналізу?
РОЗДІЛ 6