Однофакторный дисперсионный анализ

Предположим, что на автоматической линии несколько станков параллельно выполняют одинаковую операцию. Для правильного планирования последующей обработки важно знать, насколько однотипны средние размеры деталей, получаемые на параллельно работающих станках. Здесь имеет место лишь один фактор, влияющий на размер деталей, это станки, на которых они изготовляются. Необходимо выяснить, насколько существенно влияние этого фактора на размеры деталей. Предположим, что совокупности размеров деталей, изготовленных на каждом станке, имеют нормальное распределение и равные дисперсии.

Имеем т станков, следовательно, т совокупностей или уровней, на которых произведено n1, n2,..., пт наблюдений. Для простоты рассуждений предположим, что n1=n2=…=пт. Размеры деталей, составляющие ni наблюдений на i-м уровне, обозначим хi1i2,..., xin. Тогда все наблюдения можно представить в виде таблицы, которая называется матрицей наблюдений (табл. 3.1).

Таблица 3.1

Уровни Результаты наблюдений
1 2 j n
x11 x12 x1j x1n
x21 x22 x2j x2n
x31 x32 x3j x3n
i xi1 xi2 xij xin
m xm1 xm2 xmj xmn

Будем полагать, что для i-го уровня п наблюдений имеют среднюю βi, равную сумме общей средней µ и вариации ее, обусловленной i-м уровнем фактора, т.е. βi = µ + γi. Тогда одно наблюдение можно представить в следующем виде:

xij = µ + γi. +εij= βiij (3.1)

где µ — общая средняя; γi — эффект, обусловленный i-м уровнем фактора; εij — вариация результатов внутри отдельного уровня.

Член εij характеризует влияние всех не учтенных моделью (3.1) факторов. Согласно обшей задаче дисперсионного анализа нужно оценить существенность влияния фактора γ на размеры деталей. Общую вариацию переменной xij можно разложить на части, одна из которых характеризует влияние фактора γ, другая — влияние неучтенных факторов. Для этого необходимо найти оценку общей средней µ и оценки средних по уровням βi. Очевидно, что оценкой β является средняя арифметическая п наблюдений i-го уровня, т.е.

однофакторный дисперсионный анализ - student2.ru

Звездочка в индексе при х означает, что наблюдения фиксированы на i-м уровне. Средняя арифметическая всей совокупности наблюдений является оценкой общей средней µ, т.е.

однофакторный дисперсионный анализ - student2.ru

Найдем сумму квадратов отклонений xij от однофакторный дисперсионный анализ - student2.ru , т.е.

однофакторный дисперсионный анализ - student2.ru

Представим ее в виде (3.2)

однофакторный дисперсионный анализ - student2.ru

однофакторный дисперсионный анализ - student2.ru

(3.2)

Причем однофакторный дисперсионный анализ - student2.ru = однофакторный дисперсионный анализ - student2.ru

Но однофакторный дисперсионный анализ - student2.ru = 0, так как это есть сумма отклонений переменных одной совокупности от средней арифметической этой же совокупности, т.е. вся сумма равна нулю. Второй член суммы (3.2) запишем в виде:

однофакторный дисперсионный анализ - student2.ru

однофакторный дисперсионный анализ - student2.ru

Или однофакторный дисперсионный анализ - student2.ru

Слагаемое однофакторный дисперсионный анализ - student2.ru является суммой квадратов разностей между средними уровней и средней всей совокупности наблюдений. Эта сумма называется суммой квадратов отклонений между группами и характеризует расхождение между уровнями. Величину однофакторный дисперсионный анализ - student2.ru , называют также рассеиванием по факторам, т.е. рассеиванием за счет исследуемого фактора.

Слагаемое однофакторный дисперсионный анализ - student2.ru является суммой квадратов разностей между отдельными наблюдениями и средней i-го уровня. Эта сумма назы­вается суммой квадратов отклонений внутри группы и характеризует расхождение между наблюдениями i-го уровня. Величину однофакторный дисперсионный анализ - student2.ru называют также остаточным рассеиванием, т.е. рассеиванием за счет неучтенных факторов.

Величину однофакторный дисперсионный анализ - student2.ru называется общей или полной суммой квадратов отклонений отдельных наблюдений от общей средней однофакторный дисперсионный анализ - student2.ru .

Зная суммы квадратов SS, SS1 и SS2, можно оценить несмещенные оценки соответствующих дисперсий - общей, межгрупповой и внутригрупповой (таблица 3.2).

Если влияние всех уровней фактора γ одинаково, то однофакторный дисперсионный анализ - student2.ru и однофакторный дисперсионный анализ - student2.ru - оценки общей дисперсии.

Тогда для оценки существенности влияния фактора γ достаточно проверить нулевую гипотезу H0: однофакторный дисперсионный анализ - student2.ru = однофакторный дисперсионный анализ - student2.ru .

Для этого вычисляют критерий Фишера FB = однофакторный дисперсионный анализ - student2.ru , с числом степеней свободы k1= т - 1 и k2 = т(п - 1). Затем по таблице F-распределения (см. таблицу распределения критерия Фишера) для уровня значимости α находят критическое значение Fкр.

Таблица 3.2

Компоненты дисперсии Сумма квадратов Число степеней свободы k Оценка дисперсии
Межгрупповая однофакторный дисперсионный анализ - student2.ru   т-1 однофакторный дисперсионный анализ - student2.ru  
Внутри-групповая однофакторный дисперсионный анализ - student2.ru m(n - 1) однофакторный дисперсионный анализ - student2.ru
Полная (общая) однофакторный дисперсионный анализ - student2.ru тп - 1 однофакторный дисперсионный анализ - student2.ru

Если FB > Fкр то нулевая гипотеза отвергается и делается заключение о существенном влиянии фактора γ.

При FB < Fкр нет основания отвергать нулевую гипотезу и можно считать, что влияние фактора γ несущественно.

Сравнивая межгрупповую и остаточную дисперсии, по величине их отношения судят, насколько сильно проявляется влияние факторов.

Пример 3.1. Имеется четыре партии тканей для спецодежды. Из каждой партии отобрано по пять образцов и проведены испытания на определение величины разрывной нагрузки. Результаты испытаний приведены в табл. 3.3.

Таблица 3.3

Номер партии, т Разрывная нагрузка, даН, п

Требуется выяснить, существенно ли влияние различных партий сырья на величину разрывной нагрузки.

Решение.

В данном случае т = 4, п = 5. Среднюю арифметическую каждой строки вычисляем по формуле однофакторный дисперсионный анализ - student2.ru

Имеем: однофакторный дисперсионный анализ - student2.ru =(200+140+170+145+165)/5=164; однофакторный дисперсионный анализ - student2.ru =170; однофакторный дисперсионный анализ - student2.ru =202; однофакторный дисперсионный анализ - student2.ru = 164.

Найдем среднюю арифметическую всей совокупности:

однофакторный дисперсионный анализ - student2.ru

Вычислим величины, необходимые для построения табл. 3.4:

· сумму квадратов отклонений между группами SS1, с k1=т –1=

=4-1=3 степенями свободы:

однофакторный дисперсионный анализ - student2.ru

· сумму квадратов отклонений внутри группы SS2 с k2 = тп – т= =20-4=16 степенями свободы:

однофакторный дисперсионный анализ - student2.ru

· полную сумму квадратов SS c k=mn-1=20-1=19 степенями свободы:

однофакторный дисперсионный анализ - student2.ru

По найденным значениям оценим дисперсию, по формулам (табл. 3.2) составим (табл. 3.4) для рассматриваемого примера.

Таблица 3.4

Компоненты дисперсии Суммы квадратов Число степеней свободы Оценка дисперсий
Межгрупповая 1660,0
Внутригрупповая 454,4
Полная 644,7

Проведем статистический анализ по критерию Фишера. Вычислим FB = однофакторный дисперсионный анализ - student2.ru =(4980• 1/3)/(7270 • 1/16) =1660/454,4= 3,65.

По таблице F-распределения (см. приложения) находим значение FKp при k2 = 16 и k1 = 3 степенях свободы и уровне значимости α = 0,01. Имеем FKp = 5,29.

Вычисленное значение FB меньше табличного, поэтому можно утверждать, что нулевая гипотеза не отвергается, а это значит, что различие между тканями в партиях не влияет на величину разрывной нагрузки.

В пакете Анализ данных инструмент Однофакторный дисперсионный анализ используется для проверки гипотезы о сходстве средних значений двух или более выборок, принадлежащих одной и той же генеральной совокупности. Рассмотрим работу пакета для проведения однофакторного дисперсионного анализа.

Решим пример 3.1, используя инструмент Однофакторный дисперсионный анализ.

Наши рекомендации