Элементы дисперсионного анализа
Дисперсионный анализ является одним из методов изучения влияния одного или нескольких факторных признаков на результативный признак. В зависимости от количества факторов дисперсионный анализ подразделяется на однофакторный и многофакторный. Ниже рассмотрено применение дисперсионного анализа для случая однофакторного комплекса.
В основе дисперсионного анализа лежит расчленение общей вариации изучаемого признака по источникам ее происхождения на два вида вариации:
• систематическую вариацию, которая обусловлена изменением признака-фактора;
• остаточную (случайную) вариацию, обусловленную действием прочих, случайных, не связанных с данным фактором обстоятельств.
Для разграничения этих вариаций всю совокупность наблюдавшихся единиц разбивают на группы (классы) по факторному признаку и исчисляют средние результативного признака по группам.
Групповые средние
;
общая средняя
.
где xi - индивидуальные значения признака в группе;
ni - число единиц, входящих в группу;
п - общее число наблюдений.
Если сравнение групповых средних показывает определенное различие в их уровне, то необходимо установить, является ли это различие существенным и вызвано ли оно влиянием признака-фактора.
Для ответа на поставленный вопрос определяют два показателя дисперсии:
1) показатель , характеризующий колеблемость групповых
средних вокруг общей средней (межгрупповая дисперсия);
2) показатель , отражающий остаточную, внутригрупповую
дисперсию. Полученные показатели сравнивают, получая фактическое дисперсионное отношение:
.
При дисперсионном анализе межгрупповую и внутригрупповую дисперсии определяют путем деления суммы квадратов отклонений на соответствующее число степеней свободы:
;
,
где — число единиц в группе:
;
т - число групповых средних (число выделенных групп по признаку-фактору);
.
По таблице F-распределения Р. Фишера (см. приложение 5) при определенном уровне значимости (или доверительной вероятности)1 и числе степеней свободы (К1 и К2) определяется табличное дисперсионное отношение (Fтабл).
1 Доверительная вероятность , где - уровень значимости.
Если Fрасч >Ftтабл , то следует считать, что гипотеза о влиянии признака-фактора не опровергается.
Решение типовых задач
1. Из партии электроламп взята 20%-ная случайная бесповторная выборка для определения среднего веса спирали. Результаты выборки следующие (табл. 4.5).
Таблица 5
Вес, мг | 38-40 | 40-42 | 42-44 | 44-46 |
Число спиралей |
Определишь с вероятностью 0,95 доверительные пределы, в которых лежит средний вес спирали, для всей партии электроламп.
Решение
Доверительные интервалы для генеральной средней с вероятностью Р:
,
где — средний уровень признака по выборке:
мг
; .
При вероятности Р = 0,95t = 1,96 (по таблице приложения 3).
мг.
Доверительные интервалы для генеральной средней с вероятностью Р = 0,95:
;
41,7 мг ≤ ≤ 42,3 мг.
2. При контрольной проверке качества апельсинов проведена 10%-ная серийная выборка. Из партии, содержащей 50 ящиков апельсинов (вес ящиков одинаков), методом механического отбора взято 5 ящиков. В результате сплошного обследования находящихся в ящике апельсинов получили данные об Удельном весе бракованных апельсинов. Результаты следующие (табл.6).
Таблица 6
№ ящика, попавшего в выборку | |||||
Удельный вес бракованной продукции, % | 1,2 | 1,8 | 2,0 | 1,0 | 1,5 |
Требуется с вероятностью 0,95 установить доверительные интервалы удельного веса бракованной продукции для всей партии апельсинов.
Решение
Для установления доверительного интервала, в котором для всей партии поставки находится доля бракованной продукции, используется формула .
,
где — межсерийная (межгрупповая) выборочная дисперсия доли;
т — число ящиков, попавших в выборку;
М — общее число ящиков.
При вероятности Р = 0,95t = 1,96 (см. приложение 3).
или 0,015
(при расчете использована простая арифметическая, так как вес ящиков одинаков).
.
, или 0,3%
3. В цехе проектируется проведение моментных наблюдений для выявления текущих простоев производственного оборудования.
Требуется для организации моментных наблюдений определить необходимое число наблюдений и число обходов, если в цехе имеется 20 единиц предназначенного к работе оборудования. Никаких предварительных данных о доле простоев в сменном фонде не имеется. Ошибка наблюдения не должна превышать 5% и гарантирована с вероятностью 0,954.
Решение
Необходимая численность моментов наблюдения определяется по формуле
.
По условию задачи:
t = 2 (так как вероятность Р = 0,954);
w - доля простоев по условию не дана, поэтому принимается наибольшая дисперсия, когда w = 0,5.
, или 0,05,
.
Число обходов (т. е. число записей о каждой единице оборудования) определяется путем деления числа наблюдений на число единиц оборудования:
.