Теоретическая часть. Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак
Задачей дисперсионного анализа является изучение влияния одного или нескольких факторов на рассматриваемый признак.
Однофакторный дисперсионный анализ используется в тех случаях, когда есть в распоряжении три или более независимые выборки, полученные из одной генеральной совокупности путем изменения какого-либо независимого фактора, для которого по каким-либо причинам нет количественных измерений.
Для этих выборок предполагают, что они имеют разные выборочные средние и одинаковые выборочные дисперсии. Поэтому необходимо ответить на вопрос, оказал ли этот фактор существенное влияние на разброс выборочных средних или разброс является следствием случайностей, вызванных небольшими объемами выборок. Другими словами если выборки принадлежат одной и той же генеральной совокупности, то разброс данных между выборками (между группами) должен быть не больше, чем разброс данных внутри этих выборок (внутри групп).
Пусть – -й элемент -выборки , где – число выборок, – число данных в -выборке. Тогда – выборочное среднее -выборки определяется по формуле . Общее среднее вычисляется по формуле , где .
Основное тождество дисперсионного анализа имеет следующий вид:
,
где – сумма квадратов отклонений выборочных средних от общего среднего (сумма квадратов отклонений между группами);
– сумма квадратов отклонений наблюдаемых значений от выборочной средней (сумма квадратов отклонений внутри групп);
– общая сумма квадратов отклонений наблюдаемых значений от общего среднего .
Расчет этих сумм квадратов отклонений осуществляется по следующим формулам:
,
, .
В качестве критерия необходимо воспользоваться критерием Фишера:
.
Если расчетное значение критерия Фишера будет меньше, чем табличное значение – нет оснований считать, что независимый фактор оказывает влияние на разброс средних значений, в противном случае, независимый фактор оказывает существенное влияние на разброс средних значений ( – уровень значимости, уровень риска, обычно для экономических задач ).