Однофакторный дисперсионный анализ

Дисперсионным анализом называют статистический анализ результатов, зависящих от качественных факторов.

Сначала остановимся на случае одного фактора.

Пусть, например, ставится задача исследования влияния технологии обработки почвы на урожайность. Технологию естественно назвать фактором, а каждую конкретную технологию Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru — уровнем этого фактора. Здесь m— полное число применяемых технологий. Обозначим Однофакторный дисперсионный анализ - student2.ru — урожайность культуры, полученную в j-м году при использовании i -й технологии Однофакторный дисперсионный анализ - student2.ru ( Однофакторный дисперсионный анализ - student2.ru , Однофакторный дисперсионный анализ - student2.ru — число лет, в течение которых производились наблюдения за применением технологии Однофакторный дисперсионный анализ - student2.ru ). Сведем все данные в таблицу

  ...  
Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru ... Однофакторный дисперсионный анализ - student2.ru
Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru ... Однофакторный дисперсионный анализ - student2.ru
... ... ... ... ... ...
Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru Однофакторный дисперсионный анализ - student2.ru ... Однофакторный дисперсионный анализ - student2.ru

В разных строчках этой таблицы содержится, вообще говоря, разное число элементов.

Рассмотрим математическую модель, в которой предполагается, что каждая случайная величина Однофакторный дисперсионный анализ - student2.ru может быть представлена в виде

Однофакторный дисперсионный анализ - student2.ru ,

где Однофакторный дисперсионный анализ - student2.ru — урожайность, характерная для технологии Однофакторный дисперсионный анализ - student2.ru , а Однофакторный дисперсионный анализ - student2.ru — независимые случайные величины, которые описывают суммарный вклад всех случайных факторов, влияющих на итоговую урожайность. Чаще всего полагают, что все Однофакторный дисперсионный анализ - student2.ru , т.е. имеют нормальное распределение с нулевым математическим ожиданием и с одинаковой дисперсией Однофакторный дисперсионный анализ - student2.ru .

Задача, которую предстоит решить, ставится следующим образом: выяснить, влияет ли выбор технологии обработки почвы на урожайность культуры или нет. На математическом языке это означает, что по результатам эксперимента необходимо проверить справедливость статистической гипотезы Однофакторный дисперсионный анализ - student2.ru о том, что все технологии Однофакторный дисперсионный анализ - student2.ru одинаково эффективны, Однофакторный дисперсионный анализ - student2.ru .

Анализ результатов будет основан на сопоставлении двух оценок неизвестной дисперсии Однофакторный дисперсионный анализ - student2.ru .

Одна из этих оценок не зависит от того, верна ли гипотеза Однофакторный дисперсионный анализ - student2.ru . Для другой оценки это предположение существенно, т.е. эта оценка будет близка к значению Однофакторный дисперсионный анализ - student2.ru только тогда, когда гипотеза Однофакторный дисперсионный анализ - student2.ru верна.

Если обе оценки близки, то гипотезу Однофакторный дисперсионный анализ - student2.ru следует принять. Если же оценки существенно отличаются, то гипотезу Однофакторный дисперсионный анализ - student2.ru следует отвергнуть.

Построим эти оценки.

Сначала для каждой строки вычислим средние

Однофакторный дисперсионный анализ - student2.ru , Однофакторный дисперсионный анализ - student2.ru ,

а затем величину

Однофакторный дисперсионный анализ - student2.ru .

Важно отметить, что при сделанных предположениях о случайных величинах Однофакторный дисперсионный анализ - student2.ru , величина Однофакторный дисперсионный анализ - student2.ru имеет Однофакторный дисперсионный анализ - student2.ru - распределение с Однофакторный дисперсионный анализ - student2.ru степенями свободы независимо от того, верна ли гипотеза Однофакторный дисперсионный анализ - student2.ru . Следовательно, первая оценка для Однофакторный дисперсионный анализ - student2.ru получена.

Для получения второй оценки сначала вычислим величину

Однофакторный дисперсионный анализ - student2.ru , где Однофакторный дисперсионный анализ - student2.ru ,

а затем вычислим

Однофакторный дисперсионный анализ - student2.ru .

При выполнении гипотезы Однофакторный дисперсионный анализ - student2.ru величины Однофакторный дисперсионный анализ - student2.ru и Однофакторный дисперсионный анализ - student2.ru независимы, а величина Однофакторный дисперсионный анализ - student2.ru имеет Однофакторный дисперсионный анализ - student2.ru - распределение с Однофакторный дисперсионный анализ - student2.ru степенями свободы.

Теперь сравним обе оценки Однофакторный дисперсионный анализ - student2.ru и Однофакторный дисперсионный анализ - student2.ru . Если гипотеза Однофакторный дисперсионный анализ - student2.ru верна, то величина

Однофакторный дисперсионный анализ - student2.ru

имеет распределение Фишера с Однофакторный дисперсионный анализ - student2.ru степенями свободы. Напомним, что распределение Фишера характеризуется двумя параметрами: числом степеней свободы числителя и числом степеней свободы знаменателя.

Зададимся достаточно малым уровнем значимости Однофакторный дисперсионный анализ - student2.ru и решим уравнение

Однофакторный дисперсионный анализ - student2.ru .

Сравним корень этого уравнения Однофакторный дисперсионный анализ - student2.ru с вычисленным выше значением Однофакторный дисперсионный анализ - student2.ru .

При Однофакторный дисперсионный анализ - student2.ru гипотеза Однофакторный дисперсионный анализ - student2.ru отвергается. В противном случае — принимается.

Следующая задача — оценить степень влияния.

Для оценки степени влияния фактора используют выборочный коэффициент детерминации Однофакторный дисперсионный анализ - student2.ru , который вычисляется по формуле

Однофакторный дисперсионный анализ - student2.ru, где

Однофакторный дисперсионный анализ - student2.ru — оценка полной выборочной дисперсии, Однофакторный дисперсионный анализ - student2.ru .

Из Однофакторный дисперсионный анализ - student2.ru видно, что полная выборочная дисперсия состоит из двух слагаемых, Однофакторный дисперсионный анализ - student2.ru и Однофакторный дисперсионный анализ - student2.ru , причем Однофакторный дисперсионный анализ - student2.ru — это средняя величина групповых дисперсий, а Однофакторный дисперсионный анализ - student2.ru — дисперсия групповых средних.

Величина Однофакторный дисперсионный анализ - student2.ru характеризует изменчивость, обусловленную случайными факторами, а величина Однофакторный дисперсионный анализ - student2.ru определяет разброс средних значений в каждой группе около среднего значения всей выборки, т.е. зависит от различий параметров Однофакторный дисперсионный анализ - student2.ru .

Понятно, что коэффициент детерминации Однофакторный дисперсионный анализ - student2.ru показывает, какую часть в общей дисперсии величин Однофакторный дисперсионный анализ - student2.ru составляет часть, обусловленная зависимостью от фактора Однофакторный дисперсионный анализ - student2.ru .

Полученные результаты позволяют получить оценки параметров исходной модели.

Если гипотеза Однофакторный дисперсионный анализ - student2.ru принимается, т.е. Однофакторный дисперсионный анализ - student2.ru , то оценкой параметра Однофакторный дисперсионный анализ - student2.ru (математического ожидания) является величина Однофакторный дисперсионный анализ - student2.ru , а оценкой дисперсии Однофакторный дисперсионный анализ - student2.ru является величина Однофакторный дисперсионный анализ - student2.ru .

Если же гипотеза Однофакторный дисперсионный анализ - student2.ru отвергается, то оценкой Однофакторный дисперсионный анализ - student2.ru является Однофакторный дисперсионный анализ - student2.ru , оценкой дисперсии Однофакторный дисперсионный анализ - student2.ru для всех уровней является величина Однофакторный дисперсионный анализ - student2.ru , а эффект влияния i-го уровня можно вычислять по формуле Однофакторный дисперсионный анализ - student2.ru .

Методика дисперсионного анализа основана на предположении о том, что величины Однофакторный дисперсионный анализ - student2.ru , описывающие влияние случайных факторов имеют одинаковые групповые дисперсии Однофакторный дисперсионный анализ - student2.ru .

Если уверенности в таком распределении Однофакторный дисперсионный анализ - student2.ru нет, то прежде чем проводить дисперсионный анализ следует убедиться в том, что групповые дисперсии для всех уровней фактора совпадают.

На языке статистических гипотез это означает, что требуется убедиться в том, что гипотеза Однофакторный дисперсионный анализ - student2.ru об одинаковых групповых дисперсиях, Однофакторный дисперсионный анализ - student2.ru , не противоречит результатам наблюдений.

Для этого вычислим несмещенные оценки групповых дисперсий

Однофакторный дисперсионный анализ - student2.ru , Однофакторный дисперсионный анализ - student2.ru

и величины

Однофакторный дисперсионный анализ - student2.ru ,

Однофакторный дисперсионный анализ - student2.ru ,

Однофакторный дисперсионный анализ - student2.ru .

Величина b называется критерием Бартлетта.

Доказано, что если гипотеза Однофакторный дисперсионный анализ - student2.ru верна и все Однофакторный дисперсионный анализ - student2.ru , Однофакторный дисперсионный анализ - student2.ru , то случайная величина b имеет распределение, близкое к Однофакторный дисперсионный анализ - student2.ru -распределению с Однофакторный дисперсионный анализ - student2.ru степенями свободы.

Зададимся уровнем значимости Однофакторный дисперсионный анализ - student2.ru и найдем правостороннюю критическую точку Однофакторный дисперсионный анализ - student2.ru решение уравнения Однофакторный дисперсионный анализ - student2.ru .

Если Однофакторный дисперсионный анализ - student2.ru , то гипотеза Однофакторный дисперсионный анализ - student2.ru отклоняется. В противном случае полагаем, что гипотеза не противоречит результатам наблюдений.

Пример. Выясним, на уровне значимости Однофакторный дисперсионный анализ - student2.ru , зависит ли урожайность сельскохозяйственной культуры от технологии обработки почвы по результатам, приведенным в таблице. Выясним также меру влияния каждой технологии, если это влияние подтвердится.

Номер технологии Годы Однофакторный дисперсионный анализ - student2.ru
   
   
 
   

На приведенном ниже рисунке изображён фрагмент листа Excel c результатами вычислений.

Однофакторный дисперсионный анализ - student2.ru

Выборочное значение критерия Фишера, F = 15.21, намного превышает критическое значение, равное 3.29.

Нулевая гипотеза о равенстве математических ожиданий для разных уровней фактора отклоняется.

С доверительной вероятностью 0.95, принимаем альтернативу – математические ожидания различны.

Таким образом, изменчивость урожайности объясняется, в числе, возможно других факторов, изменением технологии обработки почвы.

Наши рекомендации