Сравнение нескольких средних

Понятие о дисперсионном анализе.

Пусть генеральные совокупности Х1 , Х2 , …, Хр распределены нормально и имеют одинаковую, хотя и неизвестную, дисперсию; математические ожидания также неизвестны, но могут быть различными. Требуется при заданном уровне значимости по выборочным средним проверить нулевую гипотезу
Н0 : М(Х1) = М(Х2) = … = М(Хр) о равенстве всех математических ожиданий. Другими словами, требуется установить, значимо или незначимо различаются выборочные средние. Казалось бы, для сравнения нескольких средних (р > 2) можно сравнить их попарно. Однако с возрастанием числа средних возрастает и наибольшее различие между ними: среднее новой выборки может оказаться больше наибольшего или меньше наименьшего из средних, полученных до нового опыта. По этой причине для сравнения нескольких средних пользуются другим методом, который основан на сравнении дисперсий и поэтому назван дисперсионным анализом (в основном развит английским статистиком Р. Фишером).

На практике дисперсионный анализ применяют, чтобы установить, оказывает ли существенное влияние некоторый качественный фактор F, который имеет р уровней F1 , F2 , … , Fp на изучаемую величину X. Например, если требуется выяснить, в какой школе наиболее эффективно проводится изучение иностранного языка, то фактор F - школа, а его уровни – номер школы.

Основная идея дисперсионного анализа состоит в сравнении «факторной дисперсии», порождаемой воздействием фактора, и «остаточной дисперсии», обусловленной случайными причинами. Если различие между этими дисперсиями значимо, то фактор оказывает существенное влияние на X; в этом случае средние наблюдаемых значений на каждом уровне (групповые средние) различаются также значимо.

Если уже установлено, что фактор существенно влияет на X, а требуется выяснить, какой из уровней оказывает наибольшее воздействие, то дополнительно производят попарное сравнение средних.

Иногда дисперсионный анализ применяется, чтобы установить однородность нескольких совокупностей (дисперсии этих совокупностей одинаковы по предположению; если дисперсионный анализ покажет, что и математические ожидания одинаковы, то в этом смысле совокупности однородны). Однородные же совокупности можно объединить в одну и тем самым получить о ней более полную информацию, следовательно, и более надежные выводы.

В более сложных случаях исследуют воздействие нескольких факторов на нескольких постоянных или случайных уровнях и выясняют влияние отдельных уровней и их комбинаций (многофакторный анализ).

Мы ограничимся простейшим случаем однофакторного анализа, когда на X воздействует только один фактор, который имеет р постоянных уровней.

Общая факторная и остаточная суммы

Квадратов отклонений

Пусть на количественный нормально распределенный признак X воздействует фактор F, который имеет р постоянных уровней. Будем предполагать, что число наблюдений (испытаний) на каждом уровне одинаково и равно q.

Номер испытания Уровни фактора Fj
F1 F2 Fp
… q х11 х21 … хq1 х12 х22 … хq2 … … … … х1p х2p … хqp
Групповая средняя        

Пусть наблюдалось n = pq значений xij признака X, где i - номер испытания (i = 1,2, ..., q), j - номер уровня фактора (j = 1, 2, ..., р). Результаты наблюдений приведены в табл. 30.

Введем, по определению,

Сравнение нескольких средних - student2.ru

(общая сумма квадратов отклонений наблюдаемых значений от общей средней Сравнение нескольких средних - student2.ru ),

Сравнение нескольких средних - student2.ru

(факторная сумма квадратов отклонений групповых средних от общей средней, которая характеризует рассеяние «между группами»),

Сравнение нескольких средних - student2.ru

(остаточная сумма квадратов отклонений наблюдаемых значений группы от своей групповой средней, которая характеризует рассеяние «внутри групп»).

Практически остаточную сумму находят по равенству

Sост = Sобщ – Sфакт

Элементарными преобразованиями можно получить формулы, более удобные для расчетов:

Сравнение нескольких средних - student2.ru

Сравнение нескольких средних - student2.ru

где Сравнение нескольких средних - student2.ru - сумма квадратов значений признака на уровне Fj , Сравнение нескольких средних - student2.ru - сумма значений признака на уровне Fj.

Наши рекомендации