АNОVА – это метод сравнения нескольких (более двух) выборок по признаку, измеренному в метрической шкале
Как и в случае сравнения двух выборок при помощи критерия t-Стьюдента, АNОVА
решает задачу сравнения средних значений, но не двух, а нескольких. Кроме этого, метод допускает сравнение выборок более, чем по одному основанию – когда деление на выборки производится по нескольким номинативным переменным, каждая из которых имеет две и более градаций.
Специфика АNОVА проявляется в двух отношениях:
а) этот метод использует терминологию планирования эксперимента;
б) для сравнения средних значений анализируются компоненты дисперсии изучаемого признака.
Типичная схема эксперимента сводится к изучению влияния независимой переменной (одной или нескольких) на зависимую переменную.
Независимая переменная –качественно определенный номинативный признак, имеющий две или более градации. Каждой градации независимой переменной соответствует выборка испытуемых, для которых определены значения зависимой переменной. Независи- мая переменная еще называется фактором, имеющим несколько градаций (уровней).
Зависимая переменная –это изменяющаяся под влиянием независимых переменных. В модели АNОVА зависимая переменная должна быть представлена в метрической шкале. В
простейшем случае независимая переменная имеет две градации, и тогда задача сводится к сравнению двух выборок по уровню выраженности (средним значениям) зависимой пере- менной.
В зависимости от соотношения выборок, соответствующих разным градациям (уровням) фактора, различают два типа независимых переменных (факторов):
1. Межгрупповой фактор – ему соответствуют независимые выборки объектов.
2. Внутригрупповой фактор – ему соответствуют зависимые выборки объектов.
Варианты АNОVА в зависимости от типа экспериментального плана:
1. Однофакторный АNОVА– используется при изучении влияния одного фактора на зависимую переменную. При этом проверяется одна гипотеза о влиянии фактора на зависи- мую переменную.
2. Многофакторный АNОVА– используется при изучении влияния двух и более не- зависимых переменных на зависимую переменную. Данный вариант позволяет проверять гипотезы не только о влиянии каждого фактора в отдельности, но и о взаимодействии факто- ров. Так, для двух факторного АNОVА проверяются три гипотезы: а) о влиянии одного фак- тора; б) о влиянии другого фактора; в) о взаимодействии факторов (о зависимости степени влияния одного фактора от градаций другого фактора).
Например: изучается влияние на зрительскую оценку различных фильмов (зависимая переменная) двух факторов: жанра фильма (мелодрама, комедия, боевик) и пола зрителя (не- зависимые переменные). Вполне вероятно, что в результате такого исследования будут обна- ружены не главные эффекты изучаемых факторов (влияние каждого из них в отдельности), а их взаимодействие. Взаимодействие факторов «жанр фильма» и «пол зрителя» будет озна- чать, что мужчины и женщины по-разному оценивают фильмы в зависимости от их жанра (фильмы разных жанров оцениваются по-разному, в зависимости от пола зрителя).
3. АNОVА с повторными измерениями– применяется, когда хотя бы один из фак- торов изменяется по внутригрупповому плану, т.е. различным градациям этого фактора со- ответствует одна и та же выборка объектов (испытуемых). В соответствии, в модели АNОVА с повторными измерениями выделяются внутригрупповые и межгрупповые факторы. Для двухфакторного АNОVА с повторными измерениями по одному из факторов проверяются три гипотезы: а) о влиянии внутригруппового фактора; б) о влиянии межгруппового фактора; в) о взаимодействии внутригруппового и межгруппового факторов.
4. Многомерный АNОVА (МАNОVА)– применяется, когда зависимая переменная является многомерной, иначе говоря, представляет собой несколько (множество) измерений изучаемого явления (свойства).
Во всех вариантах АNОVА наряду с изучением влияния факторов допускается изуче- ния влияния метрической независимой переменной. Метрическая независимая переменная в этом случае называется ковариатой и дисперсионный анализ включает в себя ковариацион- ный анализ.
Математическая идея АNОVА основана на соотнесении межгрупповой и внутриг- рупповой частей дисперсии (изменчивости) изучаемой зависимой переменной. Известно, что при объединении двух или более выборок с примерно одинаковой дисперсией, но с разными средними значениями, дисперсия увеличивается пропорционально различиям средних зна- чений этих выборок. Это связано с тем, что к внутригрупповой дисперсии добавляется дис- персия, обусловленная различиями между группами. В модели АNОVА внутригрупповая из- менчивость рассматривается как обусловленная случайными причинами, а межгрупповая – как обусловленная действием изучаемого фактора на зависимую переменную. Соответствен- но, в общей изменчивости (дисперсии) зависимой переменной выделяются две компоненты: внутригрупповая (случайная) и межгрупповая (факторная) изменчивость. Чем больше отно- шение межгрупповой изменчивости к внутригрупповой, тем выше факторный эффект – тем больше различаются средние значения, соответствующие разным градациям фактора.
Нулевая гипотеза Н0 в АNОVА содержит утверждение о равенстве межгрупповой и внутригрупповой составляющих изменчивости и подразумевает направленную альтернативу
– о том, что межгрупповая составляющая изменчивости превышает внутригрупповую из- менчивость. Нулевой гипотезе соответствует равенство средних значений зависимой пере- менной на всех уровнях фактора. Принятие альтернативной гипотезы означает, что, по край- ней мере, два средних значения различаются (без уточнения, какие именно градации фактора различаются).
Основные допущения АNОVА:
1. Распределение зависимой переменной для каждой градации фактора соответствует нормальному закону; нарушение предположения о нормальности распределения не оказы- вает существенного влияния на результаты АNОVА.
2. Дисперсии выборок, соответствующие разным градациям фактора, равны между собой; нарушение предположения о равенстве (гомогенности) дисперсий имеет существен- ное значение в том случае, если сравниваемые выборки отличаются по численности; если выборки заметно различаются по численности, то необходима дополнительная проверка го- могенности дисперсий; если же выборки заметно различаются по численности и дисперсии не гомогенны, то АNОVА к таким данным не применим, следует воспользоваться непара- метрической альтернативой.
3. Выборки, соответствующие градациям фактора, должны быть независимы (для межгруппового фактора); выполнение независимости выборок является обязательным в лю- бом случае.
Параметрическими аналогами АNОVА являются: множественный регрессионный анализ – модель применяется, если все переменные, в том числе и независимые, представле- ны в метрической шкале; дискриминантный анализ – зависимая переменная является клас- сифицирующей (номинативной), а независимые переменные – метрическими.
Непараметрические аналоги АNОVА –критерий Н-Краскала-Уоллеса (для независи- мых выборок) и χ2-Фридмана (для повторных измерений).