Формулировка гипотез в дисперсионном анализе
Нулевая гипотеза:
«Средние величины результативного признака во всех условиях действия фактора (или градациях фактора) одинаковы».
Альтернативная гипотеза:
«Средние величины результативного признака в разных условиях действия фактора различны».
Виды дисперсионного анализа.
Дисперсионный анализ схематически можно подразделить на несколько категорий. Это деление осуществляется, смотря по тому, сколько, во-первых, факторов принимает участие в рассмотрении, во-вторых, - сколько переменных подвержены действию факторов, и, в-третьих, - по тому, как соотносятся друг с другом выборки значений.
При наличии одного фактора, влияние которого исследуется, дисперсионный анализ именуется однофакторным, и распадается на две разновидности:
- Анализ несвязанных (то есть – различных) выборок. Например, одна группа респондентов решает задачу в условиях тишины, вторая – в шумной комнате. (В этом случае, к слову, нулевая гипотеза звучала бы так: «среднее время решения задач такого-то типа будет одинаково в тишине и в шумном помещении», то есть не зависит от фактора шума.)
- Анализ связанных выборок. То есть: двух замеров, проведенных на одной и той же группе респондентов в разных условиях. Тот же пример: в первый раз задача решалась в тишине, второй – сходная задача – в условиях шумовых помех. (На практике к подобным опытам следует подходить с осторожностью, поскольку в действие может вступить неучтенный фактор «научаемость», влияние которого исследователь рискует приписать изменению условий, а именно, - шуму.)
В случае, если исследуется одновременное воздействие двух или более факторов, мы имеем дело с многофакторным дисперсионным анализом, который также можно подразделить по типу выборки.
Если же воздействию факторов подвержено несколько переменных, - речь идет о многомерном анализе.
Ограничения дисперсионного анализа и подготовка данных.
Дисперсионный анализ следует применять тогда, когда известно (установлено), что распределение результативного признака является нормальным.
Однофакторный дисперсионный анализ для несвязанных выборок.
Назначение метода.
Метод однофакторного дисперсионного анализа применяется в тех случаях, когда исследуются изменения результативного признака (зависимой переменной) под влиянием изменяющихся условий или градаций какого-либо фактора.
Влиянию каждой из градаций фактора подвержены разные выборки.
Должно быть не менее трех градаций фактора и не менее двух наблюдений в каждой градации.
Описание метода.
Расчеты начинаются с расстановки всех данных по столбцам, относящимся к каждому из факторов соответственно.
Следующим действием будет нахождение сумм значений по столбцам (то есть – градациям) и возведение их в квадрат.
Фактически метод состоит в сопоставлении каждой из полученных и возведенных в квадрат сумм с суммой квадратов всех значений, полученных во всем эксперименте.
Графическое представление метода.
На рисунке схематически представлены три градации какого-либо фактора. Дисперсионный анализ позволяет определить, что преобладает: влияние фактора или случайная вариативность внутри групп (тенденция, выраженная кривой или размах отрезков, ограниченных кружками)?
Принятые в литературе сокращения:
СК или SS – сумма квадратов
SSфакт. – вариативность, обусловленная действием исследуемого фактора
SSобщ. – общая вариативность
SSсл. – случайная вариативность
MS – «средний квадрат» (математическое ожидание суммы квадратов, усредненная величина соответствующих SS)
df – число степеней свободы.
Основные вычисления.
Подсчитать SSфакт. | SSфакт. = 1/n ΣT2c – 1/n (Σxi)2 |
Подсчитать SSобщ. | SSобщ. = Σx2i – 1/N (Σxi)2 |
Подсчитать случайную остаточную величину SSсл. | SSсл. = SSобщ. – SSфакт. |
Определить число степеней свободы | dfфакт. = с – 1 dfобщ. = N – 1 dfсл. = dfобщ. – dfфакт. |
Разделить каждую SS на соответствующее число степеней свободы | MSфакт. = SSфакт. / dfфакт. MS сл. = SS сл. / df сл. |
Подсчитать значение Fэмп. | Fэмп. = MSфакт. / MS сл. |
Определить по таблицам критические значения F и сопоставить с ним полученное эмпирическое значение | При Fэмп. >= Fкр. H0 отклоняется. |
. . .
Однофакторный дисперсионный анализ для связанных выборок.
Назначение метода.
Метод применяется в тех случаях, когда исследуется влияние разных условий действия фактора (градаций фактора) на одну и ту же выборку. (Одни и те же респонденты в разных условиях.)
Условий (градаций) должно быть не менее трех.
Индивидуальных значений по каждому условию должно быть не менее двух.
Описание метода.
В этом случае различия могут быть вызваны не только влиянием фактора, но и индивидуальными различиями между испытуемыми. При анализе несвязанных выборок это обстоятельство не оказывало воздействия за счет того, что выборки были различны, и сводилось к случайным причинам различий, - здесь же индивидуальные различия между элементами выборки (респондентами) необходимо особо учитывать. (Индивидуальные различия могут оказаться более значимыми, чем изменение условий действия фактора.) Исходя из сказанного, в расчеты вводятся дополнительные компоненты – суммы квадратов сумм индивидуальных значений.