Понятие дисперсионного анализа
Дисперсионный анализ - это анализ изменчивости признака под влиянием каких-либо контролируемых переменных факторов. В зарубежной литературе дисперсионный анализ часто обозначается как ANOVA, что переводится как анализ вариативности (Analysis of Variance). Автором метода является Р. А. Фишер (Fisher R.A., 1918, 1938).
Задача дисперсионного анализа состоит в том, чтобы из общей вариативности признака вычленить вариативность троякого рода:
а) вариативность, обусловленную действием каждой из исследуемых независимых переменных;
б) вариативность, обусловленную взаимодействием исследуемых независимых переменных;
в) случайную вариативность, обусловленную всеми другими неизвестными переменными.
Вариативность, обусловленная действием исследуемых переменных и их взаимодействием, соотносится со случайной вариативностью. Показателем этого соотношения является критерий F Фишера1.
В формулу расчета критерия F входят оценки дисперсий, то есть параметров распределения признака, поэтому критерий F является параметрическим критерием.
___________________
1 Критерии F Фишера и метод углового преобразования Фишера, дающий нам критерий φ*, - это совершенно различные методы, имеющие разное предназначение и разные способы вычисления.
Чем в большей степени вариативность признака обусловлена исследуемыми переменными (факторами) или их взаимодействием, тем выше эмпирические значения критерия F.
В дисперсионном анализе исследователь исходит из предположения, что одни переменные могут рассматриваться как причины, а другие - как следствия. Переменные первого рода считаются факторами, а переменные второго рода - результативными признаками. В этом отличие дисперсионного анализа от прямолинейного корреляционного анализа, в котором мы исходим из предположения, что изменения одного признака просто сопровождаются определенными изменениями другого.
В дисперсионном анализе возможны два принципиальных пути разделения всех исследуемых переменных на независимые переменные (факторы) и зависимые переменные (результативные признаки).
Первый путь состоит в том, что мы совершаем какие-либо воздействия на испытуемых или учитываем какие-либо не зависящие от нас воздействия на них, и именно эти воздействия считаем независимыми переменными, или факторами, а исследуемые признаки рассматриваем как зависимые переменные, или результативные признаки. Например, возраст испытуемых или способ предъявления им информации считаем факторами, а обучаемость или эффективность выполнения задания - результативными признаками.
Второй путь предполагает, что мы, не совершая никаких воздействий, считаем, что при разных уровнях развития одних психологических признаков другие проявляются тоже по-разному. По тем или иным причинам мы решаем, что одни признаки могут рассматриваться скорее как факторы, а другие - как результат действия этих факторов. Например, уровень интеллекта или мотивации достижения начинаем считать факторами, а профессиональную компетентность или социометрический статус - результативными признаками.
Второй путь весьма уязвим для критики. Допустим, мы предположили, что настойчивость - значимый фактор учебной успешности студентов. Мы принимаем настойчивость за воздействующую переменную (фактор), а учебную успешность - за результативный признак. Против этого могут быть выдвинуты сразу же два возражения. Во-первых, успех может стимулировать настойчивость; во-вторых, как, собственно, измерялась настойчивость? Если она измерялась с помощью метода экспертных оценок, а экспертами были соученики или преподаватели, которым известна учебная успешность испытуемых, то не исключено, что это оценка настойчивости будет зависеть от известных экспертам показателей успешности, а не наоборот.
Допустим, что в другом исследовании мы исходим из предположения, что фактор социальной смелости (фактор Н) из 16-факторного личностного опросника Р.Б. Кеттелла - это та независимая переменная, которая определяет объем заключенных торговым представителем договоров на поставку косметических товаров. Но если объем договоров определялся по какому-то периоду работы, скажем трехмесячному, а личностное обследование проводилось в конце этого периода или даже после его истечения, то мы не можем со всей уверенностью отделить здесь причину от следствия. Есть очень сильное направление в психологии и психотерапии, которое утверждает, что личностные изменения начинаются с действий и поступков: "Начни действовать, и постепенно станешь таким, как твои поступки". Таким образом, психолог, представляющий это направление, возможно, стал бы утверждать, что причиной должен считаться достигнутый объем договорных поставок, а результатом - повышение социальной смелости.
Только наше исследовательское чутье может подсказать нам, что должно рассматриваться как причина, а что - как результат. Однако не всегда эти ощущения у разных исследователей совпадают, поэтому нужно быть готовым к тому, что наши выводы могут быть оспорены другими специалистами, которые рассматривают данный предмет с иной точки зрения и видят в нем иные перспективы. Впрочем, спорность выводов - постоянный спутник психологического исследования.
Постараемся быть оптимистичными и представим себе, что существует все же какое-то совпадение взглядов на психологические причины и следствия. На Рис. 7.1 представлены два варианта рассеивания показателей учебной успешности в зависимости от уровня развития кратковременной памяти. Из Рис. 7.1(а) мы видим, что при низком уровне развития кратковременной памяти оценки по английскому языку, похоже, несколько ниже, чем при среднем, а при высоком уровне выше, чем при среднем. Похоже, что кратковременная память может рассматриваться как фактор успешности овладения английским языком. С другой стороны, Рис. 7.1(6) свидетельствует о том, что успешность в чистописании вряд ли так же определенно зависит от уровня развития кратковременной памяти.
О том, верны ли наши предположения, мы сможем судить только после вычисления эмпирических значений критерия F.
Рис. 7.1. Рассеивание индивидуальных средних оценок по английскому языку (а) и чистописанию (б) у учеников с низким, средним и высоким уровнями развития кратковременной памяти
Низкий, средний и высокий уровни развития кратковременной памяти можно рассматривать как градации фактора кратковременной памяти.
Нулевая гипотеза в дисперсионном анализе будет гласить, что средние величины исследуемого результативного признака во всех градациях одинаковы.
Альтернативная гипотеза будет утверждать, что средние величины результативного признака в разных градациях исследуемого фактора различны.
В зарубежных руководствах чаще говорят о переменных, действующих в разных условиях, а не о факторах и их градациях (Greene J., D'Olivera M, 1982, р. 91-93).
Дело в том, что градация подразумевает ступень, стадию, уровень развития. Говоря о градациях фактора, мы явно или неявно подразумеваем, что сила его возрастает при переходе от градации к градации. Между тем, схема дисперсионного анализа применима и в тех случаях, когда градации фактора представляют собой номинативную шкалу, то есть отличаются лишь качественно. Например, градациями фактора могут быть: параллельные формы экспериментальных заданий; цвет окраски стимулов; жанр музыкальных произведений, сопровождающих процесс работы; традиционные или специально подобранные православные тексты в сеансах аутогенной тренировки; разные формы заболевания; разные экспериментаторы; разные психотерапевты и т. д.
Если градации фактора различаются лишь качественно, их лучше называть условиями действия фактора или переменной. Например, действие аутогенной тренировки при условии использования текстов православных молитв или эффективность психокоррёкционных воздействий при разных формах хронических заболеваний у детей3.
Экспериментальные данные, представленные по градациям фактора, называются дисперсионным комплексом. Данные, относящиеся к отдельным градациям - ячейками комплекса.
Дисперсионный анализ позволяет нам констатировать изменение признака, но при этом не указывает направление этих изменений. Нам необходимо специально графически представлять полученные данные по градациям фактора, чтобы получить наглядное представление о направлении изменений.
Подобного рода задачи, как мы помним, позволяют решать непараметрические методы сравнения выборок или условий измерения, а именно критерий Н. Крускала-Уоллиса и критерий χ2r Фридмана (см. параграфы 2.4 и 3.4). Однако это касается только тех задач, в которых исследуется действие одного фактора, или одной переменной. Задачи однофакторного дисперсионного анализа, действительно, могут эффективным образом решаться с помощью непараметрических методов. Метод дисперсионного анализа становится незаменимым только когда мы исследуем одновременное действие двух (или более) факторов, поскольку он позволяет выявить взаимодействие факторов в их влиянии на один и тот же результативный признак. Именно эти возможности двухфакторного дисперсионного анализа послужили причиной, по которой изложение этого метода включено в настоящее руководство.
Несмотря на то, что нас интересует прежде всего двухфакторный дисперсионный анализ, который нельзя заменить другими методами, начнем рассмотрение мы с однофакторного дисперсионного анализа: во-первых, для того, чтобы выдержать определенную последовательность и логику в изложении; во-вторых, для того, чтобы на реальном примере продемонстрировать возможность замены этого метода непараметрическими методами.
См. исследование Е. Б. Кулевой, 1991. См. исследование Н.В.Корольковой, 1994.
Итак, начнем рассмотрение дисперсионного анализа с простейшего случая, когда исследуется действие только одной переменной (одного фактора). Исследователя интересует, как изменяется определенный признак в разных условиях действия этой переменной. Например, как изменяется время решения задачи при разных условиях мотивации испытуемых (низкой, средней, высокой) или при разных способах предъявления задачи (устно, письменно, в виде текста с графиками и иллюстрациями), в разных условиях работы с задачей (в одиночестве, в одной комнате с экспериментатором, в одной комнате с экспериментатором и другими испытуемыми) и т.п. В первом случае переменной, влияние которой исследуется, является мотивация, во втором - степень наглядности, в третьем - фактор публичности.
Преимущество однофакторного дисперсионного анализа по сравнению с непараметрическими методами Н Крускала-Уоллиса и χ2r Фридмана - неограниченность в объемах выборок. Ограничения дисперсионного анализа достаточно условны. Например, требование нормальности распределения признака можно обойти по крайней мере двумя путями: при слишком скошенном, островершинном или плосковершинном распределении можно, во-первых, нормализовать данные, а во-вторых... просто вообще по этому поводу "не волноваться", как советуют, например, А.К. Kurtz и S.T. Мауо (1979, р.417).