Двухфакторный дисперсионный анализ

Двухфакторный дисперсионный анализ (ДДА) служит для изучения влияния на результирующий признак двух различных факторов. ДДА подразумевает формирование и анализ двухфакторных дисперсионных комплексов (ДДК).

Анализ ДДК включает в себя 5 этапов.

1. Подбор факторов:

При организации ДДК свободный выбор факторов ограничен требованием их полной независимости друг от друга.

2. Разделение факторов на градации:

При организации ДДК каждый фактор разделяется на градации с таким расчетом, чтобы для каждой градации первого фактора было подобрано одинаковое число градаций второго фактора.

В качестве примера рассмотрим ситуацию, когда в качестве факторов выступают явно независимые друг от друга свойства, такие как пол и возраст (табл. 10.7).

Таблица 10.7

Факторы Градации
А – пол А1 - мужчины, А2 – женщины
В – возраст В1– 20 ¸ 30 лет; В2– 30 ¸ 40 лет; В3– 40 ¸ 50 лет;
Организация комплекса
Правильная Неправильная
A1 A2 A1 A2
B1 B2 B3 B1 B2 B3 B1 B2 B3 B1 B2
                       

3. Подбор объектов исследования:

Результаты дисперсионного анализа зависят от того, насколько правильно подобраны объекты исследования по качеству и по количеству.

По своему качеству объекты должны отражать те генеральные совокупности, для изучения которых проводится исследование.

По величине изучаемого признака объекты (испытуемые) должны быть взяты по принципу случайной выборки без учета выраженности данного признака. Измеряют и учитывают величину признака после отбора испытуемых в выборочный комплекс.

Организация дисперсионного комплекса с выполнением принципа случайности называется рандомизацией, а комплексы, организованные таким образом – рандомизированными. Нарушение принципа случайности при отборе объектов для дисперсионного анализа всегда приводит к неправильным результатам вследствие ошибки репрезентативности.

По числу объекты (испытуемые) могут быть распределены по градациям факторов различными способами - поровну, пропорционально или неравномерно. В соответствии с этим комплексы бывают равномерными, пропорциональными и неравномерными (табл. 10.8).

Таблица 10.8

Равномерные Пропорциональные Неравномерные
Гра-да-ции A1 A2 Гра-да-ции A1 A2 Гра-да-ции A1 A2
B1 B2 B1 B2 B1 B2 B1 B2 B1 B2 B1 B2
N n n
B1:B2 1:1 1:1 B1:B2 1:3 1:3 B1:B2 1:1 1:3

В равномерных и пропорциональных комплексах отношение объемов градаций по второму фактору одинаково для каждой градации первого фактора. Такое распределение объектов по градациям ДДК определяет их особые ортогональные свойства. Комплексы, обладающие этими свойствами (равномерные и пропорциональные) называются ортогональными.

Работа с неравномерными комплексами достаточно трудна, а интерпретация результатов менее надежна, нежели при работе с ортогональными комплексами.

В некоторых случаях полученный неравномерный комплекс можно преобразовать в пропорциональный или равномерный рандомизированным изъятием отдельных единичных значений признака.

4. Преобразование значений результативного признака:

Для облегчения счетной работы можно неудобные для счета (или ввода в компьютер) значения результативного признака (многозначные, дробные) преобразовывать в малозначные и целые числа.

Возможны следующие преобразования:

1. Все значения признака можно разделить на одно и то же число К. Это делают тогда, когда все значения делятся на число без остатка, а также в случае перехода к новым единицам измерения. Если деление происходит без изменения единицы измерения, то в некоторые результаты надо внести соответствующие поправки: значения SS умножают на К2, а Sx/n умножают на К.

2. Все значения можно умножить на одно и то же число К. Это делают, например, когда значения представлены дробными числами. Поправки в конечные результаты вносятся обратные тем, которые вносились в предыдущем случае.

3. От всех значений можно отнять одно и то же число А. Это лучше делать тогда, когда размах значений невелик и их деление или умножение на число К с последующим округлением может заметно снизить разнообразие измеряемого признака. Поправка в окончательный результат вносится только для среднего арифметического Двухфакторный дисперсионный анализ - student2.ru (необходимо прибавить число А). Остальные значения никаких поправок не требуют.

4. Можно сделать двойное преобразование, например, из каждого значения можно вычесть число А, а полученный результат разделить (умножить) на число К.

Способы преобразования и поправки при различных типах преобразований показаны в табл. 10.9.

Таблица 10.9

Способ преобра­зования Поправки
Двухфакторный дисперсионный анализ - student2.ru SS Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru
xi·K : K : K : K
xi– А + A
(xi– A)/K · K + A · K2 · K2
xi/K · K · K2 · K2

Анализ двухфакторных комплексов

Анализ двухфакторных комплексов проводится в несколько этапов:

1. Расчет дисперсий (сумм квадратов). Дисперсии рассчитываются в трех однофакторных комплексах:

а) для общего комплекса (SSb, SSW, SSC);

б) для первого фактора (А);

в) для второго фактора (В).

2. Анализ влияния. В ДДК анализируют 6 влияний:

а) влияние первого фактора (А);

б) влияние второго фактора (В);

в) влияние сочетаний градаций обоих факторов (АВ);

г) суммарное действие организованных (двух) факторов (А + В);

д) суммарное действие неорганизованных (остальных) факторов (случайные влияния) (W);

е) суммарное действие всех факторов, определяющих величину результирующего признака (C).

Все вышеперечисленные операции двухфакторного дисперсионного анализа можно проиллюстрировать следующим примером.

Условие задачи

На больных амнезией испытывалось действие двух лекарственных препаратов (А и В), которые, согласно предварительным испытаниям, способствуют улучшению памяти. Для первого препарата была взята контрольная группа (А0) и группа больных, прошедших месячный курс лечения (А1). Для второго препарата исследовались 3 градации больных (В0 – контроль, В1 – больные, прошедшие один курс лечения, и В2 – больные, прошедшие два месячных курса лечения препаратом).

Для каждой комбинации были выбраны по 5 больных, которые тестировались по методу Эббингауза (запоминание и воспроизведение бессмысленных слогов). В качестве критерия использовалась средняя вероятность правильного воспроизведения у каждого больного. Получены следующие данные (табл. 10.10):

Таблица 10.10

Пациент Комбинации
A0B0 A0B1 A0B2 A0B0 A0B1 A0B2
0,08 0,22 0,32 0,20 0,12 0,80 0,64 0,96 0,72 0,80 0,56 0,42 0,56 0,46 0,32 0,24 0,36 0,48 0,36 0,72 0,16 0,22 0,28 0,42 0,56 0,32 0,16 0,16

Задание

Методом двухфакторного дисперсионного анализа определить степень эффективности препаратов А и В, используемых для лечения больных амнезией при их раздельном и совместном применении.

Решение

1. Используем операцию xi·100:2. Получаем следующие данные (табл. 10.11):

Таблица 10.11

Пациент A0B0 A0B1 A0B2 A0B0 A0B1 A0B2

2. Рассчитываем дисперсии в общем комплексе (табл. 10.12):

Таблица 10.12

  A0 A1  
Bo B1 B2 B0 B1 B2  
xi JA = 2 JB = 3 n = 5
n Jn = 30
Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru
Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru
Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru
Двухфакторный дисперсионный анализ - student2.ru 9,4 39,2 23,2 21,6 16,4 6,4 Двухфакторный дисперсионный анализ - student2.ru

а) межгрупповая дисперсия:

Двухфакторный дисперсионный анализ - student2.ru = 14699 – 11252 = 3447;

б) внутригрупповая дисперсия:

Двухфакторный дисперсионный анализ - student2.ru = 15801 – 14699 = 1102;

в) общая дисперсия:

Двухфакторный дисперсионный анализ - student2.ru = 15801 – 11252 = 4549.

3. Рассчитываем дисперсии для факторов А и В и для сочетания их градаций (АВ) (табл. 10.13):

Таблица 10.13

  Для фактора A Для фактора B
  A0 A1 S B0 B1 B2 S
n
Двухфакторный дисперсионный анализ - student2.ru
Двухфакторный дисперсионный анализ - student2.ru

SSA= Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru = 11878 – 11252 = 626;

SSB= Двухфакторный дисперсионный анализ - student2.ru Двухфакторный дисперсионный анализ - student2.ru = 12320 – 11252 = 1068;

SSAB = SSb –- SSA – SSB = 3447 – 626 – 1068 = 1753.

4. Проводим анализ частных средних:

А0В0 - контроль, А1 - курс лечения препаратом А, В1 - курс лечения препаратом В, В2 - двойной курс лечения препаратом В.

А0: В0 = 9,4; B1 = 39,2; B2 = 23,2.

A1: B0 = 21,6; B1 = 16,4; B2 = 6,4.

Анализ частных средних показывает, что наиболее высокий уровень воспроизведения характерен для сочетания А0В1 (т.е. после месячного курса лечения препаратом В). Двойной курс лечения препаратом В нецелесообразен, т. к. воспроизведение снижается. Лечение препаратом А дает менее выраженный эффект, а комбинированное применение препаратов А и В вообще нецелесообразно

5. Анализ влияния(табл. 10.14).

Таблица 10.14

  SS Двухфакторный дисперсионный анализ - student2.ru n SS/n F n1 gAgB –1 n2 Jn - gAgB Fst b1; b2
A 0,14 13,61 4,3; 7,8
B 0,23 11,61 3,4; 5,6
AB (n=nAnB) 0,39 19,04 3,4; 5,6
A+B (n=gAgB-1) 0,76 14,98 2,6; 3,9
W 0,24        
C 1,00        

Сила влияния: Двухфакторный дисперсионный анализ - student2.ru где SSC - общая дисперсия.

Достоверность влияния:

Двухфакторный дисперсионный анализ - student2.ru : Двухфакторный дисперсионный анализ - student2.ru

где SSW - случайная (внутригрупповая) дисперсия.

Анализ силы влияния

- действие первого фактора (при усредненном действии второго) составляет 0,14 (14%) от действия всей суммы факторов, определяющих величину результативного признака;

- действие второго фактора (при усредненном действии первого) оказалось более сильным: 0,23 (23%);

- значительно сильнее оказалось действие сочетаний градаций обоих факторов: 0,39 (39%);

- действие первого фактора в значительной степени зависит от градации второго: максимальный эффект наблюдается при отсутствии второго, минимальный - после двух курсов лечения вторым препаратом;

- в отсутствие первого фактора максимальный эффект наблюдается после одного курса лечения вторым препаратом, после повторного курса эффект снижается.

Анализ достоверности влияния

Влияние каждого из факторов в отдельности, а также их сочетания достоверно при 1-м (b1 = 0,95) и 2-м (b2 = 0,99) уровнях значимости.

Задачи по теме

Задача 10. 1

Условие задачи

С целью определения степени эффективности сеансов НЛП, проводимых у больных неврастенией, выбрано 4 группы больных по 10 человек в каждой: первая группа - контрольная (К), в которой психотерапевтических воздействий не проводилось; вторая группа (1) – больные, прошедшие 1 сеанс НЛП; третья (2) – 2 сеанса и четвертая (3) – 3 сеанса НЛП. В качестве критерия эффективности психотерапевтического воздействия использовался уровень ситуативной тревожности (УСТ) по тесту Спилбергера. Получены следующие данные:

Группы Уровень ситуативной тревожности
К

Задание

Определить эффективность сеансов НЛП, используя результаты тестирования по Спилбергеру на уровень ситуативной тревожности.

Задача 10. 2

Условие задачи

Группа учеников одной из школ г. Екатеринбурга была обследована по тесту Айзенка на уровень экстра-интроверсии и нейротизма. Обследование было проведено четырехкратно с перерывами в 1-2 года: в 7-м, 8-м, 9-м и 10-11-м классах. Были получены следующие результаты:

Показатель Экстра-интроверсия Нейротизм  
№№ п.п. Испыту- емый 7 кл. 8 кл. 9 кл. 10-11 кл. 7 кл. 8 кл. 9 кл. 10-11 кл.  
Д.О. С.Н. Д.Л. Г.К. Н.А. В.Р. К.К. М.С. Р.Я. С.А.
                         

Задание

Используя метод однофакторного дисперсионного анализа, определить, достоверно ли изменяются показатели экстра-интроверсии и нейротизма у подростков с 7 по 11 класс.

З а д а ч а 10. 3

Условие задачи

Проводилось исследование возрастной динамики личностной тревожности у подростков. Для этого были взяты 4 независимых группы испытуемых в возрасте, соответственно, 13, 14, 15 и 16 лет по 10 человек в каждой. Обследование проводилось по тесту Спилбергера – Ханина.

Получены следующие результаты:

Испытуемые
Возраст
Уровень личностной тревожности в баллах
13 лет
14 “
15 “
16 “

Задание

Определить, достоверно ли изменяется уровень личностной тревожности у подростков в возрасте с 13 до 16 лет.

З а д а ч а 10. 4

Условие задачи

В психологическом эксперименте исследовалось влияние мотивации на уровень запоминания слов. Трем группам испытуемых (10 человек в каждой) были предложены 20 многосложных, редко используемых слов. Первой группе было обещано, что правильное воспроизведение десяти и более слов будет вознаграждаться призами. Во второй группе испытуемые предупреждались, что при воспроизведении менее 7 слов они будут должны сделать несколько физических упражнений. В третьей группе никаких дополнительных инструкций не давалось.

Были получены следующие результаты:

  Группа Испытуемые
Количество правильно воспроизведенных Слов

Задание:

Определить, влияет ли мотивация на успешность запоминания.

З а д а ч а 10. 5

Условие задачи

Психолог проводил курс психокоррекционных занятий с целью улучшения социальной адаптации детей. Занятия проводились с шестиклассниками средней школы в возрасте 11-12 лет. До и после курса занятий проводилось тестирование по рисуночному тесту С. Розенцвейга. В качестве показателя использовался коэффициент групповой адаптации (КГА), значения которого до и после курса психокоррекции приводятся в таблице.

Школьники КГА в % Школьники КГА в %
до коррекции после коррекции до коррекции после коррекции
35,3 52,9 47,1 38,2 44,1 29,4 32,4 55,7 35,3 44,1 64,7 44,1 47,1 52,9 52,9 29,4 47,1 55,7 64,7 58,8 44,1 44,1 55,7 47,1 58,8 47,1 32,4 61,8 55,7 70,6 23,5 47,1 29,4 61,8 44,1 35,3 58,8 52,9 64,7 55,7 61,8 61,8 32,4 47,1 35,3 58,8 52,9 64,7
               

Задание

Опираясь на данные тестирования, определить эффективность работы психолога.

З а д а ч а 10. 6

Условие задачи

Ортега и Пипал (1984) измеряли уровень диастолического давления у 20 испытуемых в трех различных условиях: в состоянии покоя, после релаксации, после 15 минут двигательной активности.

Полученные данные представлены в таблице.

Испы-туемые Актив-ность Покой Релакса-ция Испы-туемые Актив-ность Покой Релакса-ция

Вопрос

Влияет ли уровень активности на артериальное давление?

РАЗДЕЛ 11.
ЭЛЕМЕНТЫ МНОГОМЕРНОЙ СТАТИСТИКИ

Основные понятия

Методы многомерной статистики используются в тех случаях, когда необходимо упорядочить (привести в определенную систему) большое количество переменных (измеряемых свойств, признаков, характеристик, психологических свойств и т. п.). Чаще всего к многомерной статистике прибегают специалисты в области дифференциальной психологии, которая решает проблему индивидуальных психологических различий, проблему типологизации личности и т. д.

Наиболее часто в психологии используются кластерный и факторный анализ, реже – дискриминантный анализ. Каждый из них давно уже перерос из отдельных методов в самостоятельные области математической статистики. По сути, эти направления лишь условно можно назвать «статистикой» (на том основании, что они основаны на использовании стандартных статистических методов). На самом же деле это более высокий уровень – уровень математического моделирования различных психологических свойств, процессов и состояний.

В данном разделе будут рассмотрены кластерный и факторный анализ.

Кластерный анализ

По степени использования кластерного анализа психологи, очевидно, занимают второе место (после биологов). В биологии кластерный анализ используется, в первую очередь, для создания классификационных (таксономических) схем растительного и животного мира. В психологии же кластерный анализ используется при исследовании структуры психологических свойств индивида, степени общности различных психологических характеристик, черт, признаков, характера их взаимной упорядоченности, взаимоотношений с множеством других признаков и т. д. Вполне понятно, что каждый психологический признак, свойство или черта не являются изолированными – как правило, они имеют большую или меньшую степень связи друг с другом. Для выявления этих взаимосвязей и предназначен кластерный анализ. Кластерный анализ имеет смысл проводить в тех случаях, когда регистрируется большое число переменных (по крайней мере, больше десятка разных признаков).

В математическом смысле задача кластерного анализа заключается в том, чтобы на основании данных, содержащихся в множестве Х, разбить множество объектов I на m кластеров (подмножеств) p1, p2, ..., pm так, чтобы каждый объект Ii принадлежал одному и только одному подмножеству разбиения и чтобы объекты, принадлежащие одному и тому же кластеру, были сходными, в то время как объекты, принадлежащие разным кластерам, были разнородными (несходными) по выбранному критерию.

Решением задачи кластерного анализа является разбиение, удовлетворяющее некоторому критерию оптимальности (целевой функции).

Пример:

8 объектов, обладают одной характеристикой (n = 8, p = 1); результаты измерения представляют собой множество X = {3, 4, 7, 4, 3, 3, 4, 4}; целевая функция – внутригрупповая сумма квадратов отклонений, которая предполагается быть минимальной.

Тогда:

Двухфакторный дисперсионный анализ - student2.ru (11.1)

где xi представляет собой измерение i-го объекта.

В нашем случае: W = 140 – 128 = 12.

Если множество X разбить на 3 группы: G1 = {3, 3, 3}, G2 = {4, 4, 4, 4} , G3 = {7}, то все внутригрупповые суммы квадратов отклонений будут равны нулю: W1 + W2 + W3 = 0 + 0 + 0 = 0, где Wi обозначает сумму квадратов, соответствующую группе Gi. Оптимальное значение для этого примера равно нулю при условии, что ведется разбиение на 3 группы. В общем случае необходимо рассматривать значение целевой функции в сочетании с желаемым числом групп разбиения.

11.2.1. Функции расстояния

Для решения задачи кластерного анализа необходимо количественно определить понятия сходства и разнородности. Для этого вводится понятие расстояния (отдаленности) между соответствующими точками xi и xj. Если это расстояние достаточно мало, объекты i и j попадают в один кластер, если оно велико – в разные.

Используются следующие наиболее употребимые меры расстояния:

Евклидово расстояние: d2(Xi, Xj) = Двухфакторный дисперсионный анализ - student2.ru (11.2)

l1 - норма: d1(Xi, Xj) = Двухфакторный дисперсионный анализ - student2.ru (11.3)

lр - норма: dp(Xi, Xj) = Двухфакторный дисперсионный анализ - student2.ru (11.4)

Мера Джеффриса-Матуситы: M= Двухфакторный дисперсионный анализ - student2.ru (11.5)

Коэффициент дивергенции Кларка: СD = Двухфакторный дисперсионный анализ - student2.ru (11.6)

Существуют и другие, более сложные меры расстояния, выбор которых определяется как субъективным предпочтением исследователя, так и естественным стремлением к упрощению процедуры эксперимента.

11.2.2. Меры сходства

Как правило, в качестве меры сходства используется корреляция между рядами признаков (переменных). Объекты (признаки) считаются сходными, если коэффициент корреляции близок к +1 (положительное сходство) или к –1 (отрицательное сходство), и не сходны, если rij близок к нулю. В качестве граничного значения для объединения переменных в один кластер используется критическое значение коэффициента корреляции, которое находится по соответствующим таблицам.

При построении векторных моделей необходимо подчеркнуть следующее: если Xi и Xj рассматривать как координаты двух точек в многомерном пространстве, то rij = cos q, где q - угол между двумя векторами.

11.2.3. Выбор числа кластеров

Кластеризация полным перебором

Является наиболее прямым способом решения проблемы и заключается в полном переборе всех возможных разбиений на кластеры и отыскании такого разбиения, которое ведет к оптимальному (минимальному) значению целевой функции. Такая процедура выполнима лишь в тех случаях, когда n (число объектов) и m (число кластеров) невелико, поскольку число разбиений (W) прогрессивно возрастает с увеличением n и m (напомним, что n ³ m). Число возможных разбиений при ограниченном числе объектов и кластеров приведено в табл. 11.1.

Таблица 11.1

  n = 4 n = 5 n = 6 n = 7 n = 8
m =1
m =2
m =3
m =4

Наши рекомендации