Многомерные и факторные эксперименты: общий обзор

В описанных выше экспериментах с контрольной группой каждый раз исполь­зуются лишь два типа условий—«есть воздействие» либо «нет воздействия». Эти два типа условий по сути можно рассматривать как два уровня независи­мой переменной, которым можно присвоить условные числовые значения— например, «I» и «О». Иными словами, с точки зрения уровня измерения незави­симая переменная является номинальной, качественной. В контрольной группе ее значение равно нулю, в экспериментальной—единице. Однако исследова­тель часто располагает значительно большей информацией о независимой пе­ременной и способен измерить и проконтролировать ее по крайней мере на трех-четырех уровнях значений. Соответственно экспериментальная гипотеза мо-

21 Используемая нами формула основана на некоторых важных предположениях: о том, что группы отбирались независимо и случайно; что дисперсии соответствующих гене­ральных совокупностей неравны; что параметры совокупностей распределены нормаль­но. Существуют и иные, несколько отличные формулы для расчета?, которые применя­ются в тех случаях, когда сравниваемые подвыборки-группы невелики и получаемые для них данные каким-то образом «связаны», скоррелированы (например, если мы срав­ниваем групповые средние братьев и сестер или средние оценки одних и тех же школь­ников в первом классе и на выпускных экзаменах). Соответствующие формулы и пояс­нения можно найти в любом статистическом руководстве, а также в книгах, включен­ных в список дополнительной литературы по теме.

жет быть сформулирована в терминах более или менее интенсивного воздей­ствия либо наличия-отсутствия «отклика» зависимой переменной при конкрет­ных уровнях независимой переменной.

В психологии хорошо известен закон «оптимума мотивации», так называ­емый закон Йеркса-Додсона.

В начале нашего века Р. Йеркс изучал, как влияет негативное подкрепле­ние в форме удара электрическим током на выработку элементарных на­выков у животных. В частности, в опытах с «танцующими мышами» (раз­новидность домашней мыши, имеющая генетический дефект, который заставляет ее двигаться по кругу или по восьмерке) он использовал три уровня силы тока—«сильный» (500 усл. ед.), «средний» (300 усл.ед.) и «слабый» (125 усл. ед.). Мышь должна была научиться выбирать один из двух туннелей. В конце туннеля ее в любом случае ожидало «вознаграж­дение» — мышь противоположного пола. При ошибочном выборе (белый туннель) мышь испытывала удар током, при правильном выборе (черный туннель) негативное подкрепление отсутствовало. Местоположение тун­нелей (слева-справа) менялось случайным образом от пробы к пробе. Выяснилось, что быстрее всего обучение происходит при «средней» вели­чине стимуляции. Обнаруженный в этом эксперименте нелинейный ха­рактер связи между величиной стимула к решению определенной задачи и успешностью решения был затем неоднократно подтвержден и во мно­гих других экспериментах, в том числе с испытуемыми-людьми и с пози­тивной стимуляцией. Чрезмерная мотивация и чрезмерная величина под­крепления, как и слабая мотивация, всякий раз оказывали меньшее воз­действие на успешность выполнения различных задач.

Эксперименты, в которых используется несколько (более двух) уровней незави­симой переменной, называются многоуровневыми. Схема вышеописанного эксперимента с рандомизацией и тремя уровнями независимой переменной (X1, Х2 Х3) такова:

R Х1 О1

R Х2 О2

R Хз Оз

Экспериментальная гипотеза в этом случае формулируется как гипотеза об от­ношениях значений О1, О2 и О3 (в рассмотренном примере О12 и О23). Независимая переменная в многомерном эксперименте может иметь и более трех уровней. Иначе говоря, она может быть «нормальной» количественной переменной, измеренной на интервальном или абсолютном уровне. Соответ­ственно гипотеза многомерного эксперимента может формулироваться в более точных терминах — как гипотеза об «относительно-абсолютных» или даже «аб­солютно-абсолютных» отношениях переменных. Например, в эксперименте может изучаться влияние привлекательности лектора на частоту посещения за­нятий студентами, воздействие количества доступных источников информации о продукте на формирование потребительских предпочтений либо характер вза­имосвязи между размером денежного вознаграждения испытуемых и успешно­стью решения ими однотипных задач. Таким образом, многомерные экспери­менты позволяют проверять более тонкие и точные содержательные гипоте­зы о механизмах индивидуального и группового поведения.

Статистические гипотезы, проверяемые в многомерных экспериментах,—это гипотезы о различиях между значениями зависимой переменной для разных уровней независимой переменной. Нулевая гипотеза формулируется как гипо-

теза о том, что разброс индивидуальных значений внутри одного уровня неза­висимой переменной (внутри соответствующей экспериментальной группы) идентичен разбросу индивидуальных значений между различными уровнями (группами), т. е. отношение дисперсии межгрупповых оценок к дисперсии внут-ригрупповых оценок равно 1. Последнее отношение обозначается как F-крите-рий. Для того чтобы определить, не превышает ли полученная в конкретном эксперименте величина F пороговое значение статистического F-распределе-ния для заданного уровня значимости, используют статистическую технику однофакторного дисперсионного анализа. Термин «однофакторный» в данном случае означает, что в эксперименте использовалась лишь одна независимая переменная (фактор воздействия). Рассмотрение техники дисперсионного ана­лиза и статистического оценивания получаемой в результате величины F вы­ходит за пределы данного обзора (детальные описания и рекомендации при необходимости можно найти в книгах из списка дополнительной литерату­ры к главе).

В тех областях социологии и социальной психологии, которые имеют сравни­тельно развитую традицию экспериментальных исследований (межличностное и межгрупповое восприятие, исследования динамики установок, социальные процессы в малых группах, оценивание эффективности образовательных про-' грамм и т. д.) часто используют более сложные схемы экспериментирования, объединяемые термином «факторные эксперименты».

Факторный экспериментальный план включает в себя две и более, независи­мые переменные (именуемые также «факторами»), каждая из которых име­ет несколько уровней воздействия. Так как при увеличении числа независимых переменных очень быстро возрастает число групп, в каждой из которых приме­няется одна из возможных комбинаций этих переменных и их уровней12 (в пол­ном факторном плане число групп равно произведению числа уровней, задава­емых для каждой независимой переменной), в целях экономии ресурсов и ра­ционального распределения исследовательских усилий были разработаны многочисленные планы, где каждый из «уровней» переменных реализуется один раз, а обобщение и статистический анализ взаимодействия различных факто­ров и их изолированного и совместного влияния на зависимую переменную проводится на групповом уровне23.

Всякий факторный эксперимент—это, в сущности, несколько экспериментов, объединенных в одном плане. Обобщенные данные факторного эксперимента позволяют ответить на два типа вопросов: 1) имеется ли эффект воздействия для каждой отдельно взятой независимой переменной; 2) зависит ли величина этого эффекта воздействия от величины значений других независимых пере­менных? Изолированный эффект воздействия одной независимой переменной

22 Такие комбинации называют еще «обработками». Источник последнего термина— сельскохозяйственные опыты, для которых Р. Фишер разработал первые факторные планы, сочетавшие различные способы ухода за растениями, условия освещенности, типы почвы и режимы полива.

23 Многочисленные примеры таких планов и описания соответствующих методов ана­лиза результатов см. в: Дружинин Н. К. Выборочное наблюдение и эксперимент. М.:

Статистика, 1977; Готтсданкер Р. Основы психологического эксперимента. М.: Изд-во МГУ, 1982; Вознесенский В. А. Статистические методы планирования эксперимента в технико-экономических исследованиях. 2-е изд., испр. и доп. М.: Финансы и статис­тика, 1981. Гл. 2, 3.

называют главным эффектом, а изменение величины этого эффекта под влия­нием другой независимой переменной называют взаимодействием.

В таблице 4.2 представлен план простейшего факторного эксперимента «два на два» («2 х 2»), в котором изучалось влияние новизны и типа изображения на интерес, проявляемый к этому изображению 4-месячными младенцами. В ка­честве индикатора интереса использовалась длительность разглядывания. Каж­дая из независимых переменных была представлена только двумя уровнями:

для новизны —новое или старое, предъявлявшееся в предыдущих сериях изоб­ражение; для типа изображения—геометрический контур либо схематическое изображение человеческого лица (схематические рисунки использовались для уравнивания изображений по визуальной сложности, так как время фиксации взора обычно зависит от сложности и количества деталей). Как видно из приве­денных в таблице 4.2 данных, налицо оба главных эффекта. Влияние новизны на интерес становится очевидным при сравнении средних по строкам — сред­няя длительность разглядывания изображений (и геометрических, и «физионо­мий») заметно выше в случае предъявления новых рисунков (55 сек против 20). Сравнение по столбцам показывает, что при усреднении данных по двум груп­пам (новые и старые рисунки) изображения человеческого лица вызывают зна­чительно больший интерес, проявляющийся в более длительном разглядыва­нии (45 сек). Налицо также взаимодействие между типом изображения и но­визной. Результаты предъявления разных типов изображений различны для «старой» и «новой» группы. Различаются и значения разностей по столбцам для каждой строки (60-50=10 сравнительно с 30-10=20), и соответствую­щие показатели по строкам (60-30=30 сравнительно с 50-10=40). Иными словами, большая привлекательность человеческих лиц сильнее проявляется при предъявлении старых рисунков (различие в 10 сек при предъявлении но­вых картинок увеличивается до 20 для старых изображений), а различие между предъявлением старых и новых рисунков при использовании геометрических контуров возрастало до 40 сек.

Таблица 4.2 Факторный эксперимент 2х2
Новизна изображения Тип изображения Средняя длительность разглядывания, сек.
лицо геометрическое    
Новое Старое 60 30 50 10 55 20
Средняя длительность, сек. 45.    

При обработке результатов многофакторных экспериментов основной статис­тической моделью является многофакторный дисперсионный анализ.

Многофакторные эксперименты в социологии—это очень часто полевые экс­перименты, моделирующие сложные взаимосвязи реального мира. Преимуще­ство полевых многофакторных экспериментов—в их «жизнеподобии», т. е. внешней, лицевой валидности. Но здесь же кроется и главный недостаток таких экспериментов — более низкие надежность и внутренняя валидность. Кри­тики полевых многофакторных экспериментов часто отмечают, что приближе­ние эксперимента к реальному миру здесь нередко достигается за счет замены экспериментального контроля чисто статистическим. В последнем случае воз-

растают угрозы валидности, связанные с неправильной спецификацией модели измерения, с «закоррелированностью» отдельных уровней независимых пере­менных с неконтролируемыми внешними переменными (см. гл. 5, 6). Кроме того, в многофакторных экспериментах острее, чем в индивидуальных и меж­групповых, стоит проблема агрегирования данных — практически всегда суще­ствует вероятность того, что отношения, выявленные при анализе сводных груп­повых данных, в точности не соблюдаются ни для одного отдельно взятого ис­пытуемого (так же, как среднее некоторой выборки может не относиться ни к одному конкретному выборочному наблюдению). К неоспоримым достоинствам факторных экспериментов следует отнести значительно большие возможности статистического анализа, в том числе анализа различных эффектов взаимодей­ствия переменных-«факторов».

В социальных науках часто употребляют также понятие квазиэксперимента, или квазиэкспериментального исследовательского плана. Речь идет о панель­ных, трендовых и т. п. планах выборочных обследований (гл. 5). Выборочные обследования, особенно продолжающиеся или проводимые как сравнительные «срезовые» исследования для подвыборок, испытавших либо не испытавших определенное, локализованное во времени воздействие (например, социальную революцию, реформу образования или крах фондового рынка), действительно позволяют делать выводы о взаимоотношениях между интересующими иссле­дователя независимыми и зависимыми переменными, а значит—проверять гипотезы о предполагаемых причинно-следственных связях, однако экспери­ментальную рандомизацию и контроль в выборочных исследованиях, как пока­зано в соответствующих главах, здесь заменяет использование случайных вы­борок и специальных методов статистического анализа данных.

Дополнительная литература

Вознесенский В. А. Статистические методы планирования экспери­мента в технико-экономических исследованиях. 2-е изд., перераб. и доп. М.: Финансы и статистика, 1981. Гл. 2, 3.

Гласе Дж., СтэнлиДж. Статистические методы в педагогике и пси­хологии: Пер. с англ. / Общ.ред. Ю. П. Адлера. М.: Прогресс, 1976. Гл. 15—19.

Готтсданкер Р. Основы психологического эксперимента: Пер. с англ. М.: Изд-во МГУ, 1982.

Дружинин Н. К. Выборочное наблюдение и эксперимент. М.: Ста­тистика, 1977.

Кэмпбелл Д. Модели экспериментов в социальной психологии и при­кладных исследованиях: Пер. с англ. / Сост. и общ. ред. М. И. Боб-невой.М.: Прогресс, 1980.

Ядов В. А. Социологическое исследование: методология, програм­ма, методы. М.: Наука, 1987.Гл. 5.

Наши рекомендации