Валидность как цель экспериментального контроля

В самом общем случае под валидностью эксперимента подразумевают все формы экспериментального контроля, обеспечивающие валидный, или достоверный, вывод. Однако контроль за выводами осуществляется и за пределами экспериментального контроля. Результаты валидного эксперимента могут служить основанием достоверного вывода, если в целом реализована логически обоснованная система умозаключений, включающая взаимопереходы между разными уровнями гипотез, проверяемых в эксперименте, учтена проблема асимметрии вывода, обоснованы широта и уровень обобщений данных (как переноса выводов за пределы проведенного эксперимента).

Чтобы обсуждать адекватность и обоснованность обобщений, исследователь, во-первых, должен быть уверен, что полученная в проведенном эксперименте зависимость действительно представляет (репрезентирует) подразумеваемое в гипотезе отношение между независимой и зависимой переменными, что не произошло – вольной или невольной – подмены изучаемой закономерности. Любое несоответствие означает угрозу правильности, или валидности, последующих выводов.

Во-вторых, установление экспериментальной зависимости подразумевает, что были устранены все конкурирующие угрозы валидному выводу со стороны смешений НП с побочными или сопутствующими переменными. Если какое-либо условие НП неслучайным образом оказалось связанным с активным уровнем смешивающейся переменной, то неизвестным остается, какой из них – независимой или смешивающейся с ней переменной – следует приписать полученный сдвиг в значениях ЗП (случай, когда при возможности отвергнуть нуль-гипотезу, или при достоверности различий выборочных значений ЗП на выбранном уровне значимости, валидность является плохой и экспериментальный эффект может быть рассмотрен как артефакт).

Если обобщения оказались неправильными, они называются артефактными. Плохой экспериментальный контроль может выступать одним из источников неправильных выводов. Другими словами, невалидный эксперимент приводит к неправильным обобщениям.

Пока не рассматривается, в какой степени выбор конкретной формы эксперимента – экспериментального плана – связан с разработкой системы контроля всех возможных угроз выводу об устанавливаемой зависимости. Отметим только, что экспериментальный план как схема сбора данных, а именно: фиксации ЗП при разных условиях НП, включает и указание других направлений экспериментального контроля (выбор типа переменных, осуществление «первичного» контроля, устранение побочных или стабилизация дополнительных переменных, введение расширенной переменной и т.д.). Более подробное описание этих средств планирования станет возможным в связи с представлением оснований классификаций типов экспериментов и экспериментальных схем (см. далее).

Следует учесть, что формулирование системы гипотез, оценка валидности эксперимента и реализация выводов входят как составляющие общего норматива – избежать угроз валидному выводу.

Забегая вперёд, отметим, что проблема правильности выводов – это также проблема контроля за логической компетентностью. Неправильные, или артефактные, выводы исследователь может сделать и в том случае, если эксперимент был достаточно валидным. Дело в том, что никакая экспериментальная схема не может контролировать всего пути рассуждений исследователя об имперической зависимости. На этом пути он может совершить ошибку умозаключений, которые и приводят к артифактным выводам. Наиболее частые в психологических исследованиях ошибки умозаключений, которые случаются при обобщении эмпирических зависимостей, обсуждаются в главе 14.

Контрольные вопросы

1. Как связаны понятия мысленного образца эксперимента и мысленного эксперимента?

2. Как используется понятие мысленных образцов при оценке валидности эксперимента?

3. Как определить четыре основных вида валидности эксперимента?

4. Каковы основные источники угроз внутренней валидности?

5. Каковы основные направления оценки соответствия переменных при обсуждении внешней валидности экспериментов?

6. Как связаны понятия конструктной валидности и концептуальных репликаций?

7. Как понимать принцип открытости гипотезы для дальнейшей проверки?

8. В чем сходство и различия между понятиями конструктной и внешней валидности? Внешней и внутренней валидности?

9. Как оценка операциональной валидности связана с определением типа эксперимента?

10. Каковы основные источники недостоверных, или артефактных, выводов?

11.Каким образом связаны содержательное планирование и выбор типа эксперимента, содержательное планирование и выбор экспериментальных схем?

12. Какие типы психологических законов проверяются в психологическом эксперименте?

13.С чем связана необходимость установления минимального эффекта для отвержения нуль-гипотез?

14. В каких случаях можно делать широкие обобщения при проведении интраиндивидуальных экспериментов?

Глава 9

КЛАССИФИКАЦИИ ЭКСПЕРИМЕНТАЛЬНЫХ ПЛАНОВ

9.1. Критерии классификаций экспериментальных планов

В учебниках можно встретить разные критерии классификаций экспериментальных планов. Важен общий контекст представления методов психологического исследования: рассматривается только экспериментальный метод или и другие подходы к сбору эмпирических данных, сравнивается ли проведение экспериментов в специально созданных и «полевых» условиях, учитываются ли при представлении экспериментальных схем возможные схемы обработки данных и т.д.

При обсуждении типов экспериментов были представлены содержательные критерии, позволяющие оценить разнообразие экспериментальных процедур при проверке психологических гипотез. На основе оценивания соответствия НП, ЗП и ДП моделируемым реальным условиям или теоретическим конструктам выделялись следующие типы экспериментов: естественные, искусственные и лабораторные. Остановимся на трех других критериях, позволяющих структурировать сведения из области формального планирования экспериментов.

Первый из них – это критерий строгого, или истинного, эксперимента, по отношению к которому можно выделить так называемые доэкспериментальные, экспериментальные и квазиэкспериментальные планы. Дж. Кэмпбелл связывает выделение истинных экспериментальных исследований с возможностью рандомизации, т.е. случайного распределения разных уровней НП по экспериментальным и контрольным условиям, а также с допущением об эквивалентности состава групп испытуемых. Рандомизацией называется также стратегия случайного отбора испытуемых в группы из популяции. Случайным (рандомизированным) может быть также подбор испытуемых в группы, когда потенциальные участники эксперимента уже выбраны и требуется только распределить их в экспериментальную и контрольную группы. Случайная стратегия может быть направлена также на отбор групп испытуемых (например, учебных). Строгим критерием является именно случайный отбор испытуемых из популяции, решающий одновременно проблему репрезентативности выборки испытуемых и обеспечения эквивалентных по своему составу групп.

Сравнение групп, являющихся эквивалентными по всем факторам, кроме экспериментального воздействия, позволяет рассматривать сдвиг в значениях ЗП при сравнении экспериментального и контрольного условий именно в связи с воздействием этого фактора. Достижение желаемой эквивалентности означает здесь контроль источников угроз внутренней валидности со стороны факторов межиндивидуальных различий.

Второй критерий – это число осуществляемых экспериментальных воздействий. В соответствии с ним принято различать планы с одной независимой переменной и так называемые факторные планы (с двумя и более НП). Сколько бы факторов ни изменялось в моделируемой экспериментальной ситуации, каждый из них должен быть оценен с точки зрения шкалы, в которой представлены изменения переменной. Напомним, что это могут быть шкалы наименований, порядка, интервалов или отношений.

Третий критерий – разделение экспериментальных схем на качественные и количественные – связан с учетом шкалы, в которой измерена МП. Качественными называются обычно эксперименты, в которых уровни НП заданы в классификационных признаках. Если между условиями НП может быть показано не только качественное различие, но и порядок в величине учитываемого признака, то это позволяет переходить к количественному эксперименту.

Использование количественных изменений НП означает переход к многоуровневому эксперименту, который далее будет представлен как вариант факторного. Квазиэкспериментальным исследованиям и факторным экспериментам посвящены отдельные главы. В данном разделе рассматриваются наиболее простые однофакторные экспериментальные схемы.

Четвертый критерий – осуществление эксперимента в соответствии с интраиндивидуальными или межгрупповыми схемами предъявлений условий НП. В специальном разделе уточнены возможные схемы контроля угроз валидности при реализации этих планов.

Для представления примеров экспериментальных схем как планов организации экспериментальных воздействий введем общепринятые обозначения. Экспериментальный фактор, или НП, может выступать синонимом Х-воздействия. В экспериментальных схемах это выглядит так:

Х – НП без указания уровней; X' и X" – два уровня НП (если ограничиться дихотомической переменной); Х1, X2, ..., Хn – n уровней экспериментального фактора;

R – рандомизация, т.е. случайный порядок предъявления проб (как уровней НП) в последовательности либо случайная стратегия образования групп (случайная выборка из популяции или случайное распределение имеющейся выборки на группы испытуемых);

О – измерение (наблюдение) психологического показателя, или зависимой переменной; в случае предварительного тестирования появляются индексы, например О'ХО" или согласно номерам выборок О1, О2 и т.д.

Уже использованный способ обозначения разных уровней НП прописными буквами латинского алфавита вновь появится в резюме интраиндивидуальных схем: ABC и т.д. Так, схемы ABC и СВА указывают отличия порядка предъявления трех уровней основной НП. Сам порядок следования уровней А, В и С выступит вторым – производным – экспериментальным фактором.

Порядок условий НП одновременно является и планом измерения ЗП. Кроме того, как это имеет место в плане, называемом «временные серии», сам фактор времени может присутствовать в схеме в качестве подразумеваемой переменной или Х-воздействия. В лонгитюдном исследовании контроль фактора времени предполагается специальными схемами, которые представлены в пособии, раскрывающем специфику квазиэкспериментов как психологических исследований, тяготеющих к экспериментальному методу [43].

При разработке экспериментальных схем следует помнить о возможной неидентичности плана проведения эксперимента и плана обработки данных. Выбрать адекватную схему представления данных – это специальная проблема спецификации психологических гипотез с точки зрения анализа допустимых форм статистических решений об экспериментальных эффектах.

9.2. Доэкспериментальные планы

Анализ единичного случая

Самой простой и неудачной схемой в психолого-педагогических исследованиях Дж. Кэмпбелл называет план «только X», или ХО, т.е. случай, когда нет контрольного условия или контрольной группы, а ЗП измеряется после организации экспериментального воздействия в экспериментальной группе.

Допустим, автор нового метода обучения желает показать его преимущества на одной академической группе. Часто педагогические «эксперименты» выглядят именно так. В этом случае исследователь, конечно, сравнивает результаты данной экспериментальной группы с «обычными» результатами, т.е. с известными показателями ЗП (или О), или с другими мыслимыми группами, в которых ситуация обучения является традиционной. Если он не использует никаких форм экспериментального контроля (в первую очередь как сравнение реализованных условий с разными уровнями НП), то выводы могут не выдержать критики с точки зрения конкурирующих объяснений. Приведем часть возможных возражений, ставящих под сомнение достоверность таких результатов:

q возможно, в выбранной (и единственной) группе изначально были более сильные студенты;

q возможно, само понимание учащимися, что с ними экспериментируют, заставило их заниматься более усердно;

q возможно, более высокий результат обучения нужно связывать с личностью преподавателя: он как энтузиаст «выкладывается» в большей степени, чем коллеги, в частности, вследствие искренней веры в успех своего метода и т.д.

В любом случае объяснение преимущества нового метода обучения не выдерживает критики из-за отсутствия элементарных форм экспериментального контроля. Иными словами, используемый метод, возможно, действительно ведет к лучшим результатам, но этому нет доказательств в силу многообразия конкурирующих гипотез о других переменных, которые могли обусловить изменения ЗП.

Отдельной проблемой является возможность приписывания изучаемой реальности тех свойств, которые на самом деле ей не присущи, нехарактерны, но исследователь выделяет их именно в силу предполагаемого контекста сопоставления с мысленной группой «эквивалентных» случаев (в МЭ).

Другое понимание метода анализ единичного случая связано с реализацией задачи подготовки психологического заключения о свойствах конкретного человека, т.е. задачи обследования. В этом случае не представлена организация уровней определенной НП, а использование психологических методик включает и актуализацию исследуемых процессов, и психодиагностическую направленность последующих заключений. Описание и объяснение психологических свойств конкретного субъекта строятся путем проверки множества гипотез, выбор которых направляется ситуацией в рамках задачи описания индивидуального случая (ситуация добровольного «клиента», принудительной экспертизы и пр.). Одновременно анализ единичного случая базируется на теории, призванной применительно к используемому методическому средству (методики, способ задания экспериментальной ситуации) задать систему ориентиров для обсуждения актуализируемых свойств и процессов. Показатели по отдельной психологической методике сопоставляются при этом в рамках мысленного эксперимента с другими известными или теоретически предполагаемыми случаями. Совокупность используемых методических приемов позволяет психологу определиться в том, насколько типичными или, напротив, специфичными выглядят индивидуальные особенности человека (его познавательной, личностной сферы).

Следует учесть три проблемы, встающие при интерпретации данных в так организованном исследовании-обследовании.

Во-первых, при анализе индивидуального случая предполагается сочетание проверки исследовательских и психодиагностических гипотез. В качестве нормативных показателей могут выступать любые ранее установленные закономерности, связываемые с использованием методики на определенных выборках. Являясь экспериментальными результатами для ранее проведенных экспериментов, те же экспериментальные зависимости могут рассматриваться в качестве критериев отличия обследуемого субъекта. Включение в обследование интраиндивидуального эксперимента – возможный, но не обязательно используемый прием получения данных о познавательной или личностной сфере человека при анализе индивидуального случая. Обобщение будет распространяться именно на обследуемого человека, но этим может ограничиваться сходство с интраиндивидуальными экспериментами, проводимыми в практических целях.

Сами психологические гипотезы не обязательно будут выступать в качестве причинно-следственных. Система умозаключений эксперта, сочетающая ориентиры на знание теоретических зависимостей и догадок, направляющих построение гипотез об индивидуальном случае, может подчас быть единственным и незаменимым основанием его выводов, которые не являются нормативными и не могут быть охвачены схемами проверки отдельных экспериментальных гипотез.

Во-вторых, использование этого метода может базироваться либо на проверке одной теоретической интерпретации наблюдаемых (выявляемых) психологических свойств, либо предполагать конкурирующие теоретические объяснения, либо вообще обходиться без таковых. Трудность заключается в том, что исследователь не имеет заранее ограничений в поле психологических гипотез, которые могут быть отнесены к данному случаю (как наиболее соответствующие его индивидуальности, его специфике). Если в экспериментальном исследовании экспериментальная и контргипотеза заранее определены, то в ситуации обследования одна диагностическая гипотеза может сменять другую, одно выявленное свойство может натолкнуть на гипотезу о другом и т.д.

Задания, выполнение которых требуется от испытуемого, выступают при этом в качестве функциональных проб. Обычно используется ряд таких методических приемов, каждый из которых нацелен на актуализацию определенных процессов и позволяет проводить анализ в направлении гипотез об их представленности у конкретного испытуемого. За использованием той или иной функциональной пробы как бы просматривается направленность связанных с ними гипотез, но выбор их не определен. Один и тот же процесс, не отличающийся от нормативных данных для одной пробы, может проявить специфику в другой пробе.

В-третьих, поскольку заранее обычно неизвестно, что для данного индивидуального случая может оказаться наиболее характерным (сущностным), опыт и интуитивная ориентировка выступают не менее важными регуляторами определения общего психологического и конкретного методического воплощения предположений исследователя. Выбор гипотез и экспериментальных заданий зависит также от знания психологом контекста жизненной ситуации испытуемого, конкретного повода для проведения обследования, целей последующих прогнозов, предварительно возникших предположений о том, что нужно выявить, и т.д.

Предварительное и итоговое тестирование на одной группе

Этот план также находит широкое применение в педагогических и психологических исследованиях. Он лучше рассмотренного ранее плана, так как учитывает величину изменения зависимой переменной от первого ко второму измерению, т.е. имеет место контроль ЗП на уровнях «до» и «после» воздействия (схема О'ХО"). Достоверность выводов и при таком плане очень мала. Укажем некоторые причины.

Нет возможности развести факторы «фон» и «естественное развитие» от влияния собственно экспериментального воздействия.

Допустим, в качестве экспериментального фактора продолжает рассматриваться новый метод обучения. Показатели академической успеваемости изменяются к концу семестра (и началу экзаменационной сессии) сразу по нескольким причинам. Кроме воздействия обучения, вмешиваются побочные переменные. Так, «тревожность» как пример фактора «фон» обычно возрастает у студентов к началу экзаменационной сессии. Возможно, именно это является причиной больших усилий студентов в учебном процессе, а не воздействие нового метода обучения. В результате повышение показателей эффективности учения к концу семестра «естественно» и без эффекта введения нового метода.

К переменным фона может быть отнесена также переменная, называемая «экспериментальная изоляция». Например, в качестве экспериментальной исследуется группа в учреждении, пансионате и т.п. Члены этой группы оказываются вне влияний со стороны общения с другими аналогичными выборками – коллег, сверстников из других групп и т.п. Понятно, что в таких условиях возможно изменение установок, развитие (или даже искажение) мотивации учения и работы, т.е. появляются источники конкурирующих гипотез относительно причин изменений ЗП (О-измерений).

К факторам естественного развития относятся все те процессы (психического, экономического, социального и биологического характера), которые систематически изменяются независимо от конкретных внешних событий, просто с течением времени.

Так, испытуемые от момента измерения О' к измерению О" могли стать старше, устать, подвергнуться каким-то социальным воздействиям, в качестве которых выступают изменения в обществе. Наконец, ситуация в стране могла измениться так, что «естественно» изменилось отношение людей к тем или иным аспектам реальности или к собственной деятельности.

Далее, при такой схеме нет возможности оценить «эффект тестирования». Хорошо известно, что при тестировании, например, интеллекта или уровня знаний повторное проведение теста, пусть и по другой, альтернативной форме, вызывает эффект тренировки.

Неучаствовавшие ранее в процедуре тестирования люди обычно показывают худшие результаты по тестам, чем уже получившие опыт знакомства с тестированием. Возможен и обратный эффект. Например, при тестировании предубежденности по отношению к национальным меньшинствам повторное измерение может продемонстрировать большую величину эффекта, чем он есть в действительности. На результаты оказывает влияние повышение осведомленности людей (в группе, популяции) относительно «желаемого», т.е. ожидаемого от них, эффекта. При анонимных опросниках это может быть связано, в частности, с тем, что в суждениях, выражающих враждебность или отрицательное отношение, испытуемые изменяют свои представления, принимая установку большей враждебности. Этот факт, кстати, полностью применим и к обоснованию неадекватности опросников, выясняющих отношение к преподавателю, если в анкету заведомо включаются «отрицательные» шкалы.

«Реактивность» испытуемых – еще одно конкурирующее объяснение при исследованиях по плану О'ХО". Так, сама по себе процедура измерения переменных может выступать стимулом для изменения поведения, оценок или мыслей студентов.

Группа, подвергнутая тестированию, может начать демонстрировать иные формы поведения в силу возникновения у ее членов новых установок, связанных с реакцией на него. Известно, например, что появление в классе наблюдателя само по себе может изменить стиль общения преподавателя с учащимися. Для экспериментальных ситуаций эффекты реактивности принимают форму эффектов экспериментатора, что обсуждается специально в представлении понятия «первичный контроль».

Итак, в «доэкспериментальных» планах отсутствует контроль за уровнями НП, вследствие чего нельзя не только сделать вывод о действии НП, но и нельзя отвергнуть многообразие других объяснений изменений ЗП – «третьими» переменными, т.е. указанными побочными факторами. Эти конкурирующие гипотезы не могут быть отвергнуты из-за отсутствия данных о ЗП в аналогичных условиях для контрольных групп, испытуемые в которых не подвергались бы воздействию со стороны активного уровня НП.

В отличие от «доэкспериментальных» схем «истинные» эксперименты обязательно включают сравнение экспериментального и контрольного условий. Это могут быть группы людей, учебные группы либо два (и более) типа ситуаций, в которых один и тот же человек осуществляет конкретную деятельность (решает задачи, подвергается тестированию, работает на тренажерах, в общем, реализует любой вид активности, актуализирующей интересующий исследователя базисный процесс). Только такое сравнение позволяет интерпретировать изменения ЗП как следствия осуществленных форм экспериментальных воздействий.

Анализ «доэкспериментальных» планов в заданном контексте оставляет без внимания и проблему связи психологического воздействия с интерпретационными возможностями в рамках той или иной психологической гипотезы, а также неидентичности «управляемых воздействий» и «причинно-действующих» условий. При разработке «экспериментальных» схем синонимом экспериментального воздействия является различие (качественное или количественное) между активным и неактивным уровнями НП. Психологической переменная становится в той степени, в какой разработаны гипотетические представления о связи ее с базисным процессом, на который оказывает влияние разница ее уровней (экспериментального и контрольного условий).

9.3. Истинные экспериментальные планы

Отличиям факторных планов посвящена глава 10 учебника, критерий разведения качественных и количественных экспериментов был кратко описан в главе 6. Поэтому далее истинные экспериментальные планы рассматриваются только в классификации способов задания НП как интраиндивидуальных и межгрупповых экспериментальных схем.

Этот критерий классификации экспериментов по объекту (индивид или группа людей) и способу задания уровней НП (разным группам или одному и тому же субъекту последовательностью проб, в которых экспериментальные воздействия осуществляются или нет) необходимо отличать от формы проведения экспериментов. Групповое проведение опытов не следует путать с межгрупповыми схемами сравнений выборочных значений ЗП, а индивидуальное проведение опытов – с индивидуальным экспериментом. Если смене воздействий – уровней НП – подвергается отдельный человек или отдельная группа людей (для каждого из них НП представлена на всех своих уровнях и во всей задуманной последовательности), то речь идет о «последовательном» экспериментировании или о сумме интраиндивидуальных экспериментов соответственно. Если экспериментальные и контрольные условия предлагаются разным группам людей, речь идет о «параллельном» экспериментировании. В последнем случае имеют место межгрупповые схемы сравнения ЗП, даже если каждый испытуемый был обследован индивидуально. Сложность методического проведения опытов, необходимость беседы (например, в полуструктурированных интервью) или особого управления взаимодействием с испытуемым обусловливают необходимость отдельной встречи экспериментатора с каждым отдельным испытуемым из каждой группы. Иногда экспериментаторов оказывается столько, сколько испытуемых; полученные индивидуальные данные заносят в таблицу групповых сравнений в соответствии с тем, в какую из групп входил каждый субъект.

Межгрупповыс схемы

Существенным условием планирования является способ образования групп. Наиболее строгий критерий требует рандомизации, или случайного порядка образования групп, когда из имеющейся или потенциальной выборки людей попадание в каждую группу основывается на применении последовательности случайных чисел (например, по соответствующим таблицам). Различия между субъектами и неравенство между группами – основной источник угроз внутренней валидности при межгрупповых схемах. Подбор групп с большим числом участников проблемы неравенства групп не решает, так как и при рандомизированном порядке отбора в разных группах могут оказаться «похожие» по тому или иному свойству люди: например, в одну группу случайно попали наиболее способные и трудолюбивые ученики, в другой оказались наименее способные или лентяи. Это случайно сложившееся неравенство групп может как скрыть, так и усилить экспериментальный эффект.

Предварительное тестирование лишь частично решает эту проблему путем учета исходного уровня интересующей исследователя переменной, поскольку неэквивалентность групп может быть скрыта в неизмеренных переменных, но влияющих на изучаемый базисный процесс.

Соответствующий «истинный» экспериментальный план в книге Дж. Кэмпбелла представлен как план с предварительным и итоговым тестированием и контрольной группой. Он имеет вид схемы 9.1 или 9.2.

Валидность как цель экспериментального контроля - student2.ru

Схема 9.1. План с предварительным и итоговым тестированием для экспериментальной и контрольной групп.

Валидность как цель экспериментального контроля - student2.ru

Схема 9.2. Тот же план, предполагающий два уровня Х-воздействия.

RO1XO2

RO3 O4

R XO5

R O6

Схема 9.3.План Соломона.

RXO΄

R O΄΄

Схема 9.4. План для экспериментальной и контрольной групп, без предварительного тестирования.

При достаточно хорошем контроле угроз внутренней валидности такой план сравнения ЗП – при наличии экспериментальной и контрольной групп – может иметь недостаточную внешнюю валидность.

Например, как отмечалось, при измерении установок тесты содержат столько необычных или «враждебных» утверждений, что само предварительное тестирование (измерение О1 и О3) влияет на убеждения личности и изменяет ее сензитивность в отношении социальных проблем, имеющих этнический подтекст.

Р. Соломон – один из авторов, специально анализировавший подобного рода эффекты тестирования [32], показал, например, что предварительное тестирование повышало успешность экспериментального обучения чтению. Эффект вводимого Х-воздействия для группы, не подвергнутой сенсибилизации посредством тестирования, может быть иным или не столь сильным. Таким образом, обобщение зависимости между уровнями экспериментального фактора (X) и показателями ЗП (тестирования О) может быть ошибочным при переносе ее на обычные группы. Цели специального контроля эффекта тестирования служит план Соломона, схема которого включает сравнение четырех групп: двух экспериментальных и двух контрольных, а удвоение их числа связано с введением фактора «наличие или отсутствие предварительного тестирования» (схема 9.3).

Более простым вариантом является план с контрольной группой и измерением показателей ЗП только после Х-воздействия (или путем сравнения действия разных уровней НП), представленный на схеме 9.4. Именно он рассматривается в качестве общей основы межгрупповых схем сравнений основных результатов действия экспериментальных факторов.

Контроль состава групп

Использование определенных стратегий подбора или отбора испытуемых в группы – существенное дополнение к экспериментальному плану при межгрупповом эксперименте. В зависимости от того, имеет ли экспериментатор дело с наличным составом испытуемых, который ограничен не используемой стратегией отбора, а случайными обстоятельствами и испытуемых остается только распределить по экспериментальной и контрольной группам, или он может контролировать отбор испытуемых (или групп) из популяции. Это определяет разную степень контроля состава групп, их эквивалентности и последующих выводов об установленной зависимости.

В рассмотренных схемах обозначение R указывало на то, что использована определенная стратегия отбора испытуемых в группы – рандомизация, или случайный отбор испытуемых из популяции. Этот критерий иногда рассматривается в качестве строгого критерия экспериментирования. Предполагается, что при использовании этой стратегии состав групп хорошо репрезентирует, т.е. представляет популяцию, из которой были отобраны испытуемые. Соответственно исследование с таким способом отбора испытуемых будет обладать высокой популяционной валидностью. Кроме того, поскольку побочные переменные, связанные с индивидуальными различиями людей, предположительно случайно распределятся между испытуемыми контрольной и экспериментальной групп, то возможные с ними смешения будут в равной степени характеризовать состав обеих групп, т.е. эти группы будут эквивалентными, что обеспечит высокую внутреннюю валидность эксперимента. Итак, в случае стратегии рандомизации для отбора из популяции внешняя и внутренняя валидности эксперимента оказываются взаимосвязанными.

Этого нельзя сказать в том случае, когда исследователь не волен выбирать испытуемых из популяции, а должен распределить по группам уже имеющийся (наличный) состав испытуемых. Стратегией случайного подбора в группы достигается цель подбора эквивалентных по составу групп, что контролирует названную угрозу внутренней валидности. При этом может остаться непроконтролированным способ отбора потенциальных испытуемых из популяции. Возможно, они пришли сами (по объявлению), что позволяет о них говорить как об испытуемых-добровольцах. Предполагается, что в ряде случаев мотивация испытуемых-добровольцев такова, что исследуемые зависимости могут оказаться нерепрезентативными для других групп испытуемых. Возможно, участие в психологическом эксперименте выступило для испытуемых условием достижения целей в рамках профессиональной деятельности. В этом случае вновь встает проблема особой мотивационной обусловленности выполнения ими заданий.

Отбор из популяции по заданному критерию может производиться и для выборок испытуемых, и для целых групп. Такими критериями могут выступать пол, возраст, профессиональная принадлежность, образ жизни потенциальных испытуемых и т.д. В ряде случаев именно содержание гипотезы или указание дополнительной переменной прямо определяет критериальные характеристики для отбора испытуемых. Случайная стратегия используется при этом в качестве приема, направленного на обеспечение эквивалентности и репрезентативности групп испытуемых в пределах указанных характеристик.

Другим приемом подбора испытуемых в эквивалентные группы является стратегия попарногоуравнивания. Она обычно применяется в случае, если выборка потенциальных испытуемых уже определена и испытуемые могут быть подвергнуты предварительному тестированию. Тестированием условно называется любой способ измерения побочного фактора, который может определить неэквивалентность групп. Соответствующий ему показатель также может быть либо задан критериально, либо являться результатом психологического тестирования. Он измеряется заранее, чтобы потом можно было проранжировать испытуемых либо в соответствии с «сырыми» оценками определить пару испытуемых с наиболее выраженным показателем этой побочной переменной – ПП, затем пару с более низкими показателями и т.д., до тех пор, пока не будут образованы пары между всеми испытуемыми. На следующем этапе испытуемых из каждой пары распределяют между двумя группами, например, согласно случайной стратегии или стратегии «чет–нечет». В результате этого уровень каждой пары в каждой из двух групп представлен одним из «равных» (схожих, эквивалентных) по измеренной ПП-случаев. Если уровни ПП отличались, представляя угрозу внутренней валидности со стороны фактора межиндивидуальных различий, то в результате использованной стратегии подбора испытуемых все уровни этого фактора оказались поровну распределенными между экспериментальным и контрольным условиями. Таким образом, стратегия попарного уравнивания также решает проблему эквивалентности состава групп. Она применяется в основном тогда, когда выборка испытуемых заведомо определена, в ней мало испытуемых и не составляет труда провести предварительное тестирование. Другое основание использования этой стратегии – рассмотрение измеряемой ПП в качестве второго фактора, который наряду с НП существенно определяет изменения ЗП, т.е. имманентно связан с изучаемым базисным процессом.

В случае если для попарного уравнивания используется более чем одна ПП, то число испытуемых в отбираемых таким образом группах существенно уменьшается, даже если потенциальная выборка была большой. Но главное, состав групп при использовании такой стра

Наши рекомендации