Валидность как цель экспериментального контроля

В самом общем случае под валидностью эксперимента подразумевают все формы экспериментального контроля, обеспечивающие валидный, или достоверный, вывод. Однако контроль за выводами осуществляется и за пределами экспериментального контроля. Результаты валидного эксперимента могут служить основанием достоверного вывода, если в целом реализована логически обоснованная система умозаключений, включающая взаимопереходы между разными уровнями гипотез, проверяемых в эксперименте, учтена проблема асимметрии вывода, обоснованы широта и уровень обобщений данных (как переноса выводов за пределы проведенного эксперимента).

Чтобы обсуждать адекватность и обоснованность обобщений, исследователь, во-первых, должен быть уверен, что полученная в проведенном эксперименте зависимость действительно представляет (репрезентирует) подразумеваемое в гипотезе отношение между независимой и зависимой переменными, что не произошло – вольной или невольной – подмены изучаемой закономерности. Любое несоответствие означает угрозу правильности, или валидности, последующих выводов.

Во-вторых, установление экспериментальной зависимости подразумевает, что были устранены все конкурирующие угрозы валидному выводу со стороны смешений НП с побочными или сопутствующими переменными. Если какое-либо условие НП неслучайным образом оказалось связанным с активным уровнем смешивающейся переменной, то неизвестным остается, какой из них – независимой или смешивающейся с ней переменной – следует приписать полученный сдвиг в значениях ЗП (случай, когда при возможности отвергнуть нуль-гипотезу, или при достоверности различий выборочных значений ЗП на выбранном уровне значимости, валидность является плохой и экспериментальный эффект может быть рассмотрен как артефакт).

Если обобщения оказались неправильными, они называются артефактными. Плохой экспериментальный контроль может выступать одним из источников неправильных выводов. Другими словами, невалидный эксперимент приводит к неправильным обобщениям.

Пока не рассматривается, в какой степени выбор конкретной формы эксперимента – экспериментального плана – связан с разработкой системы контроля всех возможных угроз выводу об устанавливаемой зависимости. Отметим только, что экспериментальный план как схема сбора данных, а именно: фиксации ЗП при разных условиях НП, включает и указание других направлений экспериментального контроля (выбор типа переменных, осуществление «первичного» контроля, устранение побочных или стабилизация дополнительных переменных, введение расширенной переменной и т.д.). Более подробное описание этих средств планирования станет возможным в связи с представлением оснований классификаций типов экспериментов и экспериментальных схем (см. далее).

Следует учесть, что формулирование системы гипотез, оценка валидности эксперимента и реализация выводов входят как составляющие общего норматива – избежать угроз валидному выводу.

Забегая вперёд, отметим, что проблема правильности выводов – это также проблема контроля за логической компетентностью. Неправильные, или артефактные, выводы исследователь может сделать и в том случае, если эксперимент был достаточно валидным. Дело в том, что никакая экспериментальная схема не может контролировать всего пути рассуждений исследователя об имперической зависимости. На этом пути он может совершить ошибку умозаключений, которые и приводят к артифактным выводам. Наиболее частые в психологических исследованиях ошибки умозаключений, которые случаются при обобщении эмпирических зависимостей, обсуждаются в главе 14.

Контрольные вопросы

1. Как связаны понятия мысленного образца эксперимента и мысленного эксперимента?

2. Как используется понятие мысленных образцов при оценке валидности эксперимента?

3. Как определить четыре основных вида валидности эксперимента?

4. Каковы основные источники угроз внутренней валидности?

5. Каковы основные направления оценки соответствия переменных при обсуждении внешней валидности экспериментов?

6. Как связаны понятия конструктной валидности и концептуальных репликаций?

7. Как понимать принцип открытости гипотезы для дальнейшей проверки?

8. В чем сходство и различия между понятиями конструктной и внешней валидности? Внешней и внутренней валидности?

9. Как оценка операциональной валидности связана с определением типа эксперимента?

10. Каковы основные источники недостоверных, или артефактных, выводов?

11.Каким образом связаны содержательное планирование и выбор типа эксперимента, содержательное планирование и выбор экспериментальных схем?

12. Какие типы психологических законов проверяются в психологическом эксперименте?

13.С чем связана необходимость установления минимального эффекта для отвержения нуль-гипотез?

14. В каких случаях можно делать широкие обобщения при проведении интраиндивидуальных экспериментов?

Глава 9

КЛАССИФИКАЦИИ ЭКСПЕРИМЕНТАЛЬНЫХ ПЛАНОВ

Критерии классификаций экспериментальных планов

В учебниках можно встретить разные критерии классификаций экспериментальных планов. Важен общий контекст представления методов психологического исследования: рассматривается только экспериментальный метод или и другие подходы к сбору эмпирических данных, сравнивается ли проведение экспериментов в специально созданных и «полевых» условиях, учитываются ли при представлении экспериментальных схем возможные схемы обработки данных и т.д.

При обсуждении типов экспериментов были представлены содержательные критерии, позволяющие оценить разнообразие экспериментальных процедур при проверке психологических гипотез. На основе оценивания соответствия НП, ЗП и ДП моделируемым реальным условиям или теоретическим конструктам выделялись следующие типы экспериментов: естественные, искусственные и лабораторные. Остановимся на трех других критериях, позволяющих структурировать сведения из области формального планирования экспериментов.

Первый из них – это критерий строгого, или истинного, эксперимента, по отношению к которому можно выделить так называемые доэкспериментальные, экспериментальные и квазиэкспериментальные планы. Дж. Кэмпбелл связывает выделение истинных экспериментальных исследований с возможностью рандомизации, т.е. случайного распределения разных уровней НП по экспериментальным и контрольным условиям, а также с допущением об эквивалентности состава групп испытуемых. Рандомизацией называется также стратегия случайного отбора испытуемых в группы из популяции. Случайным (рандомизированным) может быть также подбор испытуемых в группы, когда потенциальные участники эксперимента уже выбраны и требуется только распределить их в экспериментальную и контрольную группы. Случайная стратегия может быть направлена также на отбор групп испытуемых (например, учебных). Строгим критерием является именно случайный отбор испытуемых из популяции, решающий одновременно проблему репрезентативности выборки испытуемых и обеспечения эквивалентных по своему составу групп.

Сравнение групп, являющихся эквивалентными по всем факторам, кроме экспериментального воздействия, позволяет рассматривать сдвиг в значениях ЗП при сравнении экспериментального и контрольного условий именно в связи с воздействием этого фактора. Достижение желаемой эквивалентности означает здесь контроль источников угроз внутренней валидности со стороны факторов межиндивидуальных различий.

Второй критерий – это число осуществляемых экспериментальных воздействий. В соответствии с ним принято различать планы с одной независимой переменной и так называемые факторные планы (с двумя и более НП). Сколько бы факторов ни изменялось в моделируемой экспериментальной ситуации, каждый из них должен быть оценен с точки зрения шкалы, в которой представлены изменения переменной. Напомним, что это могут быть шкалы наименований, порядка, интервалов или отношений.

Третий критерий – разделение экспериментальных схем на качественные и количественные – связан с учетом шкалы, в которой измерена МП. Качественными называются обычно эксперименты, в которых уровни НП заданы в классификационных признаках. Если между условиями НП может быть показано не только качественное различие, но и порядок в величине учитываемого признака, то это позволяет переходить к количественному эксперименту.

Использование количественных изменений НП означает переход к многоуровневому эксперименту, который далее будет представлен как вариант факторного. Квазиэкспериментальным исследованиям и факторным экспериментам посвящены отдельные главы. В данном разделе рассматриваются наиболее простые однофакторные экспериментальные схемы.

Четвертый критерий – осуществление эксперимента в соответствии с интраиндивидуальными или межгрупповыми схемами предъявлений условий НП. В специальном разделе уточнены возможные схемы контроля угроз валидности при реализации этих планов.

Для представления примеров экспериментальных схем как планов организации экспериментальных воздействий введем общепринятые обозначения. Экспериментальный фактор, или НП, может выступать синонимом Х-воздействия. В экспериментальных схемах это выглядит так:

Х – НП без указания уровней; X' и X" – два уровня НП (если ограничиться дихотомической переменной); Х1, X2, ..., Хn – n уровней экспериментального фактора;

R – рандомизация, т.е. случайный порядок предъявления проб (как уровней НП) в последовательности либо случайная стратегия образования групп (случайная выборка из популяции или случайное распределение имеющейся выборки на группы испытуемых);

О – измерение (наблюдение) психологического показателя, или зависимой переменной; в случае предварительного тестирования появляются индексы, например О'ХО" или согласно номерам выборок О1, О2 и т.д.

Уже использованный способ обозначения разных уровней НП прописными буквами латинского алфавита вновь появится в резюме интраиндивидуальных схем: ABC и т.д. Так, схемы ABC и СВА указывают отличия порядка предъявления трех уровней основной НП. Сам порядок следования уровней А, В и С выступит вторым – производным – экспериментальным фактором.

Порядок условий НП одновременно является и планом измерения ЗП. Кроме того, как это имеет место в плане, называемом «временные серии», сам фактор времени может присутствовать в схеме в качестве подразумеваемой переменной или Х-воздействия. В лонгитюдном исследовании контроль фактора времени предполагается специальными схемами, которые представлены в пособии, раскрывающем специфику квазиэкспериментов как психологических исследований, тяготеющих к экспериментальному методу [43].

При разработке экспериментальных схем следует помнить о возможной неидентичности плана проведения эксперимента и плана обработки данных. Выбрать адекватную схему представления данных – это специальная проблема спецификации психологических гипотез с точки зрения анализа допустимых форм статистических решений об экспериментальных эффектах.

Доэкспериментальные планы

Анализ единичного случая

Самой простой и неудачной схемой в психолого-педагогических исследованиях Дж. Кэмпбелл называет план «только X», или ХО, т.е. случай, когда нет контрольного условия или контрольной группы, а ЗП измеряется после организации экспериментального воздействия в экспериментальной группе.

Допустим, автор нового метода обучения желает показать его преимущества на одной академической группе. Часто педагогические «эксперименты» выглядят именно так. В этом случае исследователь, конечно, сравнивает результаты данной экспериментальной группы с «обычными» результатами, т.е. с известными показателями ЗП (или О), или с другими мыслимыми группами, в которых ситуация обучения является традиционной. Если он не использует никаких форм экспериментального контроля (в первую очередь как сравнение реализованных условий с разными уровнями НП), то выводы могут не выдержать критики с точки зрения конкурирующих объяснений. Приведем часть возможных возражений, ставящих под сомнение достоверность таких результатов:

q возможно, в выбранной (и единственной) группе изначально были более сильные студенты;

q возможно, само понимание учащимися, что с ними экспериментируют, заставило их заниматься более усердно;

q возможно, более высокий результат обучения нужно связывать с личностью преподавателя: он как энтузиаст «выкладывается» в большей степени, чем коллеги, в частности, вследствие искренней веры в успех своего метода и т.д.

В любом случае объяснение преимущества нового метода обучения не выдерживает критики из-за отсутствия элементарных форм экспериментального контроля. Иными словами, используемый метод, возможно, действительно ведет к лучшим результатам, но этому нет доказательств в силу многообразия конкурирующих гипотез о других переменных, которые могли обусловить изменения ЗП.

Отдельной проблемой является возможность приписывания изучаемой реальности тех свойств, которые на самом деле ей не присущи, нехарактерны, но исследователь выделяет их именно в силу предполагаемого контекста сопоставления с мысленной группой «эквивалентных» случаев (в МЭ).

Другое понимание метода анализ единичного случая связано с реализацией задачи подготовки психологического заключения о свойствах конкретного человека, т.е. задачи обследования. В этом случае не представлена организация уровней определенной НП, а использование психологических методик включает и актуализацию исследуемых процессов, и психодиагностическую направленность последующих заключений. Описание и объяснение психологических свойств конкретного субъекта строятся путем проверки множества гипотез, выбор которых направляется ситуацией в рамках задачи описания индивидуального случая (ситуация добровольного «клиента», принудительной экспертизы и пр.). Одновременно анализ единичного случая базируется на теории, призванной применительно к используемому методическому средству (методики, способ задания экспериментальной ситуации) задать систему ориентиров для обсуждения актуализируемых свойств и процессов. Показатели по отдельной психологической методике сопоставляются при этом в рамках мысленного эксперимента с другими известными или теоретически предполагаемыми случаями. Совокупность используемых методических приемов позволяет психологу определиться в том, насколько типичными или, напротив, специфичными выглядят индивидуальные особенности человека (его познавательной, личностной сферы).

Следует учесть три проблемы, встающие при интерпретации данных в так организованном исследовании-обследовании.

Во-первых, при анализе индивидуального случая предполагается сочетание проверки исследовательских и психодиагностических гипотез. В качестве нормативных показателей могут выступать любые ранее установленные закономерности, связываемые с использованием методики на определенных выборках. Являясь экспериментальными результатами для ранее проведенных экспериментов, те же экспериментальные зависимости могут рассматриваться в качестве критериев отличия обследуемого субъекта. Включение в обследование интраиндивидуального эксперимента – возможный, но не обязательно используемый прием получения данных о познавательной или личностной сфере человека при анализе индивидуального случая. Обобщение будет распространяться именно на обследуемого человека, но этим может ограничиваться сходство с интраиндивидуальными экспериментами, проводимыми в практических целях.

Сами психологические гипотезы не обязательно будут выступать в качестве причинно-следственных. Система умозаключений эксперта, сочетающая ориентиры на знание теоретических зависимостей и догадок, направляющих построение гипотез об индивидуальном случае, может подчас быть единственным и незаменимым основанием его выводов, которые не являются нормативными и не могут быть охвачены схемами проверки отдельных экспериментальных гипотез.

Во-вторых, использование этого метода может базироваться либо на проверке одной теоретической интерпретации наблюдаемых (выявляемых) психологических свойств, либо предполагать конкурирующие теоретические объяснения, либо вообще обходиться без таковых. Трудность заключается в том, что исследователь не имеет заранее ограничений в поле психологических гипотез, которые могут быть отнесены к данному случаю (как наиболее соответствующие его индивидуальности, его специфике). Если в экспериментальном исследовании экспериментальная и контргипотеза заранее определены, то в ситуации обследования одна диагностическая гипотеза может сменять другую, одно выявленное свойство может натолкнуть на гипотезу о другом и т.д.

Задания, выполнение которых требуется от испытуемого, выступают при этом в качестве функциональных проб. Обычно используется ряд таких методических приемов, каждый из которых нацелен на актуализацию определенных процессов и позволяет проводить анализ в направлении гипотез об их представленности у конкретного испытуемого. За использованием той или иной функциональной пробы как бы просматривается направленность связанных с ними гипотез, но выбор их не определен. Один и тот же процесс, не отличающийся от нормативных данных для одной пробы, может проявить специфику в другой пробе.

В-третьих, поскольку заранее обычно неизвестно, что для данного индивидуального случая может оказаться наиболее характерным (сущностным), опыт и интуитивная ориентировка выступают не менее важными регуляторами определения общего психологического и конкретного методического воплощения предположений исследователя. Выбор гипотез и экспериментальных заданий зависит также от знания психологом контекста жизненной ситуации испытуемого, конкретного повода для проведения обследования, целей последующих прогнозов, предварительно возникших предположений о том, что нужно выявить, и т.д.

Наши рекомендации