Экспериментального исследования
Соответствие идеального эксперимента реальному выражается в такой его характеристике, как внутренняя валидность (validity) — достоверность результатов, которую обеспечивает реальный эксперимент по сравнению с идеальным. Внутренняя валидность характеризует меру влияния на изменение зависимой переменной тех условий (независимой переменной), которые варьирует экспериментатор
Чем больше влияют на изменение зависимой переменной неконтролируемые исследователем условия, тем ниже внутренняя валидность эксперимента. Следовательно, больше вероятность того, что факты, обнаруженные в эксперименте, являются артефактами.
Планирование эксперимента необходимо для выявления влияния независимой переменной на зависимую за счет контроля других переменных. Переменные, являющиеся источником артефактов, либо устраняются, либо их влияние усредняется (за счет смешения и погашения изменчивости условий эксперимента). Высокая внутренняя валидность — главный признак хорошего эксперимента (близко к «безупречному эксперименту»).
Не все переменные, влияющие на результат исследования, можно учесть или исключить (элиминировать). Те из них, которые нарушают внутреннюю валидность, называют «побочными». К числу побочных, полностью не устранимых переменных относят влияние фактора времени, фактор задачи, фактор индивидуального различия.
Рассмотрим более подробно центральное понятие «валидность». Обратимся к системе отношений «эксперимент—теория—реальность». На основе теории выдвигается гипотеза, которая в конечном счете и проверяется в эксперименте. Методики и план эксперимента должны соответствовать проверяемой гипотезе — степень этого соответствия и характеризует операциональную валидность. Внутренняя валидность тем выше, чем больше вероятность того, что экспериментальный эффект (изменение зависимой переменной) вызван изменением независимой переменной.
Эксперимент должен воспроизводить внешнюю реальность. Эксперимент, который полностью воспроизводит внешнюю реальность, называется экспериментом полного соответствия. Разумеется, в реальности полное соответствие недостижимо. Мера соответствия экспериментальной процедуры реальности характеризует внешнюю валидность эксперимента.
Дополнительные переменные, которые требуют учета в эксперименте, влияют на внешнюю валидность. Если от внутренней валидности зависит достоверность экспериментальных результатов, то от внешней — переносимость результатов из лабораторных условий на реальные процессы и обобщение их на другие сферы реальности.
Кэмпбелл отмечает, что установление внутренней валидности требует отбраковывания альтернативных объяснений связи между зависимой и независимой переменными.
Внутренняя валидность является непременным условием любого эксперимента Кэмпбелл выделил восемь основных факторов, нарушающих внутреннюю валидность эксперимента. Перечислим их. Первую группу можно назвать факторами выборки:
1. Селекция — неэквивалентность групп по составу, которая вызывает систематическую ошибку в результатах.
2. Статистическая регрессия — частный случай ошибки селекции, когда группы отбирались на основе «крайних» показателей (иначе — корреляция из-за неоднородности группы).
3. Экспериментальный отсев — неравномерное выбывание испытуемых из сравниваемых групп, приводящее к неэквивалентности групп по составу.
4. Естественное развитие — изменение испытуемых, являющееся следствием течения времени, без связи с конкретными событиями изменение состояния (голод, усталость, болезнь и др.), свойств индивида (возрастные перемены, накопление опыта и др.).
Вторая группа — побочные переменные, влияние которых приводит к следующим эффектам:
1. Эффект «истории»— конкретные события, происходящие в период между начальным и итоговым тестированием помимо экспериментального воздействия.
2. Эффект тестирования — влияние предварительного тестирования на результат итогового.
3. Инструментальная погрешность — определяется надежностью метода фиксации поведения испытуемого, т. е. надежностью теста.
4. Взаимодействие факторов: отбора; естественного развития; истории (разные истории экспериментальных групп) и др.
Экспериментальный план для проведения исследования
План для двух рандомизированных групп с предварительным и итоговым тестированием. Рассмотрим структуру этого плана.
Группы | Начало эксперимента | Конец эксперимента |
ЭГ | Х1 | X2 |
КГ | Y1 | Y2 |
План с предварительным тестированием пользуется популярностью у психологов. Психолог прекрасно знает, что каждый человек своеобразен и отличен от других, и подсознательно стремится уловить эти различия с помощью тестов, не доверяя механической процедуре рандомизации. Однако гипотеза большинства психологических исследований, особенно в области психологии развития («формирующий эксперимент»), содержит прогноз определенного изменения свойства индивида под влиянием внешнего фактора. Поэтому план «тест—воздействие—ретест» с применением рандомизации и контрольной группой очень распространен.
Главный источник артефактов, нарушающий внешнюю валидность процедуры, — взаимодействие тестирования с экспериментальным воздействием. Например, тестирование уровня знаний по определенному предмету перед проведением эксперимента по заучиванию материала может привести к актуализации исходных знаний и к общему повышению продуктивности запоминания. Достигается это за счет актуализации мнемонических способностей и создания установки на запоминание.
Однако с помощью этого плана можно контролировать другие внешние переменные. Контролируется фактор «истории» («фона»), так как в промежутке между первым и вторым тестированием обе группы подвергаются одинаковым («фоновым») воздействиям. Вместе с тем Кэмпбелл отмечает необходимость контроля «внутригрупповых событий», а также эффекта неодновременности тестирования в обеих группах.
Обычно контроль неодновременности тестирования осуществляют два экспериментатора, проводящие тестирование двух групп одновременно. Оптимальной считается процедура рандомизации порядка тестирования: тестирование членов экспериментальной и контрольной групп производится в случайном порядке. То же самое делается и с предъявлением – не предъявлением экспериментального воздействия. Разумеется, такая процедура требует наличия значительного числа испытуемых в экспериментальной и контрольной выборках (не менее 30–35 человек в каждой).
Естественное развитие и эффект тестирования контролируются за счет того, что они одинаково проявляются в экспериментальной и контрольной группах, а эффекты состава групп и регрессии контролируются при помощи процедуры рандомизации.
При обработке данных обычно используются параметрические критерии t (Стьюдента) и F (Фишера). Вычисляются три значения t: сравнение 1) X1 и Y1 ; 2) X2 и Y2; 3) X1 и X2. Гипотезу о значимом влиянии независимой переменной на зависимую можно принять в том случае, если выполняются два условия: а) различия между X2 и Y2 значимы, а между X1 и Y1— незначимы и б) различия между X1 и X2 значимы. Гораздо удобнее сравнивать не абсолютные значения, а величины прироста показателей от первого тестирования ко второму (δ(i)). Они сравниваются по t-критерию Стьюдента. В случае значимости различий принимается экспериментальная гипотеза о влиянии независимой переменной на зависимую.
Рекомендуется также применять ковариационный анализ по Фишеру. При этом показатели предварительного тестирования берутся в качестве дополнительной переменной, а испытуемые разбиваются на подгруппы в зависимости от показателей предварительного тестирования.
Применение плана «тест—воздействие—ретест» позволяет контролировать влияние «побочных» переменных, нарушающих внутреннюю валидность эксперимента.
Внешняя валидность связана с возможностью переноса данных на реальную ситуацию. Главным же моментом, отличающим экспериментальную ситуацию от реальной, является введение предварительного тестирования. Как мы уже отметили, план «тест—воздействие—ретест» не позволяет контролировать эффект взаимодействия тестирования и экспериментального воздействия: предварительно тестируемый испытуемый «сенсибилизируется» – становится более чувствительным к воздействию, так как мы измеряем в эксперименте именно ту зависимую переменную, на которую собираемся воздействовать с помощью варьирования независимой переменной.
Доэкспериментальные и квазиэкспериментальные планы
Между доэкспериментальными и квазиэкспериментальными планами есть одно существенное различие. Доэкспериментальные планы являются «вчерашним днем» психологической науки. Между тем как квазиэкспериментальное планирование – атрибут ее сегодняшнего и, по мнению многих исследователей, завтрашнего дня.
Доэкспериментальные планы, точнее – исследования, которые проводились и проводятся до сих пор по определенным схемам, не учитывают требований, предъявляемых к плану классического экспериментального исследования. Причина – незнание этих требований или невозможность их учета при проведении реального исследования в конкретных условиях. Исследования по схеме доэкспериментальных планов проводились еще до возникновения теории планирования эксперимента.
Доэкспериментальные планы служат, скорее, в качестве иллюстрации. В практике научных исследований по возможности их следует избегать.
Доэкспериментальные планы можно использовать только для пилотажных (пробных) экспериментов:
-исследования отдельных случаев – любой случай может быть исключением из правил, а не правилом. Но в некоторых направлениях психологии (в клинической, психотерапии) анализ отдельных случаев используется;
-план с предварительным и итоговым замером зависимой переменной:
1 гр. (э) О1 х О2
О1 – предварительный замер, х – воздействие, О2 – итоговый замер после воздействия
Недостаток – отсутствует контроль, мы не знаем, как будут вести себя показания испытуемого в естественных условиях.
-сравнение статистических групп
1 гр. (э) х О1
2 гр. (к) - О2
х – воздействие, О1 – итоговый замер после воздействия, - - отсутствие воздействия, О2 – замер без воздействия у другой группы
Недостаток – отсутствует начальный замер.
Квазиэкспериментальные планы являются попыткой учета реалий жизни при проведении эмпирических исследований. Условия, в которые ставит жизнь, а также практические задачи экспериментаторов не всегда позволяют реализовать планы «истинных экспериментов», использовать схемы контроля внешних переменных. Однако научные и научно-прикладные задачи нужно решать. Квазиэкспериментальные планы создаются специально с отступлением от схемы «истинного эксперимента». Исследователь осознает те источники артефактов – внешние переменные, которые он не может контролировать. Для частичной компенсации и контроля эффектов, возникающих при нарушении планов «истинных экспериментов», исследователи используют искусственные схемы, которые и называются квазиэкспериментальными планами.
Квазиэксперимент является своеобразным компромиссом между реальностью и «строгостью» методологических предписаний. Однако квазиэксперимент используется не только для решения прикладных проблем, но и для проведения научных исследований. Наиболее авторитетные авторы, чьи работы стали классическими, Кокс и Кэмпбелл, сформулировали основные теоретические принципы квазиэкспериментального планирования. Квазиэкспериментальный план используется тогда, когда применение лучшего плана невозможно.
Квазиэксперимент проводится с учетом большинства требований предъявляемых к классическому эксперименту. Допускаются лишь незначительные отступления от правил. Чаще всего нарушается требование обязательного выравнивания испытуемых в опытной и контрольной группах. Квазиэксперименты очень распространены в науке. Они позволяют получить достаточно надежные данные, и не трудны в организации:
-План дискретных временных серий
Участвует 1 группа испытуемых, но многократно.
На этой группе чередуются опытные и контрольные замеры
О1О2О3 х О4О5О6
О1О2О3 - замер до воздействия, х – воздействие, О4О5О6 – замер после воздействия
-Сравнение 2-х неэквивалентных групп
1 гр. (э) О1 х О2
2 гр. (к) О3 - О4
План очень хороший, но есть недостаток – группы не эквивалентны. Возможно они отличаются изначально по какому то психологическому качеству, способному повлиять на результаты эксперимента.