Корреляционное исследование
Корреляционным называется исследование, проводимое для подтверждения или опровержения гипотезы о статистической связи между несколькими (двумя и более) переменными или статистически достоверном влиянии их друг на друга. При этом предположения о причинной зависимости не обсуждаются. "Корреляция" в прямом переводе означает "соотношение". Если изменение одной переменной сопровождается изменением другой, то можно говорить о корреляции этих переменных. Наличие корреляции двух переменных ничего не говорит о причинно-следственных зависимостях между ними, но дает возможность выдвинуть такую гипотезу. Отсутствие же корреляции позволяет отвергнуть гипотезу о причинно-следственной связи переменных. Различают несколько интерпретаций наличия корреляционной связи между двумя измерениями:
1. Линейная корреляционная связь. Уровень одной переменной непосредственно соответствует уровню другой.
2. Корреляция, обусловленная 3-й переменной. Две переменные (а, с) связаны одна с другой через 3-ю (Ь), не измеренную в ходе исследования. По правилу транзитивности, если! есть К (а, Ь) и К (Ь, с), то К (а, с).
3. Случайная корреляция, не обусловленная никакой переменной.
4. Корреляция, обусловленная неоднородностью выборки.
Корреляционные связи различаются по своему виду. Если ли повышение уровня одной переменной сопровождается повышением уровня другой, то речь идет о положительной корреляции. Если рост уровня одной переменной сопровождается снижением уровня другой, то мы имеем дело с отрицательной корреляцией. Нулевой называется корреляция при отсутствии линейной связи переменных, при этом не исключается тесная нелинейная связь переменных.
Математическую теорию линейных корреляций разработал К. Пирсон. Ее основания и приложения излагаются в соответствующих учебниках и справочниках по математической статистике. Напомним, что коэффициент линейной! корреляции Пирсона г варьируется от -1 до +1. Достоверность коэффициента корреляции зависит от принятого уровня значимости и от величины выборки. Чем больше модуль коэффициента корреляции, тем ближе связь переменных к линейной функциональной зависимости.
При корреляционном исследовании все измеряемые переменные - зависимые. Управляемым фактором, определяющим эту зависимость, может быть одна из переменных или скрытая, неизмеряемая переменная. Тестируемые группы должны быть в эквивалентных неизменных условиях.
Выбор меры связи определяется шкалой, с помощью которой произведены измерения.
1. Данные представлены в порядковой шкале. Мерой связи, которая соответствует шкале порядка, является коэффициент Кэнделла. Он основан на подсчете несовпадений в порядке следования ранжировок для двух переменных (X и У).
Часто для обработки данных, полученных с помощью шкалы порядка, используют коэффициент ранговой корреляции Спирмена, который является модификацией коэффициента Пирсона для натурального ряда чисел (рангов). Его рекомендуют применять в том случае, если одно измерение произведено по шкале порядков, а другое - по шкале интервалов.
2. Данные получены по шкале интервалов или отношений. В этом случае применяется параметрические методы статистики - коэффициент корреляции Пирсона или коэффициент ранговой корреляции Спирмена. В том случае, если одна переменная является дихотомической, а другая - интервальной, используется так называемый бисериальный коэффициент корреляции.
3. Если связи между переменными нелинейны, вычисляется корреляционное отношение, характеризующее величину нелинейной статистической зависимости двух переменных.
Корреляционное исследование завершается выводом о статистической значимости установленных (или неустановленных) зависимостей между переменными.
Корреляционное исследование разбивается на серию независимых друг от друга измерений в группе испытуемых (И). Различают простое и сравнительное корреляционные исследования. В первом случае группа испытуемых однородна.Пример. Из числа студентов можно сформировать выборку. Затем последовательно определить у них ряд показателей (рост, массу, результат в жиме лежа, прыжок в длину с места), затем выполнить корреляционный анализ. В этом случае воздействие оказывалось на одну и ту же выборку испытуемых (однородная группа).
Во втором случае мы имеем несколько рандомизированных групп, различающихся по одному или нескольким опре- ! деленным критериям.
Пример. Из числа студентов можно сформировать две выборки. Обе группы тестируются, затем одна группа выполня- ; ет упражнение до локального утомления и снова тестируется, другая группа тестируется второй раз без выполнения упражнений до утомления. В этом случае производится сравнение показателей до и после упражнений до утомления (однород-ная группа), сравнение показателей после эксперимента у од-ной и другой групп (разнородные, неоднородные группы).
В общем виде план такого исследования описывается ма- I трицей вида: ИхО (испытуемые х опыт), где данные каждого I испытуемого располагаются по строкам, а данные конкрет- | ного теста или показателя - по столбцам. Данную матрицу I можно обработать с помощью корреляционного анализа. Об- { работку данных можно вести по строкам исходной матрицы | или столбцам. Коррелируя между собой строки, мы сопоставляем друг с другом испытуемых; корреляции же интерпретируются как коэффициенты сходства-различия людей между собой. И-корреляции можно вычислять лишь в том случае, если данные приведены к одной шкальной размерности, | в частности с помощью 2-преобразования:
Коррелируя между собой столбцы, мы проверяем гипо-1 тезу о статистической связи измеряемых переменных (0). В [ этом случае их размерность не имеет никакого значения, поскольку процедура корреляционного анализа выполняет | нормирование или 2-преобразование в пределах каждой пе-1 ременной. Такое исследование называется структурным, I так как в итоге мы получаем матрицу корреляций измерен- [ ных переменных, которая выявляет структуру связей между ними.
В лонгитудных исследованиях выявляются временные корреляции параметров либо определяются изменения структуры корреляций параметров во времени. План лонгитуд-ного исследования представляет собой серию отдельных замеров одной или нескольких переменных через определенные промежутки времени. Время (В) в лонгитудном исследовании интерпретируется исследователем как независимая переменная, определяющая уровень зависимых. Полный план корреляционного исследования представляет собой параллелепипед ИхОхВ, грани которого обозначаются как "испытуемые", "операции", "временные этапы". Результаты исследования можно анализировать по-разному. Помимо вычисления И- и О-корреляций возникает возможность сравнения матриц ИхО, полученных в разные периоды времени, путем подсчета двухмерной корреляции - связи двух переменных с третьей. То же самое касается и матриц ИхВ и ВхО. Но чаще исследователи ограничиваются обработкой другого типа, проверяя гипотезы об изменении переменных во времени, анализируя матрицы ИхВ по отдельным измерениям.
2.3.6. Основные типы корреляционного исследования
1. Сравнение двух групп. Этот план лишь условно можно отнести к корреляционным исследованиям. Он применяется для установления сходства или различия двух естественных или рандомизированных групп по выраженности того или иного свойства или состояния. Средние результаты в шкале интервалов и отклонений у двух групп сравниваются, например, с помощью {,-критерия Стьюдента.
Пример. Целью педагогического эксперимента, проведенного А.В. Зубковой (1996), была проверка методики применения учебно-диагностического компьютерного комплекса для обучения и оценки уровня знаний различных групп учащихся ИФК по основным разделам профилирующих дисциплин учебного плана с использованием имитационного моделирования. Были сформированы экспериментальная и контрольная группы. Разница в распределении учебного материала в этих группах состояла в увеличении до 45% учебного времени самостоятельной работы студентов на ПЭВМ с использованием имитационного моделирования тренировочного процесса в ущерб лекционному материалу и традиционной программы обучения в экспериментальной группе. Анализ результатов эксперимента показал, что уровень теоретических знаний учащихся экспериментальной группы достоверно (р<0,05) отличается от уровня знаний учащихся контрольной группы, обучавшихся по традиционной методике. Следовательно, в условиях эксперимента имелся систематический сдвиг, а значит, и корреляция, в состоянии теоретических знаний у группы испытуемых до и после педагогического воздействия, тогда как в условиях обычной подготовки статистически достоверных изменений не произошло, а значит, этот фактор не влияет на переменные.
Простейшее сопоставление двух групп содержит в себе источники ряда артефактов, характерных для корреляционного сравнительного исследования. Во-первых, возникает проблема организации групп - они должны четко разделяться по степени влияния фактора. Во-вторых, реальные измерения происходят не одновременно, а разновременно:
Эффект неодновременности измерений в двух группах (в случае предположения о значимости изучаемого фактора) можно было бы "убрать" введением двух контрольных групп, но ведь тестировать их тоже придется в другое время. Удобнее разделить первоначальные группы пополам и тестирование (по возможности) провести по следующему плану:
Обработка результатов для выявления эффекта последовательности осуществляется методом двухфакторного дисперсионного анализа 2x2. Сравнение естественных (нерандомизированных) групп ведется по тому же плану.
2. Одномерное исследование одной группы в разных условиях. План этого исследования аналогичен предыдущему.В случае корреляционного исследования мы не управляем
уровнем независимой переменной, а лишь констатируем изменение поведения индивида в новых условиях.
Главные артефакты этого плана - кумуляция эффектов последовательности и тестирования. Кроме того, искажающее влияние на результаты может оказывать временной фактор (эффект естественного развития).
Схема этого плана выглядит очень просто: А 01 В 0г, где А и В - разные условия. Испытуемые могут отбираться из генеральной популяции случайным образом или представлять собой естественную группу.
Обработка данных сводится к оценке сходства между результатами тестирования в условиях А и В. Для контроля эффекта последовательности можно произвести разделения групп и перейти к корреляционному плану для двух подгрупп:
В этом случае мы можем рассматривать А и В как воздействия, а план - как неполный.
Пример. Наиболее часто этот план эксперимента используется при анализе дневников подготовки членов сборных национальных команд. При анализе дневников определяют показатели объема и интенсивности различных средств подготовки, а также результаты основных и контрольных стартов, педагогического и медико-биологического тестирования. В результате можно получить как корреляционные взаимосвязи на каждом временном интервале (И-О), так и взаимосвязь изменений во времени (О-В). В первом случае определяется особенность связей между показателями (структура). Во втором случае - устойчивость структуры взаимосвязей между показателями во времени. Фактором - независимой переменной - является время, а точнее, педагогический процесс.
3. Корреляционное исследование попарно эквивалентных групп. Этот план используется при исследовании близнецов методом внутрипарных корреляций. Дизиготные илимонозиготные близнецы разбиваются на две группы: в каждой - один близнец из пары. У близнецов обеих групп измеряют интересующие исследователя психические параметры. Затем вычисляется корреляция между параметрами (О-кор-реляция) или близнецами (Р-корреляция). Существует множество более сложных вариантов планов психогенетических исследований близнецов.
Пример. В специальной серии экспериментов, проведенной Т.А. Пантелеевой (1977), изучалась генотипическая обу- I словленность времени простой двигательной реакции на сти- I мулы разной интенсивности (звуковой сигнал частотой 1000 I Гц и интенсивностью 40, 60, 80, 100 и 120 дБ над уровнем [ 0,0002 бара) в разные периоды онтогенеза. В серии приняли участие дети 9-11 лет (по 20 пар моно- и дизиготных близне- I цов, 48 человек - неродственников), 13-16 лет (также по 20 I пар моно- и дизиготных близнецов, 44 человека - неродст- I венников) и взрослые 33-56 лет (23 пары монозиготных и 20 I пар дизиготных близнецов, 40 человек - неродственников). В I младшей и старшей группах была зафиксирована завися- I мость индивидуальных особенностей времени реакции от на- I следственных детерминантов, в подростковом возрасте эта зависимость не установлена.
4. Для проверки гипотезы о статистической связи не-1 скольких переменных, характеризующих поведение, прово- I дится многомерное корреляционное исследование. Оно реа- I лизуется по следующей программе. Отбирается группа, кото- I рая представляет собой либо генеральную совокупность, ли-1 бо интересующую нас популяцию. Отбираются тесты, прове-1 ренные на надежность и внутреннюю информативность. За-1 тем группа тестируется по определенной программе: Е А (О.) В (0.) С (Оз) Б(04} ... N(0,,),
где А, В, С... N - тесты, 0.. - операция тестирования.
Данные исследования представлены в форме матрицы: I 1*п, где 1; - количество испытуемых, п - тесты. Матрица "сы-1 рых" данных обрабатывается, подсчитываются коэффициен-1 ты линейной корреляции. Получается матрица вида п*п, где I п - число тестов. Корреляции оцениваются на статистиче-1 ские различия следующим образом: сначала г переводится в I 2-оценки, затем для сравнения г применяется ^-критерий! Стьюдента. Значимость корреляции оценивается при ее сопо-1 ставлении с табличным значением. При сравнении г» кспер. И КГтеор. принимается гипотеза о значимом отличии корреляции от случайной при заданном значении точности с = 0,05 или а = 0,001).
В ходе применения этого плана могут возникать следующие артефакты.
- Эффект последовательности - предшествующее выполнение одного теста может повлиять на результат выполнения другого.
- Эффект научения - при выполнении серии различных тестовых испытаний у участника эксперимента может повышаться компетентность в тестировании.
- Эффекты фоновых воздействий и "естественного" развития приводят к неконтролируемой динамике состояния испытуемого в ходе исследования.
- Взаимодействие процедуры тестирования и состава
группы проявляется при исследовании неоднородной группы.
Пример. В результате корреляционного анализа А.В. Левченко (1982) выявил показатели силовой и скоростно-силовой подготовленности, оказывающие наибольшее влияние на спортивный результат в беге на короткие дистанции. Для изучения структуры специальной силовой подготовленности спринтеров обследовано 50 спринтеров различной квалификации, имеющих результаты в беге на 100 м в диапазоне от 11,2 до 10,1 с. У спортсменов старших и младших разрядов установлена сильная зависимость величины максимальной скорости бега, времени бега на 30 м со старта от уровня развития стартовой и взрывной силы мышц разгибателей ноги и подошвенных сгибателей стопы, относительной силы мышц подошвенных сгибателей стопы, результатов в десятикратном прыжке с места, времени преодоления прыжками дистанции 30 м. Итоговым результатом таких исследований становится эмпирический закон, который выражается в виде линейного регрессионного уравнения У = ао + XI • &1 + Хг • аа + ...+ Хм • гы, точность предсказания которого оценивается по коэффициенту множественной корреляции и по стандартному отклонению функции (У).
5. Структурное корреляционное исследование. От предшествующих вариантов эта схема отличается тем, что исследователь выявляет не отсутствие или наличие значимых корреляций, а различие в уровне значимых корреляционных зависимостей между одними и теми же показателями, измеренными у представителей различных групп.
Пример. В исследованиях Б.С. Шенкмана (1999) при сравнении капилляризации т.уавЪиз 1а1егаИз у спортсменов с различным тренировочным статусом обнаружено, что у спортсменов данной спортивной специализации, не так далеко отстоящих друг от друга по уровню квалификации, достоверных отличий по количеству капилляров на волокно не наблюдается. Однако, отличия по количеству каппиляров на волокно становятся достоверными при существенной разнице в уровнях квалификации. Выявление взаимосвязей между исходными уровнями капилляризации и их изменениями за время тренировки позволяет автору предположить, что в группах спортсменов, тренирующихся на выносливость, ка-пилляризация колеблется вокруг зоны оптимальных значений, характерных для данного уровня нагрузок.
6. Лонгитудное корреляционное исследование. Воздействующей переменной экпериментатор, проводящий лонгитудное исследование, считает время. Оно является аналогом плана тестирования одной группы в разных условиях. Только условия считаются константными. Результатом любого временного исследования (в том числе и лонгитудного) является построение временного тренда измеряемых переменных, которые могут быть аналитически описаны теми или иными функциональными зависимостями.
Лонгитудное корреляционное исследование строится по плану временных серий с тестированием группы через заданные промежутки времени. Помимо эффектов обучения, последовательности и т.д. в лонгитудном исследовании следует учитывать эффект выбывания: не всех испытуемых, первоначально принимавших участие в эксперименте, удается обследовать через какое-то определенное время. Возможно взаимодействие эффектов выбывания и тестирования (отказ от участия в последующем обследовании) и т.д.
Пример. В педагогическом эксперименте, проведенном О.Н. Шестеркиным (2000), приняло участие в общей сложности 14 игроков в настольный теннис II-III спортивных разрядов. Проверялась методика совершенствования техники ударов справа и слева. Программа состояла из 11 микроциклов по 3 тренировочных занятий в каждом. По окончанию каждого занятия выполнялось тестирование, во время которого испытуемые выполняли серию из 20 ударов справа и слева по мишени на теннисном столе. Определялось количество попаданий в цель. Показано, что через определенный период времени происходит стабилизация этого показателя, что является маркером для данной группы испытуемых, что закончилось совершенствование технического элемента - удара.
Планы для одной независимой переменной и нескольких групп
При исследованиях, в которых необходим либо контроль внешних переменных, либо выявление количественных зависимостей между переменными, сравнение двух групп недостаточно для подтверждения или опровержения экспериментальной гипотезы.
Для контроля внешних переменных используются различные варианты факторного экспериментального плана.
Для определения линейной зависимости между двумя переменными следует иметь хотя бы три точки, соответствующие трем уровням независимой переменной. В этом случае необходимо выделить несколько рандомизированных групп и поставить их в различные экспериментальные условия.
Простейшим вариантом является план для трех групп и трех уровней независимой переменной:
Эксперимент 1: R Xi 0i
Эксперимент 2: R Xi 0г
Контроль: R - Оз
, где R- рандомизация, X - уровень фактора, 0 - опыт (отклик)
Контрольная группа в данном случае - это третья экспериментальная группа, для которой уровень переменной X = 0.
При реализации этого плана каждой группе предъявляется лишь один уровень независимой переменной. Возможно и увеличение числа экспериментальных групп соответственно числу уровней независимой переменной. Для обработки данных, полученных с помощью такого плана, применяется дисперсионный анализ.
Пример. Назаров А.П. (1998) изучал построение тренировочного процесса в прыжках с шестом на этапах предварительной подготовки и начальной спортивной специализации. В педагогическом эксперименте у него приняли участие 36 юных прыгунов с шестом, разделенных на три группы. До начала эксперимента не было достоверных различий (р>0,01) между участниками эксперимента.
Группа А. Тренировочная программа строилась по программе ДЮСШ. Спортсмены обучались прыжкам только на прямом шесте до тех пор, пока не достигли уровня результатов 3,40-3,60 м. После чего прыгунам подбирался соответствующий их весу шест, увеличивался хват и начиналось обучение прыжкам на гнущемся шесте.
Группа Б. Спортсмены этой группы приступали к обучению прыжкам с шестом сразу на гнущихся снарядах. В ходе тренировок технической направленности использовались специальные подводящие упражнения.
Группа В. В этой группе применялся "комбинированный" метод обучения. Испытуемые обучались входу и вису на прямом шесте, прыжку на прямом шесте, входу и вису на гнущемся шесте с применением подводящих упражнений, как и в группе Б. При этом внимание прыгунов акцентировалось на выполнении упражнений с той ритмовой структурой движений, которая рисуща спортсменам высокой квалификации.
Таким образом, отличие в организации тренировок технической направленности в группах Б и В заключалось в том, что в группе Б отсутствовала работа над некоторыми элементами опорной части прыжка. В группе В техника выполнения опорной части разучивалась раздельно от совершенствования разбега и отталкивания. Результаты эксперимента позволили определить методику тренировки начинающих прыгунов с шестом.
Факторные планы
Факторные эксперименты применяются тогда, когда необходимо проверить сложные гипотезы о взаимосвязях между переменными. Общий вид подобной гипотезы: "Если Ai, Аг..., An, то В". Такие гипотезы называются комплексными, комбинированными и др. При этом между независимыми переменными могут быть различные отношения: конъюнкции, дизъюнкции, линейной независимости, аддитивные или мультипликативные и др. Факторные эксперименты являются частным случаем многомерного исследования, в ходе проведения которого пытаются установить отношения между несколькими независимыми и несколькими зависимыми переменными. В факторном эксперименте проверяются одновременно, как правило, два типа гипотез:
1) гипотезы о раздельном влиянии каждой из независимых переменных;
2) гипотезы о взаимодействии переменных, а именно, как присутствие одной из независимых переменных влияет на другую.
Факторный эксперимент строится по факторному плану. Факторное планирование эксперимента заключается в том, чтобы все уровни независимых переменных сочетались друг с другом. Число экспериментальных групп равно числу сочетаний уровней всех независимых переменных.
Чаще всего на практике используются факторные планы для двух независимых переменных и двух уровней типа 2x2. Для составления плана применяется принцип балансировки. План 2x2 используется для выявления эффекта воздействия двух независимых переменных на одну зависимую. Данные приведены в простейшей таблице (табл. 5).
Пример. Исследования А.А. Федякина (1999) были направлены на выявление и анализ отличий скоростно-силовой подготовленности женщин-прыгуний в длину от скоростно-силовой подготовленности мужчин-прыгунов. В эксперименте в общей сложности приняли участие 98 спортсменов от III разряда до МСМК, специализирующихся в прыжках в длину. Сравнивался уровень скоростно-силовой подготовленности женщин и мужчин, имеющих одинаковый спортивный результат, а также одинаковую спортивную квалификацию (табл. 6).
Установлено, что для мужчин с ростом спортивного мастерства характерен усиленный прирост значений скоростно-силовых показателей, у женщин наблюдается их замедление. Зафиксированные различия в уровне скоростно-силовой подготовленности между прыгунами и прыгуньями, имеющими одинаковую квалификацию, объясняют различия в технике выполнения прыжка в длину с разбега.
Реже используются четыре независимые рандомизированные группы. Для обработки результатов применяется дисперсионный анализ по Фишеру.
Также редко используются другие версии факторного плана, а именно: 3x2 или 3x3. План 3x2 применяется в тех случаях, когда нужно установить вид зависимости одной зависимой переменной от одной независимой, а одна из независимых переменных представлена дихотомическим парамет- I ром. В этом случае мы получаем план 3x2 (табл. 7).
Пример. Испытывали влияние трех видов силовой тренировки на объем плечевых мышц в двух группах одной квалификации мужчин-спортсменов различной спортивной специализации. Каждое испытание имело трехкратную повторность тестирования.
Здесь через А обозначен фактор воздействия, т.е. вид силовой тренировки, а через В - группы спортсменов циклической и скоростно-силовой направленности. Число градаций фактора А равно трем, т.е. (А=3, а число групп фактора В равно двум, т.е. В=2. По результатам эксперимента определено, что сдвиги в уровне силовой подготовленности связаны со специализацией спортсменов.
Вариант плана 3x3 применяется в том случае, если обе независимые переменные имеют несколько уровней и есть возможность выявить виды связи зависимой переменной от независимых (табл. 8).
Пример. Ответ на вопрос, насколько важен накопленный предшествующий опыт в развитии целевой точности, дают результаты экспериментальной работы СВ. Голомазова (1997), связанные с оценкой переноса тренированности в точностных движениях с локальной мышечной нагрузкой на различные группы мышц (табл. 9).
Комплексное исследование влияния локальной мышечной нагрузки на точность показало, что основной причиной изменения точности является неадекватное состояние исполнительного аппарата (мышц) предшествующему опыту.
В общем случае план для двух независимых переменных выглядит как NxM. Применимость таких планов ограничивается только необходимостью набора большого числа рандомизированных групп. Объем экспериментальной работы чрезмерно возрастает с добавлением каждого уровня любой независимой переменной.
Планы, используемые для исследования влияния более двух независимых переменных, применяются редко. Для трех переменных они имеют общий вид LxMxN.
Чаще всего применяются планы 2x2x2: "три независимые переменные - два уровня". Очевидно, добавление каждой новой переменной увеличивает число групп. Общее их число 2, где п - число переменных в случае двух уровней интенсивности и К - в случае К-уровневой интенсивности (считаем, что i число уровней одинаково для всех независимых переменных).
Упрощением полного плана с тремя независимыми переменными вида LxMxN является планирование по методу "латинского квадрата". "Латинский квадрат" применяют тогда, когда нужно исследовать одновременное влияние трех переменных, имеющих два уровня или более. Принцип "латинского квадрата" состоит в том, что два уровня разных переменных встречаются в экспериментальном плане только один раз. Тем самым процедура значительно упрощается, не говоря о том, что экспериментатор избавляется от необходимости работать с огромными выборками.
Предположим, что у нас есть три независимые переменные, с тремя уровнями каждая:
1. Li, L2, Ьз
2. Mi, M2, Ms
3. А, В, С
План по методу "латинского квадрата" представлен в табл. 10.
Нетрудно заметить, что уровни третьей переменной N (А, В, С,) встречаются в каждой строке и в каждой колонке по одному разу. Комбинируя результаты по строкам, столбцам и уровням, можно выявить влияние каждой из независимых переменных на зависимую, а также степень попарного взаимодействия переменных.
"Латинский квадрат" позволяет значительно сократить число групп. В частности, план 2x2x2 превращается в простую таблицу (табл. 11).
Применение латинских букв в клеточках для обозначения уровней 3-й переменной (А - есть, В - нет) традиционно, поэтому метод назван "латинским квадратом".
Пример. Для определения вероятности предсказания направления полета мяча у футболистов был организован эксперимент по методу "латинского квадрата". Испытуемые выполняли удары в створ ворот (переменная L) - влево, вправо, в центр; с различных точек поля (переменная М) - с правого и левого флангов, по центру, а также с различных расстояний от ворот (переменная К)-11, 15и21 метр.
По результатам обследования удалось получить модельные характеристики антиципации для футбольных вратарей.
Более сложный план по методу "греко-латинского квадрата" применяется очень редко. С его помощью молено исследовать влияние на зависимую переменную четырех независимых. Суть его в следующем: к каждой латинской группе плана с тремя переменными присоединяется греческая буква, обозначающая уровни четвертой переменной. План по методу "греко-латинского квадрата" примет такой вид (табл. 12).
Для обработки данных применяется метод дисперсионного анализа по Фишеру.
Пример. При разделении экспериментальной группы на две с различной квалификацией в эксперименте, описанном в примере использования латинского квадрата, мы получаем план эксперимента по методу греко-латинского квадрата. При этом группы в схеме получают латинские или греческие обозначения.
Подводя итог рассмотрению различных вариантов экспериментальных планов, предлагаем их классификацию. Экспериментальные планы различаются по таким основаниям:
1. Число независимых переменных: одна или больше. В зависимости от их числа применяется либо простой, либо факторный план.
2. Число уровней независимых переменных: при 2 уровнях речь идет об установлении качественной связи, при 3 и более - количественной связи.
3. Кто получает воздействие. Если применяется схема "каждой группе - своя комбинация", то речь идет о межгрупповом плане. Если лее применяется схема "все группы - все воздействия", то речь идет о ротационном плане. Схема планирования эксперимента может быть гомогенной или гетерогенной (в зависимости от того, равно или не равно число независимых переменных числу уровней их изменения).
Поисковые и неполные экспериментальные планы в педагогических исследованиях
Поисковые планы
К поисковым планам относятся:
а) исследование единичного случая;
б) план с предварительным и итоговым тестированием
одной группы;
в) сравнение статистических групп.
Исследование единичного случая относится к области прошлого. Однократно тестируется одна группа. Контроль внешних переменных и независимой переменной полностью отсутствует. В таком "исследовании" нет никакого материала для сравнения. А ведь с него обычно начинается любая научная работа. Такого рода исследования, как правило, проводятся на первых этапах научной деятельности для сопоставления их результатов с обыденными представлениями о реальности. Но научной информации они не несут.
План с предварительным и итоговым тестированием одной группы часто применяется в социологических, социально-психологических и педагогических исследованиях. В этом плане отсутствует контрольная выборка, поэтому нельзя утверждать, что изменения зависимой переменной, регистрируемые в ходе тестирования, вызваны именно изменением независимой переменной. Между начальным и конечным тестированием происходят и другие "фоновые" события, воздействующие на испытуемых наравне с независимой переменной. Кроме того, этот план не позволяет контролировать эффект "естественного развития": в течение короткого времени - изменение состояния испытуемого (утомление, монотония, скука и др.), а в течение длительного времени - изменение физической или технической подготовленности, личностных черт и др. Наконец, эффект тестирования - воздействие предыдущего обследования на последующее - может быть еще одним неконтролируемым фактором, влияющим на изменение зависимой переменной. Можно перечислить и другие источники артефактов - внешние переменные, которые не контролируются этим планом.
Третий вариант поискового плана - сравнение статистических групп, или, точнее, план для двух неэквивалентных групп с тестированием после воздействия. Этот план лучше предыдущего хотя бы тем, что позволяет учитывать эффект тестирования благодаря введению контрольной группы, а также отчасти контролировать влияние "истории" - фоновых воздействий на испытуемых - и ряд других внешних переменных (инструментальную погрешность, регрессию и др.). Но с помощью этого плана невозможно учесть эффект естественного развития, так как нет материала для сравнения состояния испытуемых на данный момент с их начальным состоянием (нет предварительного тестирования).
Этот поисковый план распространен в психологической исследовательской практике. Для сравнения результатов контрольной и экспериментальной групп используется t-критерий Стьюдента. Всегда надо иметь в виду, что различия в результатах тестирования могут быть обусловлены не экспериментальным воздействием, а различием состава групп. Этот план, если отбросить экспериментальное воздействие, вполне применим в корреляционном исследовании, но его не следует использовать для проверки гипотез о причинной связи двух переменных.
Неполные планы
Неполные планы являются попыткой учета реалий жизни при проведении эмпирических педагогических или психологических исследований. Условия, в которые ставит жизнь, а также практические задачи экспериментаторов не всегда позволяют реализовать планы "истинных экспериментов", использовать схемы контроля внешних переменных. Однако научные и научно-прикладные задачи нужно решать. Неполные планы создаются специально с отступлением от схемы "истинного эксперимента". Исследователь осознает те источники артефактов - внешние переменные, которые он не может контролировать.
Неполные планы используются не только для решения прикладных проблем, но и для проведения научных исследований, когда применение лучшего плана невозможно.
Существует два типа неполных планов: а) планы экспериментов для неэквивалентных групп; б) планы дискретных временных серий.
Любое исследование, направленное на установление причинной зависимости между двумя переменными ("если А, то В"), в котором отсутствует предварительная процедура уравнивания групп или "параллельный контроль" с участием контрольной группы, заменено сравнением результатов неоднократного тестирования группы (или групп) до и после воздействия.
Выбираются две естественные группы. Обе группы тестируются. Затем одна группа подвергается воздействию (ставится в особые условия деятельности), а другая - нет. Через определенное время обе группы проходят тестирование повторно. Результаты первого и второго тестирования обеих групп сопоставляются; для сравнения используют t-крите-рий Стьюдента и дисперсионный анализ. Различие свидетельствует о естественном развитии и фоновом воздействии. Разница результатов первичного тестирования двух групп позволяет установить меру их эквивалентности в отношении измеряемой переменной. Для выявления эффекта действия независимой переменной с помощью t-критерия сравнивать нужно величины сдвигов показателей во времени. Значимость различия приростов показателей будет свидетельствовать о влиянии независимой переменной на зависимую.
Этот план аналогичен плану истинного эксперимента для двух групп с тестированием до и после воздействия. Главными источниками артефактов являются различия в составе групп. В первую очередь на результаты эксперимента может повлиять "эффект смешения", т.е. взаимодействия состава группы с факторами тестирования, фоновых событий, естественного развития и др.
Различают два варианта отбора групп. В первом случае в исследовании участвуют естественные группы, которые по отношению к самой процедуре эксперимента не отбираются. Поэтому эффект состава группы может присутствовать, но он не столь значим. Во втором случае экспериментальная группа формируется из добровольцев, а аналогичную контрольную группу приходится комплектовать другим способом (принуждением, обещанием оплаты и т.д.). При этом фактор состава группы может оказать решающее влияние на различие в результатах экспериментальной и контрольной групп.
Существует множество других вариантов неполных планов для неэквивалентных групп: так называемые "лоскутные планы", планы "множественных серий замеров", план с контрольными выборками для предварительного и итогового тестирования и т.д.
Часто применяются неполные схемы, которые имеют общее название "дискретные временные серии". Для классификации этих планов можно выделить два основания: исследование проводится 1) с участием одной группы или нескольких; 2) с одним воздействием либо серией. Следует заметить, что планы, в которых реализуется серия однородных или разнородных воздействий с тестированием после каждого воздействия, получили в советской и российской психологической науке по традиции название "формирующие эксперименты". По своей сути они, конечно, являются неполными со всеми присущими таким исследованиям нарушениями внешней и внутренней информативности, в них отсутствуют средства контроля внешней информативности. Невозможно проконтролировать взаимодействие предварительного тестирования и экспериментального воздействия, ликвидировать эффект систематического смешения (взаимодействия состава групп и экспериментального воздействия), проконтролировать реакцию испытуемых на эксперимент и определить эффект взаимодействия между различными экспериментальными воздействиями.
Вопросы для самоконтроля:
1. Что является отличительной особенностью экспериментов полного соответствия?
2. Какие факторы нарушают внутреннюю информативность эксперимента, а какие - внешнюю?
3. Зависит ли достоверность экспериментальных результатов от внешней информативности?
4. Зачем применяется контрольная группа?
5. Что необходимо учитывать при выборе факторов и моделей?
6. Перечислите основные планы для исследований?
7. Что может выступать в качестве независимых переменных?
8. Какие методы отбора и распределения испытуемых по группам применяются при организации эксперимента?
9. Как проводится процедура рандомизации?
10. Что может служить артефактом в одномерном исследовании одной группы в разных условиях?
11. В каких случаях применяются факторные планы?
12. Какие варианты отбора групп существуют при неполных планах?