Обоснование задачи исследований изменений

В психологических исследованиях часто бывает важно доказать, что в результате действия каких-либо факторов произошли достоверные изменения ("сдвиги") в измеряемых показателях. К числу таких факто­ров должен быть отнесен прежде всего фактор времени. Сопоставление показателей, полученных у одних и тех же испытуемых по одним и тем же методикам, но в разное время, дает нам временной сдвиг.

Многократные обследования одних и тех же лиц на протяжении достаточно длительного отрезка их жизненного пути, измеряемого ино­гда десятками лет, представляет собой так называемое лонгитюдинальное исследование, суть которого хорошо известна любому представите­лю Ленинградской-Петербургской школы психологии. Этот метод по­зволяет определить генетические связи между фазами психического раз­вития и дать научно обоснованный прогноз дальнейшего психического развития (Ананьев Б.Г., 1976, с. 26-27).

Сопоставление показателей, полученных по одним и тем же мето­дикам, но в разных условиях измерения (например, "покоя" и "стресса"), дает нам ситуационный сдвиг. Условия измерения могут изменяться не только реально, но и умозрительно. Например, мы мо­жем попросить испытуемого "представить себе", что он оказался в других условиях измерения: в будущем, в позиции других людей, кото­рые оценивают его как бы со стороны, в состоянии разгневанного отца и т. п. Сопоставляя показатели, измеренные в обычных и воображае­мых условиях, мы получаем умозрительный сдвиг.

Мы можем создать специальные экспериментальные условия, предположительно влияющие на те или иные показатели, и сопоставить замеры, произведенные до и после экспериментального воздействия. Если сдвиги окажутся статистически достоверными, это позволит нам утверждать, что экспериментальные воздействия были существенными, или эффективными.

Например, мы можем сделать вывод о том, что данная програм­ма тренинга действительно способствует развитию уверенности, или что данный способ внушающего воздействия влияет на изменение отноше­ния испытуемых к той или иной проблеме, или что психодраматическая замена ролей подтверждает постулат Дж.Л. Морено о сближении по­зиций спорщиков после того, как им пришлось играть роль своего оп­понента и т.п.

Во всех этих случаях мы говорим о сдвиге под влиянием контро­лируемых или не контролируемых воздействий. И здесь мы наталкива­емся на методическую трудность, которую оказывается возможным преодолеть только путем введения контрольной группы, которая не ис­пытывала бы на себе воздействия данного экспериментального фактора. Если нет контрольной группы, то сдвиг в экспериментальной группе может объясняться действием самых разных причин: временем суток, в которое производились замеры, важным для испытуемых событием, которое произошло между 1-м и 2-м замерами и по мощности воздей­ствия значительно перекрыло экспериментальный фактор и т. п. Мы никогда не сможем исключить той возможности, что изменения, достиг­нутые, как нам кажется, в результате наших воздействий, на самом де­ле объясняются неучтенными причинами. Вот если в экспериментальной группе сдвиги окажутся достоверными, ав контрольной группе - недос­товерными, то это, действительно, может свидетельствовать об эффек­тивности воздействий. При отсутствии контрольной группы мы конста­тируем, что сдвиг произошел, но не имеем права приписать его именно данным, изучаемым нами, факторам воздействия.

Допустим, мы установили, что после того, как двум конфликтую­щим подгруппам пришлось играть роль своих оппонентов в споре, уси­лилось ощущение понимания этих оппонентов "изнутри" (см. Задачу 1). Но мы не можем исключить возможности, что если бы мы не проводи­ли психодраматической замены ролей, взаимопонимание все-таки бы улучшилось просто в силу того, что обе подгруппы какое-то время учи­лись и работали вместе.

Бывают случаи, когда мы не располагаем контрольной группой, но зато в нашем распоряжении есть 2 или более экспериментальных групп, различающихся по условиям и способам воздействия на них. Это могут быть, помимо экспериментальных, и разнообразные естественные условия жизни, обучения, работы, общения и даже питания, водоснаб­жения, географического расположения и т. д. Сопоставление групп, различающихся по этим признакам, позволит нам уточнить' специфиче­ское действие экспериментальных или естественно действующих факто­ров, хотя при этом нам следует помнить, что воздействие неучтенных факторов может оказаться еще более мощным.

В выводах мы все-таки будет ограничены, если не проверили свои результаты на контрольной труппе, в которой измерения произво­дились параллельно.

Помимо рассмотренных сдвигов: временных, ситуационных, умо­зрительных и сдвигов под влиянием, - можно рассмотреть еще особую категорию структурных сдвигов.

Мы можем сопоставлять между собой разные показатели одних и тех же испытуемых, если они измерены в одних и тех же единицах, по одной и той же шкале. Например, мы можем исследовать перепад ме­жду вербальным и невербальным интеллектом, измеренными по мето­дике Д. Векслера, или сопоставлять экспертные оценки эмпатичности и наблюдательности, измеренные по одинаковой 10-балльной шкале, или время решения двух задач, измеренное в секундах, или экзаменацион­ную успешность по разным дисциплинам и т.п.

В принципе, мы могли бы для такого рода "перепадов" использо­вать критерии оценки достоверности в средних тенденциях для незави­симых выборок: U - критерий, Q - критерий и угловое преобразование Фишера. Однако, строго говоря, перед нами - зависимые ряды значе­ний, поскольку они измерены на одних и тех же испытуемых, поэтому будет более обоснованным использовать критерии оценки достоверности сдвигов для связанных выборок. Исключение представляют случаи, когда мы сопоставляем величины сдвигов в двух независимых группах испытуемых, например экспериментальной и контрольной (см. Табл. 3.1). Допустим, если мы установили, что положительный сдвиг в сторону улучшения взаимопонимания наблюдается и в экспериментальной, и в контрольной группах, мы можем попробовать доказать, что в эксперимен­тальной группе этот сдвиг достоверно больше, чем в контрольной, и что, следовательно, экспериментальное воздействие все-таки существенно.

Последний важный вопрос касается того, должны ли мы всегда производить оба замера на одной и той же выборке, или "сдвиг" можно изучать на сходных, так называемых "уравновешенных" выборках, сов­падающих друг с другом по полу, возрасту, профессии и другим значи­мым для исследователя характеристикам.

В сущности, допускается сопоставление показателей разных вы­борок, уравновешенных по всем значимым для исследования признакам. Иными словами, можно уровень тревоги или объем внимания до экза­мена измерять у одной подгруппы, а после экзамена - у другой под­группы, если они "уравновешены". Опыт показывает, однако, что соз­дать "уравновешенные" подгруппы практически невозможно. Мы всегда упираемся в факт существования различий между выделенными под­группами, которые могут в значительной степени повлиять на результат. В итоге окажется, что мы исследовали не влияние экзаменационного стресса на уровень тревоги или объем внимания, а различия по этому показателю между двумя выделенными подгруппами. К сожалению, в значительной степени это относится и к проблеме сопоставления экспе­риментальной и контрольной групп: мы почти никогда не можем быть уверены, что выявленные различия объясняются действием исследуемых факторов, а не различиями между двумя выборками.

Многие исследователи обходят эту проблему самым простым об­разом: они вообще не заботятся о контрольной группе. Сдвиг есть -значит, воздействие эффективно! И действительно, при отсутствии кон­трольной выборки тоже можно порассуждать на тему о том, какими же причинами, кроме предполагаемой, могут объясняться полученные сдвиги...

Другой вариант "уравновешивания" - введение параллельных форм теста. В тех случаях, когда на результатах повторных замеров могут сказаться эффекты научения, приходится "до" измерять реакции испытуемого с помощью одного инструмента, а "после" - с помощью другого. В результате на измерениях может отразиться и действие фак­тора времени, и различия в параллельных формах теста, и непонятно что еще. Создать параллельную форму методики не менее трудно, чем подобрать "уравновешенную" группу испытуемых. И все же, в тех слу­чаях, когда у нас нет другого выхода, приходится прибегать к этому способу.

Суммируем сказанное. В Табл. 3.1 приведена классификация сдвигов и указаны статистические методы, позволяющие оценить их достоверность.

Таблица ЗА

Классификация сдвигов и критериев оценки их статистической достоверности

Виды сдвигов   Объект сопоставлений   Условия Критерии оценки достоверности сдвига
Количество замеров Количество групп
1. Временные, ситуационные, умозрительные, измерительные   Одни и те же пок- затели, измеренные у одних и тех же испытуемых в разное время, в разных ситуациях в разных представляемых условиях или разными способами     G - критерий знаков; Т - критерий Вилкоксона    
  Зи более       L - критерий тенденций Пей- джа; χ2r- критерий Фридмана
2. Сдвига под влиянием эксперименталь-ных воздействий     Одни и те же показатели, измеренные у одних и тех же испытуемых до и после воздействия: а) при отсутствии контрольной группы           G - критерий знаков; Т - критерий Вилкоксона
  3 и более       L - критерий тенденций Пей- джа; χ2r- критерий Фридмана
  6) при наличии контрольной группы           Вариант 1- сопоставление значений "до" и "после" отдельно по экспериментальной и контрольной группам: G - критерий знаков; Т - критерий Вилкоксона Вариант 2 - сопоставление сдвигов в двух группах: Q - критерий; U - критерий Манна-Уитни; φ* - критерий Фишера
        З и более       Сопоставление значений отдельно по экспериментальной и контрольной группам: L, - критерий тенденций Пейджа; χ2, - критерий Фридмана
3. Структурные сдвиги Разные показатели одних и тех же испытуемых             G - критерий знаков; Т - критерий Вилкоксона
З и более       L - критерий тенденций Пейджа; χ2r - критерий Фридмана

Как следует из Табл. 3.1, при сопоставлении двух, замеров, про­изведенных на одной и той же (экспериментальной) выборке, применя­ются критерии знаков G и критерий Т Вилкоксона. При сопоставлении трех и более замеров, произведенных на одной и той же выборке, при­меняются критерий тенденций L Пейджа, а если он неприменим из-за большого объема выборок - критерий χ2rФридмана.

В тех случаях, когда мы хотим оценить различия в интенсивности сдвига в двух группах испытуемых (контрольной и экспериментальной или двух экспериментальных), мы можем использовать различные ва­рианты сопоставлений: 1) производить сопоставления отдельно в двух группах, используя критерии L и χ2r; 2) сопоставлять показатели сдвига[8] в двух группах. Поскольку группы независимы, значения сдви­гов также независимы, и мы можем применять по отношению к ним уже известные нам критерии Q Розенбаума, U Манна-Уитни и φ* -угловое преобразование Фишера.

G- критерий знаков

Назначение критерия G

Критерий знаков[9] G предназначен для установления общего на­правления сдвига исследуемого признака.

Он позволяет установить, в какую сторону в выборке в целом изменяются значения признака при переходе от первого измерения ко второму: изменяются ли показатели в сторону улучшения, повышения или усиления или, наоборот, в сторону ухудшения, понижения или ос­лабления.

Описание критерия G

Критерий знаков применим и к тем сдвигам, которые можно оп­ределить лишь качественно (например, изменение отрицательного от­ношения к чему-либо на положительное), так и к тем сдвигам, которые могут быть измерены количественно (например, сокращение времени работы над заданием после экспериментального воздействия).

Во втором случае, однако, если сдвиги варьируют в достаточно широком диапазоне, лучше применять критерий Т Вилкоксона. Он учи­тывает не только направление, но и интенсивность сдвигов и может оказаться более мощным в определении достоверности сдвигов, чем критерий знаков.

Как правило, исследователь уже в процессе эксперимента может заметить, что у большинства испытуемых показатели во втором замере имеют тенденцию, скажем, повышаться. Однако ему еще требуется до­казать, что положительный сдвиг является преобладающим.

Для начала мы назовем сдвиги, которые нам кажутся преобла­дающими, типичными сдвигами, а сдвиги более редкого, противополож­ного направления, нетипичными. Если значения показателя повышаются у большего количества испытуемых, то этот сдвиг мы будем считать типичным. Если мы исследуем отношение испытуемых к какому-либо событию или предложению, и после экспериментальных воздействий у большинства испытуемых отрицательное отношение сменилось на поло­жительное, то этот сдвиг мы назовем типичным.

Есть еще, правда, возможность "нулевых" сдвигов, когда реакция не изменяется или показатели не повышаются и не понижаются, а ос­таются на прежнем уровне. Однако такие "нулевые" сдвиги в критерии знаков исключаются из рассмотрения. При этом количество сопостав­ляемых пар уменьшается на число таких "нулевых" сдвигов.

Суть критерия знаков состоит в том, что он определяет, не слишком ли много наблюдается "нетипичных сдвигов", чтобы сдвиг в "типичном" направлении считать преобладающим? Ясно, что чем мень­ше "нетипичных сдвигов", тем более вероятно, что преобладание "типичного" сдвига является преобладающим. Gэмп - это количество "нетипичных" сдвигов. Чем меньше Gэмп, тем более вероятно, что сдвиг в "типичном" направлении статистически достоверен.

Гипотезы

Н0: Преобладание типичного направления сдвига является случайным.

H1: Преобладание типичного направления сдвига не является случайным.

Наши рекомендации