Коэффициент корреляции и стандартизация переменных
Удобство использования коэффициента корреляции связано со следующими моментами:
q он дает меру связи между переменными и в том случае, если они измерены в разных единицах или в разных психологических шкалах;
q он изменяется в определенном диапазоне (от +1 до –1) и предполагает возможность единой нормативной интерпретации;
q разработаны разные статистические подходы к подсчету коэффициента корреляции как в зависимости от используемых шкал (наименований, порядка, интервалов, отношений), так и в пределах одной и той же шкалы.
Так, разные подходы измерения связи использованы при обосновании процедур подсчета коэффициентов «тау» Кендэлла и «роу» Спирмена как разных ранговых коэффициентов корреляции.
Психологам часто приходится сталкиваться с проблемой выявления связей между переменными, измеренными в различных единицах. Так, баллы, полученные в интеллектуальном тесте, обычно предполагающие использование шкалы интервалов, сравниваются с «сырыми» баллами какого-нибудь личностного опросника, по отношению к которым чаще следует предполагать лишь выполнение условий шкалы порядка. Оба названных показателя могут сравниваться, например, со временем решения мыслительной задачи или числом попыток, осуществленных испытуемыми до нахождения ими окончательного решения. Баллы и секунды можно привести к единой шкале, присвоив, например, им ранги и преобразовав тем самым исходные данные в сопоставимые шкалы порядка. Однако в таком случае обычно речь идет о потере информации, поскольку шкала более высокого уровня «низводится» к шкале более низкого уровня, но не наоборот. Возможны исключения: так, по отношению к результатам процедуры прямого вынесения субъектом балльных оценок предлагаются разные способы обработки данных, рассматривающие получаемые психологические переменные то как шкалы порядка, то как шкалы интервалов.
Вариантами решения этой проблемы являются, во-первых, стандартизация переменных и, во-вторых, использование коэффициентов корреляции, заведомо включающих предположения исследователя о типе используемых шкал. Дж. Гласе и Дж. Стэнли [15] приводят таблицу, демонстрирующую эту ориентацию выбора коэффициента корреляции на тип используемых в исследовании переменных. Остановимся коротко на том, что такое стандартизированные данные, или z-преобразования переменной.
Если переменная представлена множеством п-случаев (это могут быть испытуемые, задачи и т.д.) со средним Х и стандартным отклонением , выступающим в качестве меры разброса, то эти же данные можно преобразовать в другое множество со средним 0 и стандартным отклонением, равным 1. Новые значения при этом будут непосредственно выражаться в отклонениях исходных значений от среднего, измеренных в единицах стандартного отклонения. Новые, т.е. преобразованные, значения переменной называются значениями z:
Величина z также является выборочной характеристикой дисперсии. Z-шкала выступает примером линейного преобразования значений переменной. При таком преобразовании сохраняется соотношение между первичными показателями (X) и новыми показателями z. «Относительная величина разницы между стандартными показателями, полученными при таком линейном преобразовании, в точности соответствует относительной величине различия первичных показателей. Все свойства первоначального распределения показателей полностью воспроизводятся в распределении линейных стандартных показателей. По этой причине любые вычисления, которые можно производить с исходными данными, могут также выполняться и с линейными стандартными показателями без какого-либо искажения конечных результатов» [4, с. 78].
Для ряда психологических переменных используются сложившиеся в той или иной области общепринятые оценки z. Так, для интеллектуальных тестов преобразование исходных «сырых» баллов осуществляется переводом их в шкалу со средним, равным 100, и стандартным отклонением 15 или 16. В нормативных личностных опросниках использование z-преобразования приводит к шкалам стенов и станайнов («стандартная десятка» и «стандартная девятка»). Использование этих шкал позволяет сопоставлять результаты одних и тех же испытуемых в разных тестах. Сопоставимости данных z-преобразование служит и в тех случаях, если в пределах одного и того же методического средства фиксируются содержательно разные показатели. Приведем пример методики измерения когнитивного стиля «импульсивность–рефлексивность».
Экскурс 12.4
Дж. Каган предложил методику, согласно которой в обследованной выборке испытуемых – детей – выделял для интерпретации показатели двух подгрупп. Отметим, что 50% данных не учитывались, поскольку не могли быть подведены под теоретически предполагаемые типы, заданные пересечением двух рядов показателей: испытуемые с медленным поиском и большим количеством ошибок, а также испытуемые с быстрым поиском и маленьким числом ошибок не соответствовали группам, названным рефлексивными и импульсивными. В результате из четырех возможных типов соотношения фиксируемых показателей: времени и точности испытуемого в выборе – только два далее представляли свойства, типичные для импульсивных и рефлексивных испытуемых [85].
При следовании инструкции «найти как можно быстрее заданное (эталонное) изображение среди других восьми схожих, но чем-нибудь отличающихся от эталонного» испытуемые (дети разного возраста) делали выбор с разными временем поиска и степенью ошибок. Время фиксировал экспериментатор с помощью секундомера, а число ошибок определяли по совокупности неверных выборов в 12 стимульных ситуациях. Те испытуемые, которые давали ответ быстро и делали много ошибок, были отнесены к импульсивным по преобладающему у них когнитивному стилю (это понятие предполагало двухполюсную оценку стиля как способа разрешения субъектом ситуации неопределенности на уровне перцептивных стратегий). Испытуемые, которые давали ответ после длительного поиска и почти не ошибались, назывались рефлексивными. Без квалификации оставались результаты двух подгрупп испытуемых: тех, которые действовали медленно и ошибочно либо быстро и безошибочно.
Авторы других работ, используя эту методику и не желая терять информацию о половине испытуемых – неимпульсивных и нерефлексивных в понимании Дж. Кагана, решили проблему на основе z-преобразований обоих показателей [89]. Выразив результат каждого испытуемого в z-показателе времени поиска и z-показателе числа ошибок, они получили возможность характеризовать результаты каждого испытуемого одним числом (общим z-показателем): Z = Zошибки – Zвремени. Тем самым результаты всех испытуемых, а не только двух подгруп могли быть представлены на шкале «импульсивности–рефлексивности». Этот же пример может служить демонстрацией того факта, что не сам по себе фиксируемый показатель выступает в качестве переменной в психологическом исследовании, а способ его оценки. Так, для квалификации когнитивного стиля «импульсивности–рефлексивности» в исходной работе Дж. Кагана использовалась по существу номинативная шкала, в то время как те же показатели в суммарном z-преобразовании позволяют всех испытуемых выстроить в один ряд и перейти как минимум к шкале порядка. В таком случае испытуемые начинают характеризоваться как более импульсивные или более рефлексивные.
В современных нормативных тестах z-преобразования позволяют выражать отклонения индивидуального результата от средней нормы в единицах, пропорциональных стандартному отклонению распределения. Стандартные показатели могут быть получены как линейными, так и нелинейными преобразованиями первичных показателей.
Нелинейные преобразования позволяют осуществлять сравнение данных, представленных двумя или более переменными, характеризующимися распределениями различной формы. А. Анастази приводит примеры таких показателей, как умственный возраст и процентиль. Исходя из предположения, что распределение первичных показателей («сырые» значения переменной) ближе к нормальному, чем к какому-либо иному, применяют нормализованные стандартные показатели. Понятно, что оценка этого допущения применительно к каждой психологической переменной – специальная задача.
Для определения нормализованных стандартных показателей используют специальные таблицы, в которых приводится процент случаев различных отклонений в «сигмах» ( ) от среднего значения для кривой нормального распределения. Конкретные способы этих преобразований представлены в учебниках по статистике. Спорным остается мнение, что нормализация первичных показателей в психологических исследованиях приводит переменные к шкалам, подобным шкалам физических величин с равными единицами измерения. Следует подчеркнуть, что представленные в учебнике по статистике сведения не могут служить основаниями решения проблемы спецификации психологической переменной.
Под проблемой спецификации здесь имеется в виду только обоснование психологом, к какому типу шкал следует отнести полученные им первичные показатели. Так, например, если используется показатель времени выполнения какого-то задания испытуемыми, то психологическая переменная «время решения мыслительной задачи» может означать порядок следования испытуемых (по скорости выполнения задания), т.е. удовлетворять лишь порядковой шкале измерения соответствующих индивидуальных различий. Физические величины измерения времени, предполагающие равные единицы (шкалы интервалов), отнюдь не всегда будут соответствовать времени как психологической переменной. Соответственно какой-нибудь пример из раздела параметрической статистики с использованием показателя времени может не соответствовать типу шкалы в конкретном психологическом исследовании, что повлечет неверный выбор коэффициента корреляции.
Экскурс 12.5
Примером неадекватного понимания первичного показателя может служить попытка прямого прочтения в шкале отношений результатов отметок испытуемыми своего положения в методике Дембо–Рубинштейн. Имеют место случаи буквального подсчета отклонений (измеренного в миллиметрах) индивидуальной самооценки от средней точки на заданной линии. Однако испытуемые оценивали себя согласно качественной шкале, которая не имела миллиметровой градации и количественного критерия отнесения людей к полюсам шкалы. Сравнения себя с другими тем более не имели метрики. Иными словами, испытуемые в такой ситуации дают ответ, осуществляя оценку своих качеств отнюдь не в миллиметрах, а путем использовании неопределенных качественных оценок: «выше среднего», «ближе к умным, чем к глупым» и т.п. С определенной натяжкой здесь можно было бы говорить о шкале порядка, если бы по этим самооценкам можно было установить порядок следования испытуемых друг за другом. Реально возможно лишь отнесение их к группам с размытыми границами – испытуемые с высокой самооценкой, средней, низкой.
Искусственное представление их качественных оценок в количественной шкале способно привести к псевдоэффектам, но отнюдь не изменить тип психологической переменной.
Планы корреляционных исследований
Знакомство с планами сбора данных при использовании корреляционного подхода важно с точки зрения как учета тех ограничений, которые обычно накладывает план сбора данных на последующие возможности их интерпретации, так и корректного использования способов статистической обработки.
Планы корреляционных исследований нужно рассматривать как формы контроля при получении эмпирических данных, т.е. это аналог форм экспериментального контроля. Не приводя новых примеров, постараемся эксплицировать эти планы как схемы уже цитированных исследований.
В приведенном ранее исследовании Раштона, показавшего особенности личностных характеристик двух групп преподавателей (в большей степени выполняющих функции «исследователей» или «педагогов»), присутствовали внешние критерии отнесения испытуемых в эти группы, но психологические переменные сравнивались различным образом. Производили подсчет коэффициентов корреляции между оценками, проставленными преподавателям студентами и другими преподавателями. Сопоставление двух рядов переменных в этом случае было основано на использовании традиционного плана последовательного измерения переменных, ни одна из которых не рассматривается как причинно обусловливающая другую. В этом аспекте план обработки полностью совпадал с планом получения данных.
Тот факт, что использовались множественные сравнения (рассматривались и оценки студентов, и оценки коллег-преподавателей), был обусловлен стремлением максимально охватить проявления личностных свойств испытуемых в общении с другими в ходе выполнения ими профессиональной деятельности. Конечной целью было, во-первых, улучшение предсказания попадания этих людей в две подразумеваемые группы. Внешний критерий служил здесь цели последующей оценки точности предсказания, а не разделения двух групп на экспериментальную и контрольную. Во-вторых, группы все же сравнивали по величине тестовых и экспертных оценок, чтобы выделить именно те психологические характеристики, по которым люди в них различаются. Этот аспект плана обработки выглядит как соответствующий квазиэкспериментальному плану с двумя неэквивалентными группами. Однако никакие экспериментальные воздействия исследователем не осуществлялись. Попытка рассматривать преимущественный способ профессиональной деятельности людей в составленных группах как независимую переменную была бы натяжкой. Таким образом, исследование оставалось по схеме сбора данных корреляционным, хотя на основе обработки данных выявлялись и различия между значениями измеренных переменных.
Планы с одной группой испытуемых
При внешнем различии множество корреляционных исследований предполагает одну и ту же схему результирующих данных: каждый субъект единой группы представлен в ней как минимум двумя измерениями переменных, будь то два разных показателя или один и тот же, оцениваемый в другой промежуток времени. Такой привычный план корреляционного исследования называется планом с одной группой.
Гипотезы о связях между двумя или большим числом переменных, измеренных на испытуемых этой группы, могут предполагать разные способы сбора данных, поскольку план сбора данных зависит от учета содержательных интерпретаций. Приведем варианты отличий планов с использованием одной группы.
1. Переменные Х и Y отражают различные свойства изучаемой реальности, которые представлены показателями разных методик. В случае использования диаграммы рассеивания на осях абсцисс и ординат заданы диапазоны разброса каждого из показателей, при этом обычно подсчитываются так называемые синхронные корреляции. Предполагается, что вариаты характеризуются значениями, измеренными в один и тот же промежуток времени. Реально предъявление методик может быть разведено во времени, поскольку какая-то из них следует первой, следующая – второй и т.д. Иными словами, синхронность может означать, что временная последовательность применения методик не имеет значения или что показатели относительно стабильны и, значит, в обозримый (указанный в плане исследования) временной промежуток могут считаться одновременно измеренными.
2. Переменные Х1, Х2 и т.д. (Хn) отражают разбросы значений одной и той же вариаты, но измеренные в разные промежутки времени. Как и в предыдущем случае, испытуемые остаются теми же самыми, что и в первый промежуток оценивания значений, но по каким-то основаниям исследователь повторяет измерения через заданные им промежутки времени. В результате подсчитываются так называемые аутохонные корреляции (корреляция вариаты с самой собой).
По каждой из измеренных переменных можно образовать две или более групп, введя правило медианного расщепления, схему контрастных групп или обосновав тем или иным образом критериально задаваемые уровни вариаты.
Следует ли выделять в обследованной выборке людей две группы по измеренной переменной Х или достаточно сопоставить все выборочные значения – весь ряд переменной по общей выборке, – решение этого вопроса не существенно для плана сбора данных в следующем аспекте. В любом случае испытуемый должен быть представлен двумя показателями: значениями Х и Y. Предполагается, что тот факт, какая процедура измерения предшествует, не должен влиять на качество данных. Другое предположение: в выборочных значениях переменной, полученных для обследуемой группы испытуемых, охвачен весь предполагаемый диапазон ее изменений. Понятно, что для критериальной переменной разбиения на группы это важно и с точки зрения возможного неравенства групп по числу попавших в них испытуемых.
Адекватность плана корреляционного исследования включает, таким образом, оценку возможности охвата всего диапазона измеряемой переменной или его уточнения с целью корректной формулировки гипотезы о связях. Исследователь часто не знает этого диапазона, поэтому вынужден прибегать к увеличению числа измерений (обычно к увеличению выборки испытуемых), чтобы быть уверенным в том, что переменная в полученных данных представлена в ее полном охвате и осуществлен контроль несистематической изменчивости побочных переменных как возможного источника искажений изучаемой зависимости.
Итак, не имея возможности осуществлять экспериментальный контроль, исследователь при использовании плана с одной группой прибегает к статистическому контролю, означающему контроль вариабельности всех переменных (как представленных в гипотезе вариат, так и побочных переменных).
Планы с двумя и более группами испытуемых
Кроме плана измерения основных переменных и контроля диапазона их проявлений план корреляционного исследования включает и такой существенный момент, как формы контроля побочных переменных, задающих как несистематические, так и систематические смешения. Можно выделить три основные формы контроля смешений с побочными переменными.
Первая форма – это стабилизация ПП или подбор уровней значений основных переменных таким образом, чтобы побочная переменная выступила в виде учитываемых уровней, задающих по существу факторный план ее взаимосвязей хотя бы с одной из двух измеряемых основных переменных.
Подбор однородных групп выступает такой стратегией, или планом сбора данных в корреляционном исследовании, посредством которой психолог контролирует различие групп по основной вариате, заданной критериально или предварительно измеренной, но главное – выступающей в качестве аналога НП. При этом контролируется и эквивалентность состава групп с точки зрения побочных переменных (ПП). При таком плане побочная переменная фиксируется на определенном уровне или функционально контролируется путем составления подгрупп с определенными уровнями этих ПП. В стабилизации и контроле уровней ПП заключается существенное отличие этого плана от планов со статистическим контролем. Что контролируется – побочная или дополнительная переменная, не меняет формальной схемы, хотя является важным с точки зрения последующих обобщений установленной зависимости.
Экскурс 12.6
В исследовании влияния порядка рождаемости на уровень интеллекта детей такие побочные переменные, как величина семьи, социальное положение отца, сохранялись постоянными в сравниваемых выборках, т.е. стабилизировались. Указание Р. Готгсданкера, что эти переменные контролировались статистически, верно в том смысле, что соответствующие данные для подбора эквивалентного состава групп по ПП были получены психологом как внешние характеристики, а не в качестве актуально измеренных психологических переменных. Этот контроль позволил выявить эффекты, определяемые этими побочными переменными.
Так, было показано, что если выделить группы с разным числом детей в семьях, то обнаружится такая корреляционная связь, как снижение показателя интеллекта при увеличении численности семьи. Социальное положение (крестьяне, рабочие, интеллигенция) будет влиять на высоту показателей интеллекта при любом значении переменной «порядок рождаемости», выступающей в этом исследовании в качестве исходного критерия подбора групп.
Итак, составление однородных групп – это форма контроля различий в уровнях основной вариаты и стабилизации побочных переменных таким образом, чтобы на каждом уровне основной переменной их уровни также были представлены равномерно.
Вторая форма контроля смешений эффекта основной вариаты с ПП реализуется путем подбора пар. Эта стратегия подбора сравниваемых групп применяется в случаях, если исходное число испытуемых невелико. В следующей главе, посвященной квазиэкспериментам, более подробно рассматривается такой методический прием, как подбор пар в неэквивалентные – именно по этому параметру – группы. Продемонстрируем другой методический аспект задания уровней переменной, когда не внешний критерий (как в предыдущем примере), а измеренный психологический показатель выступает основанием подбора групп.
Экскурс 12.7
Другое приводимое Р. Готтсданкером исследование, посвященное проверке гипотезы о развитии оптимальной психологической приспособленности, включало определение двух групп людей. Первую составили 30% наиболее приспособленных, вторую – 30% наименее приспособленных взрослых испытуемых. Средняя группа показателей не фигурировала.
Такой методический прием, как использование контрастных групп, чаще применяется для контроля психологической переменной, измеренной при помощи психодиагностических методик. Для критериально заданных переменных более подходит названная выше стратегия подбора однородных групп.
Критерии психологической приспособленности в данном примере только на первый взгляд были внешне заданы. Практически они реконструировались психологом, выносящим суждения об испытуемых. Для этого использовалась процедура Q-сортировки высказываний из Калифорнийского личностного теста. Предварительно эксперты выделили группы карточек, описывающих положительный и отрицательный полюса предполагаемого свойства «приспособленность». Затем два или три психолога оценивали испытуемых после беседы. Тот факт, что основная переменная строилась на основании вынесения суждений психологом, вводил смешение, с одной стороны, с предубежденностью экспериментатора, а с другой – с предубежденностью испытуемого. Эти две побочные переменные следует назвать сопутствующими, поскольку они имманентно связаны со способом задания основной переменной. Лучше приспособленные взрослые умеют произвести и лучшее впечатление. Воспоминания детства у хорошо приспособленных лиц окрашены теплом и позитивным отношением к происходившему в их семьях. Напротив, плохо приспособленные взрослые склонны окрашивать свои воспоминания в мрачные цвета.
Использование методики подбора контрастных групп, как в экскурсе 12.7, приводит к тому, что заданное основной вариатой различие усиливается указанными сопутствующими переменными. Исключение лиц со средними показателями в выборке делает эти группы еще и искаженными с точки зрения репрезентативности устанавливаемой связи, поскольку нет ответа на вопрос о том, остается ли она таковой между переменными в пропущенном диапазоне их значений.
С точки зрения содержания гипотезы (о связи приспособленности взрослого с его семейными условиями жизни в детстве) – эта переменная приспособленности по своей сути аналогична зависимой переменной. Приспособленность определяется другими факторами, например методами воспитания, социально-экономическим положением семьи и т.д.
По этим другим факторам контроль строился следующим образом. В пару подбирали двух испытуемых – по одному из группы хорошо и плохо приспособленных, сходных по всем учитываемым побочным переменным. В качестве этих переменных выступали соответствующие гипотезе факторы семейного воспитания, которые могли повлиять на психологическую приспособленность испытуемых.
Важным аспектом контроля в этом исследовании выступил следующий. Когда испытуемые были детьми, их семьи посещали психологи и работники социальных учреждений. Они наблюдали реальное обращение родителей с ребенком, а также опрашивали матерей с целью оценки их эмоциональных и интеллектуальных свойств. Таким образом, группы хорошо и плохо приспособленных взрослых сопоставляли не только по показателям ретроспективных отчетов самих испытуемых, но и согласно объективированным свидетельствам об условиях их семейных отношений в детстве.
Основной вывод авторов исследования заключался в следующем: что главным фактором для успешной (хорошей) приспособленности взрослых является хороший метод воспитания в детстве. Этот вывод не является валидным. С точки зрения реализованных форм контроля, основная эмпирическая закономерность не была свободна от ряда указанных смешений. Однако провести полный контроль, организуя разницу семейного воспитания – хорошими и плохими методами, по этическим и организационным соображениям было бы нереально.
Приведенный пример позволяет оценить вклад корреляционных исследований с точки зрения статуса устанавливаемых в них закономерностей: возможности выводов в них сужены, но диапазон эмпирически оцениваемых зависимостей расширен по сравнению с тем, который ограничен управляемыми НП в экспериментальных исследованиях.
Следует отметить, что обоснованной является критическая оценка подбора пар как способа контроля смешений в корреляционном исследовании. Это связано, во-первых, с тем, что такая стратегия снижает выборки испытуемых до тех размеров, при которых возникает угроза охвата полного диапазона значений основных переменных. Так, в рассмотренном примере могло оказаться, что в семьях с высоким социально-экономическим положением практически нет плохо приспособленных людей. Во-вторых, теоретически никогда нельзя быть уверенными, что все различия в парах проконтролированы, а значимая побочная переменная не упущена.
В любом из приведенных примеров, какой бы конкретный план ни применялся, можно констатировать использование средств статистического контроля, но не в значении замены экспериментального контроля проверкой статистических гипотез, а в значении замены управляющих воздействий – манипулирования переменными: попытками их более или менее полного охвата как уже существующих вариат.