Аттитюды тестируемых и систематическая ошибка в ответах
Фальсификация и социальная желательность.Опросники типа стандартизованных самоотчетов особенно подвержены возможности искажения или фальсификации сообщаемых о себе сведений. Несмотря на вступительные замечания об отсутствии «единственно правильных ответов», большинство пунктов в таких опросниках предполагают один ответ, признаваемый как социально более желательный или приемлемый, чем другие. В таких тестах респонденты, если они устраиваются на работу или поступают на учебу, могут испытывать искушение «прикинуться хорошими» или выбирать ответы, которые создают благоприятное впечатление. При других обстоятельствах респондентами может руководить стремление «притвориться плохими», показывая себя психологически более неблагополучными, чем это есть на самом деле. Такое может произойти, например, при тестировании лиц, привлеченных к суду за уголовное преступление.
Доказательств тому, с каким успехом респонденты могут притворяться при ответах на личностные опросники, более чем достаточно (см., например, Jacobs, & Barron, 1968; Radcliffe, 1966; Strieker, 1969; J. S. Wiggins, 1966). Этот факт можно легко продемонстрировать в любой студенческой аудитории, попросив различные группы принять определенные роли. Например, часть аудитории попросить руководствоваться в своих ответах на вопросы тем, как ответил бы на них удачливый и уравновешенный студент колледжа; другую часть — тем, как ответил бы на них плохо адаптированный человек; остальных попросить отвечать на вопросы о собственном поведении искренне. Можно также одним и тем же людям предъявить тест дважды: в первом случае с инструкцией симулировать в ответах какой-то определенный тип поведения, а во втором — отвечать правдиво. Результаты этих исследований есть яркое свидетельство той легкости, с которой умышленно создается при ответах на такие опросники желаемое впечатление. Интересно отметить, что не менее успешно может симулироваться профпригодность в ситуациях отбора кандидатов для конкретной работы (Wesman, 1952). Современные исследования показывают, что, особенно при использовании опросников типа стандартизованных самоотчетов, «очевидная валидность» (см. главу 5) задания увеличивает его подверженность фальсификации, причем как в реальных, так и в контролируемых лабораторных условиях. Чем легче респондентам распознать черту, оцениваемую по словесной формулировке пункта опросника, тем чаще они дают желательный ответ (Bornstein et al„ 1994).
Тенденция к выбору социально желательных ответов в опросниках типа стандартизованных самоотчетов необязательно означает сознательный обман со стороны от-
Часть 4. Тестирование личности
вечавшего. Эдварде (A. L. Edwards, 1957), первым исследовавший такую переменную, как социальная желательность, концептуализировал ее преимущественно как эффект фасада или тенденцию «выдвигать на первый план хорошие стороны», которую респонденты по большей части не сознавали. Эта тенденция может указывать на недостаточное проникновение в свои личные особенности, самообман или неготовность примириться с собственными недостатками. Другие исследователи (Crowne, & Marlowe, 1964; N. Frederiksen, 1965) представили доказательства в пользу того, что сила установки на социально желательные ответы связана с более общей потребностью индивидуума в самозащите, желанием избежать критики, социальной конформностью и стремлением заслужить социальное одобрение. С другой стороны, человеком, выбирающим неблагоприятные для описания самого себя утверждения, может двигать потребность во внимании, сочувствии или помощи в решении личных проблем. Например, заинтересованные в психотерапии лица при заполнении личностного опросника, по-видимому, могут показать себя менее приспособленными к действительности, чем это есть на самом деле.
К тому же не следует думать, что фундаментальные исследования свободны от влияния установок на ответы. В контексте изучения изменения аттитюдов, например, исследователи показали, что на результаты могут влиять такие условия, как чувствительность испытуемого к ожиданиям экспериментатора, желание сохранить свое лицо, стремление угодить экспериментатору или сорвать его планы (Silverman, & Shulman, 1970). Непредвиденными расхождениями в этих установках на ответы можно отчасти объяснить неполную воспроизводимость результатов при повторении экспериментов.
Некоторые исследователи (Paulhus, 1984,1986; Paulhus, & Reid, 1991) подчеркивали различие между понятиями «создания впечатления путем обмана» (impression та-nagementy и «самообмана» (self-deception) как толкованиями социально желательного — или нежелательного — реагирования. Создание впечатления путем обмана указывает на сознательное введение в заблуждение других с целью вызвать специфический эффект, желательный для респондента. Этот вид реагирования рассматривается как искажение данных самоотчета и как нечто такое, что само по себе должно быть оценено и, по возможности, сведено к минимуму или ограничено. С другой стороны, самообман обычно состоит в смещении ответов тестируемого, которые сам он считает совершенно верными, в положительную сторону и представляет собой гораздо более сложный феномен. Самообман связан с другими понятиями, имеющими отношение к «Я», такими как Я-образ (self-image) и самоуважение (self-esteem), а также с психоаналитическим понятием защитных механизмов. Поэтому эта переменная заслуживает изучения сама по себе, — как указывающая на хорошее приспособление к действительности, разумеется до известной степени, и как предсказывающая другие независимые критерии. Отмечалось, например, что некоторые шкалы стандартизованных самоотчетов могут давать результаты, которые показывают «иллюзорное психическое здоровье» у тех, кто с помощью такой защиты, как отрицание (defensive deniers) стремится сохранить веру в свою приспособленность к жизни (см., например, Shedler, Mayman, & Manis, 1993). Таким образом, связь между самообманом и приспособлением к действительности, скорее всего, не является простой, как, впрочем, и прямой. Вопрос еще больше усложняется тем обстоятельством, что, по-видимому, взаимодеи-
1 Вместо impression management иногда используются такие термины, как manipulation (манипулиро Ванне, подтасовка) и other-deception (обман других, жульничество).
Глава 13. Стандартизованные самоотчеты как метод изучения личности
ствие ряда лингвистических характеристик формулировок пунктов опросника с переменными респондента может вызывать систематическую ошибку в ответах (Helf-rich, 1986).
Для решения проблемы фальсификации и связанной с ней проблемы установок на ответ применялось несколько методик. В некоторых опросниках действие этих факторов можно снизить за счет конструирования относительно «тонких» или социально нейтральных формулировок их пунктов, однако, как показал Джексон (Jackson, 1971), часто именно эти пункты опросника имеют низкую валидность относительно измеряемой переменной. В идеале, да и в некоторых реальных ситуациях, тестовые инструкции и установление раппорта должны мотивировать тестируемых отвечать искренне, если они убеждены в том, что такие ответы пойдут им на пользу. Однако в определенных ситуациях такой подход оказывается неэффективным и, вероятно, не оказывает сколько-нибудь существенного влияния на несознаваемые тестируемыми установки отвечать в социально желательном ключе.
Другой подход к оценке социально желательного реагирования и других форм создания впечатления путем обмана состоит в конструировании специальных шкал, которые могут либо встраиваться в опросник, либо предъявляться в виде самостоятельных шкал в составе батареи тестов. Одной из самых первых шкал такого типа была шкала социальной желательности (SD) Эдвардса (Edwards, 1957), разработанная путем отбора пунктов опросника на основе сходства мнений экспертов относительно крайне высокой или низкой социальной желательности их формулировок. В других шкалах, таких как Шкала благоприятного впечатления из CPI и шкала SD Виггинса (J. S. Wiggins), формулировки отбирались на основе различий в частоте одобряемых ответов у тех, кто заполнял опросник в условиях, требующих «прикинуться хорошим», и у тех, кто заполнял опросник в нормальных условиях. Иллюстрацией третьего метода может служить входящая в состав MMPI шкала лжи, которая включает в себя пункты, сформулированные таким образом, что отвечать на них в социально желательном ключе будут лишь те респонденты, которые стремятся выставить себя нереалистически положительными. Придумывались и другие меры, нацеленные специально на обнаружение симуляции, недобросовестности или случайного характера ответов при заполнении опросников, такие, например, как F-шкала в ММР1} Еще один метод, нацеленный, однако, не на обнаружение, а на предотвращение симуляции, состоит в использовании заданий с вынужденным выбором.
Методика вынужденного выбора.В сущности, эта методика требует от респондента сделать выбор между двумя описательными терминами или фразами, которые выглядят одинаково приемлемыми, но различаются валидностью. Такие спаренные фразы в социальном отношении могут быть либо обе желательными, либо обе нежелательными. Задания, построенные по типу вынужденного выбора, могут состоять из 3,4 или даже 5 пунктов. В таких случаях респонденты должны указать, какая из фраз является для них наиболее, а какая наименее характерной. В еще одном варианте требуется выбрать между двумя контрастирующими ответами в рамках одной и той же черты, оцениваемыми по единой шкале. Хотя эта форма заданий редко используется в личностных опросниках, ее преимущество в том, что она обеспечивает получение нор-
Исчерпывающий обзор шкал для оценки симуляции при заполнении опросников дан в работе Berry, Wetter, & Baer (1995).
Часть 4. Тестирование личности
мативных, а не ипсативных показателей, и потому не накладывает искусственных ограничений на взаимосвязи между разными шкалами. В качестве примера можно назвать Индикатор типов Майерс—Бриггс, обсуждаемый в главе 16.
Использование методики вынужденного выбора для контроля социальной желательности требует двух типов сведений о каждой альтернативе ответа, а именно информации о ее социальной желательности (или знания «индекса предпочтения») ц информации о ее валидности (или знания «индекса различения»). Последний может определяться на основе любого конкретного критерия, для прогнозирования которого предназначен опросник, такого как академическая успеваемость или успех в конкретной работе; или же этот индекс может основываться на факторных нагрузках выбираемых ответов либо на их теоретической релевантности различным чертам личности. Социальную желательность можно определить на основе оценок репрезентативной группой альтернатив ответов в отношении данной переменной или путем подсчета частоты, с которой эти альтернативы встречаются в самоописаниях. Было показано, что частота выбора и оцененная социальная желательность очень сильно коррелируют (Edwards, 1957). Другими словами, усредненное самоописание популяции тесно согласуется с ее усредненным описанием желательной личности.
Хотя влияние фактора социальной желательности можно уменьшить благодаря использованию заданий с вынужденным выбором, вряд ли можно рассчитывать на его полное исключение. Когда EPPS предъявлялся в формате свободного выбора, его показатели довольно высоко коррелировали с показателями, полученными при предъявлении того же теста в формате вынужденного выбора (Lanyon, 1966). Более того, оцененная социальная желательность конкретных формулировок пунктов опросника не является раз и навсегда заданной величиной, но может различаться для лиц, преследующих разные професиональные или учебные цели. Поэтому тесты, построенные по типу вынужденного выбора, задания которых уравнивались относительно общей социальной желательности, все равно могли фальсифицироваться, когда на них отвечали претенденты на получение работы или абитуриенты университетских профессиональных школ, а также другие группы людей, преследующих конкретные цели. С другой стороны, было установлено, что когда формулировки пунктов опросника объединяют в пары на основе усредненных групповых суждений об общей социальной желательности, они могут оказаться далеко не одинаковыми для индивидуумов (N. Wiggins, 1966).
Итак, в том, что касается контроля фальсификации или установок на социальную желательность ответа, методика вынужденного выбора, по-видимому, оказалась не столь эффективной, как ожидалось. В то же время формат заданий с вынужденным выбором, особенно когда он используется для получения ипсативных показателей, вносит дополнительные технические трудности и не позволяет получить информацию об абсолютной силе индивидуальных особенностей, которая может иметь первостепенное значение в некоторых ситуациях тестирования.
Установки на ответ и стили ответов.Тенденция выбрать альтернативы ответа на основе социальной желательности — это только одна из нескольких установок на ответ, которые были выявлены при изучении ответов на опросники типа стандартизованных самоотчетов (Lanyon, & Goodstein, 1982, p. 158-169). Хотя многочисленная литература по действию установок на ответ в личностных опросниках появилась в основном после 1950-х гг., о влиянии установок на ответ в тестах способностей и личности писалось и раньше (см. Block, 1965, chap. 2). Одной из установок на ответ, давно
Глава 13. Стандартизованные самоотчеты как метод изучения личности 413
привлекшей к себе внимание исследователей, была установка на согласие (acquiescence), или тенденция отвечать «верно» или «да». Такое молчаливое согласие теоретически мыслится как непрерывная переменная: на одном конце шкалы находится последовательный «соглашатель», а на другом — последовательный «отрицатель» (Couch, & Keniston, 1960). При конструировании личностных опросников эта установка на ответ учитывается тем, что число пунктов шкалы, на которые ответ «да» или «верно» засчитывается как признак наличия измеряемой с ее помощью черты, должно быть равно числу пунктов, для которых таким ответом будет «нет».или «неверно». Такой сбалансированности можно достигнуть правильным отбором и переформулированием пунктов шкал, как это было сделано, например, в PFR и в настоящее время делается в новейших опросниках.1
Еще одной достаточно исследованной установкой на ответ является отклонение (deviation), или тенденция давать необычные или необщепринятые ответы. Берг (Berg, 1967) выдвинул эту гипотезу и продемонстрировал действие фактора отклонения на невербальном содержании специально разработанного теста, в котором требовалось выразить предпочтение одной из геометрических фигур. Шкалы, составленные из пунктов, на которые почти все тестируемые будут, вероятно, давать ответы одного типа, такие как шкала Редкости в PRF Джексона, как раз и предназначены для выявления отклоняющихся паттернов ответов. Однако сам Джексон, помимо других, указывал на то, что эти шкалы не всегда концептуально связаны с внешним критерием и потому порождают новые проблемы, особенно в таких ситуациях, как оценка профпригодности, где релевантность пунктов опросника содержанию профессиональной деятельности считается весьма важным условием. Именно по этой причине при пересмотре такого опросника, как/Р/, из него была исключена шкала Редкости (Jackson, 1994а). Тенденция использовать крайние точки на рейтинговой шкале (например, 1-ю и 7-ю на шкале с семью делениями) также была зафиксирована как возможная систематическая ошибка в ответах (Paulhus, 1991).
Исследование таких установок на ответ, как социальная желательность, согласие и отклонение, прошло несколько этапов. Кода установки на ответ были впервые обнаружены, они рассматривались как источник нерелевантной дисперсии или, иначе говоря, дисперсии ошибки, подлежащей устранению из тестовых показателей. Позднее эти установки на ответ стали рассматриваться как индикаторы широких и прочных характеристик личности, которые сами по себе заслуживали исследований и измерений (Jackson, & Messick, 1958, 1962; J. S. Wiggins, 1962). На этом этапе они обычно характеризовались как стили ответов (response styles), и в отношении них скрупулезно накапливались эмпирические данные. В конченом итоге эти данные были подвергнуты критике с разных точек зрения (Block, 1965; Heilbrun, 1964; Rorer, 1965). Блок (Block, 1965), например, представил убедительное доказательство правомерности содержательно-ориентированной интерпретации двух главных факторов, обычно выявляемых при объяснении большей части общей дисперсии в шкалах MMPI, которые (факторы) сторонники введения понятий «установка на ответ» и «стиль ответа» интерпретировали как социальную желательность и согласие.
' Хелмс и Реддон (Helmes, & Reddon, 1993) также показали, что в случае биполярных шкал с несбалансированными по ключу (да/нет) пунктами объем информации, передаваемый низкими показателями, существенно снижается.
Часть 4. Тестирование личности
Спорные вопросы установок на ответ и ставшая классической контроверза «содержание/стиль» в оценке личности так и не были полностью разрешены (Edwards, 1990-Hogan, & Nicholson, 1988; Jackson, & Paunonen, 1980).1 Большинство разработчиков тестов и исследователей, по-видимому, сходятся в том, что показатели личностных опросников скорее всего отражают своеобразную комбинацию самообмана, попыток обмануть других и реалистического изображения себя и что вес каждого из этих компонентов варьируется в зависимости от того, кто конкретно и при каких обстоятельствах тестируется. Некоторые, однако, расценивают попытки повысить достоверность данных самоотчета путем создания специальных шкал и заданий как приводящие к обратным результатам в том смысле, что это может снижать валидность шкал, особенно в отношении нормальных выборок в противоположность патологическим. Такие авторы пропагандируют использование навыков клинической работы, чтобы склонить пациента к сотрудничеству и адекватно проинтерпретировать показатели, а также дополнение тестовых данных рейтинговыми оценками от осведомленных информантов всякий раз, когда имеются основания подозревать серьезные искажения (см., например, Costa, & МсСгае, 1992а).
Большинство других работников, особенно связанных с оцениванием психопатологии, продолжают использовать так называемые шкалы «валидности», сознавая при этом, что они могут также отражать стили и характеристики личности. Фактически, в некоторых из новейших и технически более совершенных инструментов для оценки психопатологии, таких, например, как BPI Джексона и РЛ/Мори, используются и сбалансированные по ключу формулировки пунктов, и специальные шкалы для обнаружения установок на ответы, снижающие валидность. Уже образовалось новое множество таких шкал, примерами которых могут служить шкалы VRINw TRINm MMPI-2 и MMPI-A, построенных из специально подобранных пар сходных либо противоположных по содержанию утверждений и используемых для обнаружения непоследовательных или противоречивых ответов. Благодаря такому способу их построения шкалы VRINu TRIN, которые сходны с предложенной Грином (Greene, 1978) шкалой Недобросовестности (Carelessness scale) для оригинального MMPI, вероятно, свободны от смешанной дисперсии валидных черт личности (Ozer, & Reise, 1994).
В любом случае, споры вокруг установок на ответ и стилей реагирования стимулировали широкие исследования и вызвали к жизни несколько сотен публикаций. Подобно многим научным спорам, эта длительная полемика привела к заострению нашего внимания на методологических проблемах, что позволило лучше разобраться в них и, благодаря этому, усовершенствовать конструирование личностных опросников и их использование для решения научно-исследовательских и практических задач.