Установка на согласие (acquiescence)
Установки на ответы (response sets) были определены Кронбахом (Cronbach, 1946) как стилистическая последовательность, стимулируемая формой ответов на задания личностного опросника. Как указывалось ранее, одной из наиболее существенных является установка на согласие (см. Messick, 1962), то есть тенденция соглашаться с утверждением независимо от его содержания.
СБАЛАНСИРОВАННЫЕ ШКАЛЫ
Messick (1962) утверждает, что сбалансированная шкала - это один из способов минимизации влияния установки на согласие. Сбалансированной называется такая шкала, для которой равное или примерно равное количество заданий имеют ключевые ответы "да" или "нет", "верно" или "неверно".
Однако, здесь заслуживают внимания два момента. Во-первых, сбалансированная шкала не устраняет полностью тенденцию : установка на согласие все же может проявиться, но, как указывает Knowies (1963), такая шкала не позволит спутать "соглашающегося" испытуемого с тем, у кого реально высокие показатели, а это важно. Конечно, можно возразить, что "соглашающийся" испытуемый с потенциально высокими показателями не будет выявлен при сбалансированной шкале. Если это происходит чаще, чем в нескольких отдельных случаях, то последующее исследование валидности теста будет обречено на неудачу.
Во-вторых, искажающего влияния этой установки на показатели по тесту можно избежать только в том случае, если будут сформулированы в равной степени содержательные, недвусмысленные и побуждающие к определенному ответу задания, имеющие как положительные, так и отрицательные ключевые ответы. Если вы сможете сформулировать лишь очень небольшое количество заданий с ключевым ответом "нет", то эти задания будут способствовать низкой валидности шкалы. Несколько примеров пояснят это.
Пример 1. Рассмотрим вопрос на экстравертированность: "Вам нравятся вечеринки?" Обратной формой этого вопроса будет: "Вам не нравятся вечеринки?" В этих заданиях стилистические обороты языка удовлетворительны, потому что принято говорить, что вечеринки нравятся или не нравятся. Они также удовлетворительны, потому что, как это и случается, испытуемому с высоким показателем по параметру экстраверсии нравятся вечеринки, а испытуемому с низким показателем - не нравятся. Таким образом, полярность этих заданий эффективна. Однако, часто попытка получить обратную форму вопроса становится источником ошибок.
Пример 2. Следующее задание было создано, чтобы выявить удовлетворение, получаемое от статистики - как утверждают, оно относится к чертам навязчивости: "Являетесь ли вы одним из тех людей, кто находит статистические данные и таблицы совершенно скучными?" Это обратная форма вопроса с ключевым ответом "нет". Однако, очевидно, (прежде чем первое испытание теста показало, что этот вопрос не работает), можно не считать статистику скучной, но и не восхищаться ею. Таким образом, обращение вопросов, когда они относятся к некоторым крайним проявлениям в поведении, вероятнее всего не даст результата в силу континуальности, лежащей в основе многих ответов на задания. Обращение вопросов обычно предполагает дихотомичность ответа. Другими словами, если ответ на вопрос является дихотомическим, то обращение вопроса для сбалансированной шкалы возможно; если же используются крайние (граничные) значения из континуума, обращение не будет удачным.
Пример 3. Аналогично, можем рассмотреть вопрос о том, нравится ли испытуемым отдавать распоряжения. Обратная форма вопроса, такая как: "Вы не испытываете удовольствия, когда вам вменяется в обязанность отдавать распоряжения?" - не может быть удачной, потому что возможны случаи, когда отрицание неприязни к распоряжениям, приказам вовсе не означает получение удовольствия от этого. В основе этого ответа лежит континуум, а не дихотомия. Этот вопрос не может быть обращен.
Пример 4. В данном задании рассматривается аккуратность: "В школах сильно преувеличивают значение аккуратности". Можно утверждать, что навязчиво аккуратный индивидуум будет считать, что значение этой особенности поведения невозможно преувеличить. Следовательно, данное задание было написано так, чтобы отрицательный ответ действительно выявлял исследуемую черту. Таким образом, с точки зрения разработки заданий, это жизнеспособное "негативное" задание.
В этих примерах проиллюстрированы два наиболее важных момента в формулировании заданий с отрицательными ключевыми ответами: они могут быть сформулированы, во-первых, если отрицательный ответ соответствует реальному поведению, и во-вторых, если в основе ответов лежит дихотомия, а не континуум, как в приведенном выше примере 1.
ПОНЯТНЫЕ, НЕДВУСМЫСЛЕННЫЕ УТВЕРЖДЕНИЯ
Имеющий значение в контексте нашей работы вопрос был поднят Guilford (1959) при попытке устранить установку на согласие из личностных опросников. Он утверждает, что согласие наименее вероятно тогда, когда задания понятны, недвумысленны и относятся к конкретному поведению. Поскольку эти качества уже были указаны среди тех, которые, по моему предположению, должны быть присущи разрабатываемым заданиям, я не буду более говорить о них, а лишь проиллюстрирую это положение несколькими примерами.
Так, вопрос: "Играете ли вы на каком-либо музыкальном инструменте?",-является настолько конкретным, что индивидуум должен был бы иметь предельно выраженную установку на согласие, чтобы утвердительно ответить на этот вопрос, если это не соответствует истине. С другой стороны, вопрос: "Нравится ли вам музыка?"- настолько неопределенный (в том, где же критерий того, что музыка нравится?), что согласие вероятно будет фактором, влияющим на положительные ответы в этом вопросе. В последнем примере есть две особенности. Прежде всего, обратите внимание, что данный вопрос несравним с вопросом: "Нравятся ли вам вечеринки?" В этом вопросе критерий того, нравятся ли вечеринки, известен каждому: частые посещения с желанием и энтузиазмом. Следовательно, этот вопрос - практически сокращенная форма вопроса: "Посещаете ли вы много вечеринок?" Таким образом, для него вероятность подвергнуться влиянию установки на согласие меньше, чем для вопроса: "Любите ли вы музыку?"
К этой особенности относится и неопределенное утверждение "нравится музыка". Это выражение бесполезно в задании. Так, слово "нравится" может соответствовать разнообразным чувствам: от тех, которые испытывают великие композиторы и исполнители, когда слушают, пишут или исполняют музыку, до чувств человека, который любит слушать популярные песенки, совершая субботние покупки. Подобно этому, термин "музыка" означает огромное разнообразие различных направлений: например, джаз, поп, народная музыка, рок, барокко, доклассическая, классика, романтизм, модерн, неоклассицизм, - а, кроме того, может иметь отношение к слушанию и исполнению, так что идентичные ответы на вопрос могут отражать совершенно различное поведение. Например, "да" для испытуемого 1 может отражать наслаждение от пения контр-тенора в ранней полифонической венецианской церковной музыке. А для испытуемого 2 это может отражать удовольствие прослушивания мотивчика типа "Танцуй со мной", когда он сидит за рулем своей машины. Любое задание, в результате оценки которого оказывается, что столь разные области поведения будут отнесены к одному и тому же классу, с очевидностью является бесполезным.
ПРОВЕРКА ВЛИЯНИЯ УСТАНОВКИ НА СОГЛАСИЕ
До сих пор все наши усилия были направлены - при помощи сбалансированных шкал и формулирования предельно ясных и конкретных заданий - на уменьшение влияния установки на согласие или на то, чтобы сделать менее вероятным получение за счет тенденции к согласию высоких показателей по переменной, для измерения которой предназначен тест. Однако, как уже говорилось, действие этой установки возможно даже при сбалансированных шкалах, и далеко не всегда можно создать настолько понятные вопросы, чтобы быть уверенным, что влияние установки устранено. Поэтому разработаны методики, предназначенные для проверки того, была ли установка на согласие фактором, влияющим на ответы. Эти методики будут описаны в главе 6.
Социально одобряемые ответы
Edwards (1957) показал на материале с заданиями ММРI, что наблюдается высокая положительная корреляция между степенью социальной желательности утверждений, оценивавшейся экспертами, и количеством реальных социально одобряемых ответов на них испытуемыми. Поэтому он утверждает, что данная установка должна детерминировать ответы на задания и, следовательно, является основным источником невалидности тестов. Хотя, очевидно, невозможно полностью устранить влияние установки на социально одобряемые ответы, есть разнообразные приемы, полезные для уменьшения ее влияния. Эти приемы описаны ниже.
ЗАДАНИЯ С ВЫНУЖДЕННЫМ ВЫБОРОМ, ПОДОБРАННЫЕ ПО ИХ СОЦИАЛЬНОЙ ЖЕЛАТЕЛЬНОСТИ
В списке личностных предпочтений (Personal Preference Schedule) Эдвардса (EPSS) (Edwards, 1959), как мы уже отмечали в обсуждении типов заданий (см. п. 8 на стр.95), задания состоят из двух утверждений, подобранных по социальной желательности, одно из которых испытуемый должен выбрать. Это радикальное решение для устранения влияния установки на социально одобряемые ответы. Однако, этот метод не получил поддержки по следующим причинам.
(1) Крайне трудно получить согласованные утверждения, релевантные также в терминах содержания, которое мы хотим измерить {Edwards, 1957). Действительно, серьезное возражение против EPPS - это то, что данный тест является немногим более, чем упражнением по конструированию тестов, и мало свидетельств того, что он измеряет переменные с какой-либо эффективностью (см. Kline, 1979).
(2) Любые незначительные различия в социальной желательности между частями заданий имеют тенденцию увеличиваться, когда они предъявляются вместе, как это предусмотрено в форме вынужденного выбора, что сводит на нет большинство из усилий по подбору утверждений.
(3) Экспертное оценивание социальной желательности - значительное упрощение данного явления. Это становится ясно из того, как получается средняя экспертная оценка социальной желательности для каждого задания. Для этого предполагается, что социальная желательность одномерна (хотя a priori это не так). В действительности было бы нужно многомерное шкалирование влияния социальной желательности по всем заданиям, и затем подсчет показателей по отдельным измерениям - процедура, которая могла бы быть, несомненно, рекомендована в свете приведенного выше пункта (2)! Кроме того, как указывает Messick (1960), социальная желательность сама по себе допускает значительные индивидуальные различия : то, что социально желательно для члена парламента, почти наверное не является таковым для лондонского докера.
Исходя из этих трех причин, не рекомендуется прибегать к такому радикальному и, по-видимому, недостаточно эффективному шагу, как конструирование спаренных заданий, подобранных по их социальной желательности.
ИЗБЕГАЙТЕ ЯВНО СОЦИАЛЬНО ЖЕЛАТЕЛЬНЫХ / НЕЖЕЛАТЕЛЬНЫХ ЗАДАНИЙ
Существует ряд характеристик и качеств, с которыми мало кто захочет согласиться, по крайней мере в среде образованных европейцев. Они настолько очевидны, что когда мы проиллюстрируем их ниже несколькими примерами утверждений, то они покажутся явно абсурдными. Вот несколько примеров утверждений, которые являются явно социально желательными или нежелательными:
(1) Я с трудом переношу неудачи: (да, нет).
(2) Я не понимаю юмор: (да, нет).
(3) Я постоянно лгу: (да, нет).
(4) Я мало сексуален: (да, нет).
(5) Я сексуальный психопат: (да, нет).
(6) Я не могу контролировать свои эмоции: (да, нет).
(7) Я завистливый и ревнивый человек: (да, нет).
(8) Я скупой: (да, нет).
(9) Когда возможно, я отлыниваю от работы: (да, нет).
(10) Я лгу, чтобы избавиться от хлопот: (да, нет).
(11)Я ненавижу негров: (да, нет).
(12) Я в основе своей антисемит: (да, нет).
По нашему опыту разработки тестов, мы были бы сильно удивлены, если бы любой из двенадцати приведенных примеров оказался приемлемым даже для исследовательского теста. Например, для тестов личности, используемых в профотборе, они будут совершенно бесполезными. Представьте себе утверждение (11)в тесте, предназначенном для работников социального обеспечения, или утверждение (12) в тесте, предложенном человеку, надеющемуся получить работу в фирме, владельцем которой является еврей.
ИЗМЕРЕНИЕ СОЦИАЛЬНО ЖЕЛАТЕЛЬНЫХ ИЛИ НЕЖЕЛАТЕЛЬНЫХ ЧЕРТ
Если измерению подлежат социально желательные или нежелательные черты, при разработке заданий следует избегать прямолинейного подхода, как в перечисленных выше утверждениях. Два примера пояснят сказанное.
Пример 1. Задание для измерения скупости. Поскольку (см. утверждение 8 выше) прямой подход не годится, я утверждал при разработке теста AI3Q, что скупой человек вполне мог бы думать, что содержащиеся в народной мудрости высказывания о бережливости очень разумны, тоща как на менее скупого они не произвели бы впечатления. Следовательно, я попытался сформулировать задание следующим образом: "Каждый ребенок должен знать, что бережливость лучше богатства." Похоже, что в этом задании ответы как "да", так и "нет", не имеют отношения к социальной желательности (не являются социально одобряемыми). Действительно, этот вопрос оказался удачным по всем результатам анализа заданий.
Пример 2. Задание для выявления мстительности. Мало кто подтвердит утверждение: "Я мстителен." Однако, как уже говорилось, мстительные индивидуумы обычно проецируют свою мстительность на других, т.е. действуют механизмы защиты. Таким образом, я сконструировал утверждение: "Поступками большинства революционеров руководит мстительная жестокость." Я подумал, что мало кого из испытуемых можно было бы действительно причислить к революционерам, так что мнения обследуемых будут отражать их собственные защитные реакции и стремления. Это задание оказалось удачным, и я полагаю, что проекция - это механизм, действие которого может быть использовано в формулировании вопросов, которые слишком социально нежелательны, чтобы задавать их прямо.
Пример 3. Задание для выявления лености. Если опираться на механизм проекции, то можно сформулировать утверждение так: "Промышленность сегодня находится в плачевном состоянии, потому что рабочие в основном ленивы." Следует заметить, что если это утверждение рассматривается некоторыми испытуемыми как факт, то есть не "включает" проективный механизм, то анализ заданий полностью выявит это: вопрос не будет работать.
ИСПОЛЬЗОВАНИЕ ШКАЛЫ ЛЖИ
Некоторые авторы (например, Айзенк в тестах ЕРI и EPQ) вводят особую группу заданий для выявления тех лиц, которые склонны давать социально одобряемые ответы. Они состоят из вопросов, касающихся незначительных проступков, которые, увы, иногда совершаются большинством людей. Набравший наибольшее количество баллов по такой шкале рассматривается как дающий социально одобряемые ответы, а поэтому его показатели по тесту могут быть проигнорированы. Хотя Eysenck и Eysenck (1976), исходя из факторного анализа заданий теста EPQ утверждают, что шкала лжи измеряет определенную личностную переменную, для практического тестирования со значительным потоком испытуемых этот прием для обнаружения установки на социально одобряемые ответы весьма полезен.
Вот некоторые типичные утверждения шкалы лжи: "Я никогда не лгу"; "Я всегда прихожу вовремя на встречи и свидания"; "Я всегда плачу за проезд на транспорте".
АДЕКВАТНЫЙ АНАЛИЗ ЗАДАНИЙ И ВАЛИДИЗАЦИЯ ТЕСТА
Несмотря на все сказанное, я по-прежнему утверждал бы, что при соответствующем анализе и отборе заданий во время разработки теста, при тщательной валидизации теста, как и в случае с установкой на согласие, влиянием тенденции к социально одобряемым ответам можно пренебречь.
(1) Анализ заданий. По определению, наличие в тесте задания, провоцирующего социально одобряемые реакции, должно приводить к тому, что распределение ответов на него будет смещено, то есть не будет соответствовать нормальному распределению. Таким образом, устранением из теста заданий с распределением ответов, отличным от нормального, мы избавимся от действия установки на социально одобряемые ответы. Более того, если большинство заданий дают нормальное распределение ответов и они нагружены некоторым общим фактором, тогда установка на социально одобряемые ответы не может оказывать сильное влияние и на другие задания, относящиеся к тому же фактору. Подобные аргументы приводятся при анализе заданий с использованием бисериальной корреляции результатов выполнения каждого задания с общим показателем по тесту. Таким образом, при адекватном анализе те задания, результат выполнения которых подвержен влиянию установки на социально одобряемые ответы, должны быть устранены, если только, по нелепой случайности, все задания, выбранные нами для теста, не оказались измеряющими эту черту. Возможность возникновения этой ситуации должна проверяться при валидизации теста.
(2) Валидизация теста. Более важной процедурой, нежели проверка на тенденцию к социально одобряемым ответам, является валидизация теста. Если мы покажем, что тест валиден, то тогда не имеет значения, влияет ли на его выполнение установка на социально одобряемые ответы, или нет. Один из путей доказательства того, что тест свободен от действия установки на социально одобряемые ответы, - показать при исследовании валидности, что он не связан со шкалой социальной желательности Кроуна-Марлоу (Crowne-Marlowe Social Desirability Scale; Crowne и Marlowe, 1964), шкалой, coстоящей из явно социально желательных (нежелательных) утверждений.
ВЫВОДЫ ОТНОСИТЕЛЬНО УСТАНОВКИ НА СОЦИАЛЬНО ОДОБРЯЕМЫЕ ОТВЕТЫ
Нет сомнения, что установка на социально одобряемые ответы может влиять на результаты выполнения заданий, и, следовательно, на показатели тестов личности. Несмотря на это, ее влияние может быть минимизировано. Вот некоторые выводы:
(1) Следует всячески избегать заданий с явно социально желательной или нежелательной окраской.
(2) Процедура анализа заданий позволит устранить те задания, ответы на которые явно смещены в одном направлении ("да" или "нет").
(3) Должна быть всегда продемонстрирована валидность теста, что позволит окончательно устранить все задания, в ответах на которые сказывается установка на социальную желательность.
(4) Нет необходимости предпринимать столь тщательно разрабатываемые меры предосторожности против установки на социальную желательность, как это делал Edwards (1957).
Другие установки на ответы
ТЕНДЕНЦИЯ ПОДТВЕРЖДАТЬ КРАЙНИЕ ОТВЕТЫ
Это тенденция, сказывающаяся в рейтинговых шкалах и таких тестах, как, например, тест личностных шкал Комрея (Cornrey Personality Scales; Cornrey, 1970), то есть тех, в форму заданий которых входят рейтинговые шкалы. С моей точки зрения, преимущества рейтинговых шкал (в плане чувства удовлетворения у тех испытуемых, которые полагают, что на вопросы лучше отвечать в такой форме) сводятся на нет проблемами, возникающими с теми испытуемыми, которые склонны подтверждать крайние ответы. Для того, чтобы не спутать их с лицами, имеющими высокие показатели по тесту, сбалансированная шкала уже не поможет, потому что при такой установке каждый из крайних пунктов шкалы одинаково привлекателен. Единственный способ избежать этой проблемы - не использовать задания данного типа. Если же мы по каким-либо причинам вынуждены использовать такие шкалы, то тщательный анализ заданий и валидизация переменных теста, вероятно, смогут устранить те вопросы (утверждения), которые особенно побуждают испытуемых проявлять эту установку.
Как утверждает Guilford (1959), наиболее благоприятной почвой для проявления любых установок на ответы являются те задания, которые неопределенны, неоднозначны и неконкретны. Значение этого утверждения невозможно преувеличить. Формулирование заданий путем следования указанным выше правилам позволит минимизировать влияние установок. Более того, тщательная валидизация теста продемонстрирует, что влияние этих искажающих факторов незначительно. Однако, это влияние не будет столь несущественным, если не будут приняты меры предосторожности. Применительно к установкам на крайние ответы можем рекомендовать избегать использовать задания типа рейтинговых.
ТЕНДЕНЦИЯ К ПОДТВЕРЖДЕНИЮ СРЕДНИХ ЗНАЧЕНИЙ
Несомненно, лучший способ избежать проявления этой установки - это использовать дихотомические задания. Однако, у некоторых испытуемых возникают сложности при работе с дихотомическими заданиями. Они считают, что на них невозможно отвечать, а поэтому (для этих испытуемых) желательно введение некоторой средней категории ответов. Исследования (Bendig, 1959) показали столь высокую корреляцию между дихотомическими и трихотомическими заданиями, что риск проявления побочных явлений, подобных обсуждаемому, не оправдывает использования последних.
Хорошо сформулированные задания могут быть написаны так, что выбор средней категории не будет притягательным для испытуемых. Эта категория ответов особенно привлекательна тогда, когда оба крайних значения в равной степени не затрагивают, безразличны для испытуемых. Например: "Что бы вы предпочли: (а) осмотреть консервный завод; (б) пойти в местный музей; (в) не знаю?" Как могут быть выявлены такие вопросы при проверке теста в том случае, когда мы используем дихотомические задания? Автор данной книги использовал такой прием: во время проверки теста он снабдил его специальной инструкцией, в которой указывалось, что все задания, при выполнении которых испытуемым потребовалась средняя категория ответов, должны быть помечены крестиком. От тех заданий, которые часто отмечаются таким образом, лучше отказаться, если только они не оказались особенно эффективными в ходе анализа заданий.
Задания, для которых необходима средняя категория ответов, не смогут пройти процедуру анализа и будут автоматически устранены, а исследование валидности может показать, что установка на средние ответы не является существенным источником ошибок.
Довольно об установках на ответы. Если будут использоваться те приемы, о которых речь шла выше, то мы склонны полагать, что влияние установок на ответы будет минимальным. Дальнейшая валидизация тестов покажет, действительно ли это так.
Содержание вопросов (утверждений)
До сих пор при обсуждении принципов конструирования заданий основное внимание уделялось их форме. При этом мы предполагали, что знаем, какие черты (особенности) пытаемся тестировать. Тем не менее, справедливо было бы спросить, каким же именно образом мы принимаем решения о содержании заданий. Трудно делать общие заключения об этом, поскольку многое зависит от особенностей конкретной области поведения, для диагностики которой мы хотим разрабатывать тест личности. Чтобы проиллюстрировать, как принимать решения о содержании тестов, я приведу несколько примеров.
Теоретический пример
Kline (1968) выполнил экспериментальное исследование особенностей анального характера (Freud, 1908), в ходе которого для конструируемого теста было поставлено большое количество эмпирических задач. Существует ли анальный характер? Если да, то измеряется ли он другими личностными опросниками? Имеет ли он отношение к научению ребенка справлять большую нужду? Изменяется ли он от культуры к культуре, как следовало бы ожидать, исходя из психоаналитической теории? Чтобы ответить на эти вопросы, было необходимо сконструировать и валидизировать инструмент для измерения анального характера. Чтобы сделать это, я должен был решить, какие черты должны войти в тест.
Далее следует краткое описание того, как содержание вопросов (утверждений) было отшлифовано, прежде чем они превратились в задания теста. Получившийся в результате этого тест (Ai3Q), похоже, выдержал подробные критически проверки (см. Kline, 1978). Были подробно изучены психоаналитические описания анального характера (напр., Abraham, 1921; Jones, 1923; Menninger, 1943), и составлен список всех черт и специфических примеров поведения. Примеры из публикации Jones (1923) перечислены ниже.
(1) Промедление в удовлетворении потребностей, доводимое до их интенсивной концентрации, монотонная настойчивость, своевольная независимость - уверенность, что никто не может сделать что-либо так хорошо, как он сам.
(2) Неспособность перепоручать работу.
(3) Мелочное внимание к подробностям.
(4) Нежность к детям.
(5) Склонность к доминированию.
Подобным образом был собран длинный подробный список черт и особенностей поведения. Затем они были преобразованы в задания теста с использованием всех тех правил и приемов, которые обсуждались в данной главе.
Практический пример
Нет сомнений в том, что полезно иметь инструмент для измерения агрессивности, например, в центре по перевоспитанию правонарушителей или для малолетних заключенных. Основным подходом в этом случае было бы составление списка всех проявлений агрессивности, которые только можно вообразить, преобразование их в задания и апробация на соответствующей выборке. Следует отметить, что при таком подходе не стоит вопрос о том, что есть агрессия как личностное измерение. Для этого необходимо специальное исследование. Так, факторный анализ заданий продемонстрировал бы, есть ли только одно измерение, ряд коррелирующих между собой измерений, несколько некоррелирующих измерений или ни одного реального синдрома поведения, которые могли бы быть значимо описаны как агрессивность.
Получение содержания задания
Возвращаясь к нашему примеру, отметим, что есть набор признаков агрессивного поведения, которые бы могли быть использованы в заданиях: постоянно дерется (не в шутку); когда раздражен, вступает в драку по любому поводу; использует в драке разбитые бутылки; носит с собой бритвы, кастеты, велосипедные цепи, складные ножи, ремни с металлическими бляхами, имеет тяжелые ботинки; бьет упавших противников ногами; избивал кого-либо до потери сознания; страдал от несправедливости и оскорблений; кричит, если раздражен; разбрасывает вещи по комнате; лжет, чтобы раздразнить конкурентов; придумывает страшные истории. Затем подобный список при помощи приемов, описанных в данной главе, может быть преобразован в задания теста.
Заключение
При тех сложных и неизбежно неточных инструкциях для конструирования заданий тестов личности, приведенных в данной главе, наиболее ценным может оказаться краткое пошаговое описание интересующей нас процедуры. Оно и приводится ниже. Полное обоснование всех этих положений содержится в тексте главы.
(1) Перечислите черты и особенности поведения из описаний в психологической литературе.
(2) Преобразуйте описание каждой черты или особенности поведения в задание. Это лучше всего сделать при помощи обычных форм заданий опросников: (а) дихотомических заданий (типа "да-нет"); (б) трихотомических заданий (типа "да-?-нет"): (в) альтернативных заданий; (г) заданий типа "нравится-не нравится"; (д) заданий с вынужденным выбором; (е) заданий с рейтинговыми шкалами. Выбор формы задания зависит от особенностей используемого материала и оценки преимуществ и недостатков каждого типа заданий.
(3) Независимо от используемого типа заданий старайтесь, чтобы назначение каждого задания не было слишком очевидным.
(4) формулируйте каждое задание понятно и недвусмысленно.
(5) Насколько возможно, обеспечьте, чтобы каждое задание относилось к какой-либо конкретной области поведения.
(6) В каждом задании должен содержаться только один вопрос или одно утверждение.
(7) Избегайте использовать термины частоты и другие субъективные выражения.
(8) Когда это возможно, задания должны касаться поведения, а не чувств и отношений.
(9) Обеспечьте, чтобы ответы на задания давались быстро.
(10) Избегайте влияния основных установок на ответы, таких как установка на согласие и установка на социально одобряемые ответы.
(11) Вероятность проявления установки на согласие лучше всего уменьшается формулированием понятных заданий и использованием сбалансированных шкал.
(12) Проверьте при помощи процедур анализа заданий то, что тенденция к согласию - несущественный фактор.
(13) Установки на социально одобряемые ответы легче всего избежать путем тщательного формулирования заданий.
(14) Проверьте при помощи техники анализа заданий, что установка на социально одобряемые ответы - несущественный фактор.
(15) Избегайте с помощью адекватной формы заданий влияния установок на выбор крайних или средних категорий ответов.
(16) Проверьте при помощи процедуры валидизации, что влияние установок на ответы не является существенным. Если тесты валидны, то установки на ответы не могут оказывать влияние на их показатели.
ГЛАВА 4. СОЗДАНИЕ НАДЕЖНЫХ ТЕСТОВ III:
КОНСТРУИРОВАНИЕ ТЕСТОВ ДРУГИХ ТИПОВ.
В этой главе будет обсуждаться разработка заданий и подбор материала для других типов психологических тестов. Многое из того, что уже обсуждалось, особенно в предыдущей главе, применимо и здесь, а поэтому не будет упоминаться вновь. Основное внимание будет уделено приемам, специфичным для конструирования объективных тестов личности или темперамента, проективных тестов, инструментов измерения настроения и интересов и, наконец, шкалам аттитюдов. Начнем с объективных тестов.
Объективные тесты
Определение
Определение, используемое здесь, принадлежит Кэттеллу и его коллегам (напр., Cattell, 1957). Объективный тест - это тест, цель которого скрыта от испытуемого (а поэтому результаты не могут быть фальсифицированы), и данные, полученные с его помощью, могут быть оценены независимо от лица, проводящего тестирование и интерпретацию. Преимущество таких тестов состоит в их практическом значении. Когда испытуемые не могут произвольно манипулировать показателями, такой тест может быть использован в процедурах профотбора. Это означает, что на протяжении многих лет может быть накоплено огромное количество подлинно жизненных критериальных данных о соответствии между профессиональными успехами и переменными объективных тестов. Кроме того, отсутствие возможности произвольного искажения результатов полезно и в тех областях, в которых предъявляются менее жесткие требования, таких как профориентация и психиатрия. Однако и в случае объективных тестов мы не можем быть уверены, что испытуемые не будут искажать их результаты.
В объективных тестах произвольная фальсификация псе же возможна. Так, в тесте "Slow Line-Drawing Test" испытуемые могут чертить линии не так плавно, как они в состоянии это делать. Однако, они не знают, ни как это скажется на их показателях, ни даже самих показателей. Подобное неповиновение инструкциям само по себе симптоматично для определенных черт личности, и на деле может быть использовано как переменная объективного теста.
Последнее предложение дает нам ключ к разрешению основной и имеющей глубокие корни проблемы конструирования объективных тестов. В соответствии с нашим определением, почти любое задание, которое может быть объективно оценено и не является непосредственной реакцией на вопрос (как в тестах личности), может быть объективным тестом. Например, данную страницу рукописи можно использовать для получения следующих объективно тестируемых переменных:
(1) Продолжительность времени написания.
(2) Количество слов на странице.
(3) Количество существительных.
(4) Количество глаголов.
(5) Количество зачеркиваний.
(6) Давление пера при письме.
(7) Количество имен собственных.
Конечно же, психологическое значение таких переменных неизвестно - это вторая проблема, связанная с объективными тестами. Следовательно, в процессе создания объективных тестов нам предстоит решить и эту проблему. На каком основании мы можем отбирать объективные тесты (которых, по определению, может быть очень много), чтобы хоть в какой-то мере надеяться на то, что они валидны? Если тест является очевидно валидным, то он уже не является объективным, так как может быть угадана его цель. Следовательно, нам необходимы некие общие принципы для конструирования объективных тестов - таксономия объективных тестов.
Преимущества объективных тестов
При наличии упомянутых выше проблем, возникающих при разработке объективных тестов, вполне резонно спросить, стоит ли пытаться их разрабатывать, особенно если учесть то, что их единственное преимущество, - значительно меньшая вероятность фальсификации результатов, нежели в других методиках. В конце концов, лучше иметь валидный тест, результаты которого, вероятно, могут быть искажены испытуемым, чем невалидный, но противостоящий всем попыткам фальсификации.
Саttell и Kline (1977) утверждают, что существует теоретическое преимущество объективных тестов, и столь значительное по сравнению с опросниками, что усилия, затраченные на разработку валидных объективных тестов, вполне оправданы. Дело прежде всего а том, что значение (смысл) слов и содержание вопросов изменяются со временем, а это ставит под вопрос состоятельность лонгитюдных исследований личности. Значение наших вопросов (утверждений), конечно же, изменяется от культуры к культуре, поэтому проведение кросс-культурных исследований личности при помощи опросников чрезвычайно сложно, если вообще возможно. Неоспорим и тот факт, что с различиями в понимании наших заданий мы сталкиваемся при обследовании разных общественных классов в рамках одной и той же культуры. Kelly (1955) как-то даже заявил, что значения слов настолько различны для разных индивидуумов, что любая форма стандартизированного тестирования не имеет сколько-нибудь значительной диагностической ценности. Вследствие этого Келли и его последователи придавали особое значение методике репертуарных решеток, где каждая решетка была индивидуальна для испытуемого, чьи качества исследовались. Несколько примеров убедят в наличии этого обстоятельства.
(1) "Нравятся ли вам веселые вечеринки?" (англ.: "Are you like gay parties?"). По-русски этот вопрос звучит весьма прилично и вполне приемлем как задание теста. По-другому дело обстоит с его английским вариантом. Примерно до 1960 года этот вопрос (в англоязычных странах) не имел гомосексуального подтекста. "Gay party" - это была вечеринка, отличавшаяся доброжелательным отношением ее участников друг к другу, живым весельем и юмором. Сегодня словосочетание "gay party" означает "встреча для гомосексуалистов".
(2) "Нравится ли вам игра "Урони платок"?" Этот вопрос имеет смысл только в условиях северо-американской культуры: ни в Англии, ни в других странах Европы в эту игру не играют и, следовательно, там ее скрытый смысл не известен. Поэтому этот вопрос нельзя использовать в кросс-культурных исследованиях.
(3) "Регулярно ли вы ходите в кино?" Сейчас положительный ответ на этот вопрос указал бы на неподдельный интерес к фильмам. А двадцать лет назад, до всеобщего распространения телевидения, посещение кинотеатра было принятой большинством людей формой развлечения, и ответ "нет" мог, вероятно, представлять интерес.
Объективные тесты, напротив, должны помочь выявить данные, которые не подвержены влиянию изменяющегося смысла заданий, а, следовательно, необходимы для изучения тех преобразований личности, которые происходят во времени, а также для сравнения различных групп.