Глава 3. создание надежных тестов ii: личностные опросники. разработка заданий.
Пол Клайн
Устранение влияния установок на ответ
Кроме того, что при разработке заданий следует всегда помнить о вышеперечисленных правилах, необходимо, конечно, ослабить, насколько это возможно, влияние наиболее существенных установок на ответ. Ниже описано, как это следует делать.
Содержание вопросов (утверждений)
До сих пор при обсуждении принципов конструирования заданий основное внимание уделялось их форме. При этом мы предполагали, что знаем, какие черты (особенности) пытаемся тестировать. Тем не менее, справедливо было бы спросить, каким же именно образом мы принимаем решения о содержании заданий. Трудно делать общие заключения об этом, поскольку многое зависит от особенностей конкретной области поведения, для диагностики которой мы хотим разрабатывать тест личности. Чтобы проиллюстрировать, как принимать решения о содержании тестов, я приведу несколько примеров.
Теоретический пример
Kline (1968) выполнил экспериментальное исследование особенностей анального характера (Freud, 1908), в ходе которого для конструируемого теста было поставлено большое количество эмпирических задач. Существует ли анальный характер? Если да, то измеряется ли он другими личностными опросниками? Имеет ли он отношение к научению ребенка справлять большую нужду? Изменяется ли он от культуры к культуре, как следовало бы ожидать, исходя из психоаналитической теории? Чтобы ответить на эти вопросы, было необходимо сконструировать и валидизировать инструмент для измерения анального характера. Чтобы сделать это, я должен был решить, какие черты должны войти в тест.
Далее следует краткое описание того, как содержание вопросов (утверждений) было отшлифовано, прежде чем они превратились в задания теста. Получившийся в результате этого тест (Ai3Q), похоже, выдержал подробные критически проверки (см. Kline, 1978). Были подробно изучены психоаналитические описания анального характера (напр., Abraham, 1921; Jones, 1923; Menninger, 1943), и составлен список всех черт и специфических примеров поведения. Примеры из публикации Jones (1923) перечислены ниже.
(1) Промедление в удовлетворении потребностей, доводимое до их интенсивной концентрации, монотонная настойчивость, своевольная независимость - уверенность, что никто не может сделать что-либо так хорошо, как он сам.
(2) Неспособность перепоручать работу.
(3) Мелочное внимание к подробностям.
(4) Нежность к детям.
(5) Склонность к доминированию.
Подобным образом был собран длинный подробный список черт и особенностей поведения. Затем они были преобразованы в задания теста с использованием всех тех правил и приемов, которые обсуждались в данной главе.
Практический пример
Нет сомнений в том, что полезно иметь инструмент для измерения агрессивности, например, в центре по перевоспитанию правонарушителей или для малолетних заключенных. Основным подходом в этом случае было бы составление списка всех проявлений агрессивности, которые только можно вообразить, преобразование их в задания и апробация на соответствующей выборке. Следует отметить, что при таком подходе не стоит вопрос о том, что есть агрессия как личностное измерение. Для этого необходимо специальное исследование. Так, факторный анализ заданий продемонстрировал бы, есть ли только одно измерение, ряд коррелирующих между собой измерений, несколько некоррелирующих измерений или ни одного реального синдрома поведения, которые могли бы быть значимо описаны как агрессивность.
Получение содержания задания
Возвращаясь к нашему примеру, отметим, что есть набор признаков агрессивного поведения, которые бы могли быть использованы в заданиях: постоянно дерется (не в шутку); когда раздражен, вступает в драку по любому поводу; использует в драке разбитые бутылки; носит с собой бритвы, кастеты, велосипедные цепи, складные ножи, ремни с металлическими бляхами, имеет тяжелые ботинки; бьет упавших противников ногами; избивал кого-либо до потери сознания; страдал от несправедливости и оскорблений; кричит, если раздражен; разбрасывает вещи по комнате; лжет, чтобы раздразнить конкурентов; придумывает страшные истории. Затем подобный список при помощи приемов, описанных в данной главе, может быть преобразован в задания теста.
Заключение
При тех сложных и неизбежно неточных инструкциях для конструирования заданий тестов личности, приведенных в данной главе, наиболее ценным может оказаться краткое пошаговое описание интересующей нас процедуры. Оно и приводится ниже. Полное обоснование всех этих положений содержится в тексте главы.
(1) Перечислите черты и особенности поведения из описаний в психологической литературе.
(2) Преобразуйте описание каждой черты или особенности поведения в задание. Это лучше всего сделать при помощи обычных форм заданий опросников: (а) дихотомических заданий (типа "да-нет"); (б) трихотомических заданий (типа "да-?-нет"): (в) альтернативных заданий; (г) заданий типа "нравится-не нравится"; (д) заданий с вынужденным выбором; (е) заданий с рейтинговыми шкалами. Выбор формы задания зависит от особенностей используемого материала и оценки преимуществ и недостатков каждого типа заданий.
(3) Независимо от используемого типа заданий старайтесь, чтобы назначение каждого задания не было слишком очевидным.
(4) формулируйте каждое задание понятно и недвусмысленно.
(5) Насколько возможно, обеспечьте, чтобы каждое задание относилось к какой-либо конкретной области поведения.
(6) В каждом задании должен содержаться только один вопрос или одно утверждение.
(7) Избегайте использовать термины частоты и другие субъективные выражения.
(8) Когда это возможно, задания должны касаться поведения, а не чувств и отношений.
(9) Обеспечьте, чтобы ответы на задания давались быстро.
(10) Избегайте влияния основных установок на ответы, таких как установка на согласие и установка на социально одобряемые ответы.
(11) Вероятность проявления установки на согласие лучше всего уменьшается формулированием понятных заданий и использованием сбалансированных шкал.
(12) Проверьте при помощи процедур анализа заданий то, что тенденция к согласию - несущественный фактор.
(13) Установки на социально одобряемые ответы легче всего избежать путем тщательного формулирования заданий.
(14) Проверьте при помощи техники анализа заданий, что установка на социально одобряемые ответы - несущественный фактор.
(15) Избегайте с помощью адекватной формы заданий влияния установок на выбор крайних или средних категорий ответов.
(16) Проверьте при помощи процедуры валидизации, что влияние установок на ответы не является существенным. Если тесты валидны, то установки на ответы не могут оказывать влияние на их показатели.
ГЛАВА 4. СОЗДАНИЕ НАДЕЖНЫХ ТЕСТОВ III:
КОНСТРУИРОВАНИЕ ТЕСТОВ ДРУГИХ ТИПОВ.
В этой главе будет обсуждаться разработка заданий и подбор материала для других типов психологических тестов. Многое из того, что уже обсуждалось, особенно в предыдущей главе, применимо и здесь, а поэтому не будет упоминаться вновь. Основное внимание будет уделено приемам, специфичным для конструирования объективных тестов личности или темперамента, проективных тестов, инструментов измерения настроения и интересов и, наконец, шкалам аттитюдов. Начнем с объективных тестов.
Объективные тесты
Определение
Определение, используемое здесь, принадлежит Кэттеллу и его коллегам (напр., Cattell, 1957). Объективный тест - это тест, цель которого скрыта от испытуемого (а поэтому результаты не могут быть фальсифицированы), и данные, полученные с его помощью, могут быть оценены независимо от лица, проводящего тестирование и интерпретацию. Преимущество таких тестов состоит в их практическом значении. Когда испытуемые не могут произвольно манипулировать показателями, такой тест может быть использован в процедурах профотбора. Это означает, что на протяжении многих лет может быть накоплено огромное количество подлинно жизненных критериальных данных о соответствии между профессиональными успехами и переменными объективных тестов. Кроме того, отсутствие возможности произвольного искажения результатов полезно и в тех областях, в которых предъявляются менее жесткие требования, таких как профориентация и психиатрия. Однако и в случае объективных тестов мы не можем быть уверены, что испытуемые не будут искажать их результаты.
В объективных тестах произвольная фальсификация псе же возможна. Так, в тесте "Slow Line-Drawing Test" испытуемые могут чертить линии не так плавно, как они в состоянии это делать. Однако, они не знают, ни как это скажется на их показателях, ни даже самих показателей. Подобное неповиновение инструкциям само по себе симптоматично для определенных черт личности, и на деле может быть использовано как переменная объективного теста.
Последнее предложение дает нам ключ к разрешению основной и имеющей глубокие корни проблемы конструирования объективных тестов. В соответствии с нашим определением, почти любое задание, которое может быть объективно оценено и не является непосредственной реакцией на вопрос (как в тестах личности), может быть объективным тестом. Например, данную страницу рукописи можно использовать для получения следующих объективно тестируемых переменных:
(1) Продолжительность времени написания.
(2) Количество слов на странице.
(3) Количество существительных.
(4) Количество глаголов.
(5) Количество зачеркиваний.
(6) Давление пера при письме.
(7) Количество имен собственных.
Конечно же, психологическое значение таких переменных неизвестно - это вторая проблема, связанная с объективными тестами. Следовательно, в процессе создания объективных тестов нам предстоит решить и эту проблему. На каком основании мы можем отбирать объективные тесты (которых, по определению, может быть очень много), чтобы хоть в какой-то мере надеяться на то, что они валидны? Если тест является очевидно валидным, то он уже не является объективным, так как может быть угадана его цель. Следовательно, нам необходимы некие общие принципы для конструирования объективных тестов - таксономия объективных тестов.
Преимущества объективных тестов
При наличии упомянутых выше проблем, возникающих при разработке объективных тестов, вполне резонно спросить, стоит ли пытаться их разрабатывать, особенно если учесть то, что их единственное преимущество, - значительно меньшая вероятность фальсификации результатов, нежели в других методиках. В конце концов, лучше иметь валидный тест, результаты которого, вероятно, могут быть искажены испытуемым, чем невалидный, но противостоящий всем попыткам фальсификации.
Саttell и Kline (1977) утверждают, что существует теоретическое преимущество объективных тестов, и столь значительное по сравнению с опросниками, что усилия, затраченные на разработку валидных объективных тестов, вполне оправданы. Дело прежде всего а том, что значение (смысл) слов и содержание вопросов изменяются со временем, а это ставит под вопрос состоятельность лонгитюдных исследований личности. Значение наших вопросов (утверждений), конечно же, изменяется от культуры к культуре, поэтому проведение кросс-культурных исследований личности при помощи опросников чрезвычайно сложно, если вообще возможно. Неоспорим и тот факт, что с различиями в понимании наших заданий мы сталкиваемся при обследовании разных общественных классов в рамках одной и той же культуры. Kelly (1955) как-то даже заявил, что значения слов настолько различны для разных индивидуумов, что любая форма стандартизированного тестирования не имеет сколько-нибудь значительной диагностической ценности. Вследствие этого Келли и его последователи придавали особое значение методике репертуарных решеток, где каждая решетка была индивидуальна для испытуемого, чьи качества исследовались. Несколько примеров убедят в наличии этого обстоятельства.
(1) "Нравятся ли вам веселые вечеринки?" (англ.: "Are you like gay parties?"). По-русски этот вопрос звучит весьма прилично и вполне приемлем как задание теста. По-другому дело обстоит с его английским вариантом. Примерно до 1960 года этот вопрос (в англоязычных странах) не имел гомосексуального подтекста. "Gay party" - это была вечеринка, отличавшаяся доброжелательным отношением ее участников друг к другу, живым весельем и юмором. Сегодня словосочетание "gay party" означает "встреча для гомосексуалистов".
(2) "Нравится ли вам игра "Урони платок"?" Этот вопрос имеет смысл только в условиях северо-американской культуры: ни в Англии, ни в других странах Европы в эту игру не играют и, следовательно, там ее скрытый смысл не известен. Поэтому этот вопрос нельзя использовать в кросс-культурных исследованиях.
(3) "Регулярно ли вы ходите в кино?" Сейчас положительный ответ на этот вопрос указал бы на неподдельный интерес к фильмам. А двадцать лет назад, до всеобщего распространения телевидения, посещение кинотеатра было принятой большинством людей формой развлечения, и ответ "нет" мог, вероятно, представлять интерес.
Объективные тесты, напротив, должны помочь выявить данные, которые не подвержены влиянию изменяющегося смысла заданий, а, следовательно, необходимы для изучения тех преобразований личности, которые происходят во времени, а также для сравнения различных групп.
ЗАКЛЮЧЕНИЕ
Было немало сказано о двух подходах к разработке объективных тестов, предназначенных для изучения темперамента. Вы увидели, что существуют некоторые полезные наставления, приемлемые для работающих в этой наиболее трудной области тестирования, правила ; касающиеся формы и содержания тестов. Несмотря на то, что хотя я и показал, как некоторые явные проблемы могут быть искусно обойдены, очевидно, что многое зависит от: (а) интуиции, основанной на знании общей психологии и ранее изученных факторов темперамента, и (б) реальных факторов, выявляющихся в исследованиях.
Я не предложил более подробного рассмотрения конструирования объективных тестов, потому что с моей точки зрения существует такое огромное количество уже созданных, но с неизвестной валидностью, что разработчику тестов лучше было бы посоветовать изучить на практике то, что уже сделано, прежде чем приниматься за эту трудную задачу самому. Многие из широко известных и эффективно валидизированных объективных тестов были разработаны Айзенком и его коллегами в Моудслейском госпитале, и большинство из этих средств измерения относятся к трем основным факторам: экстраверсии, нейротизму и психотизму. Подробности об этих тестах могут быть найдены в различных местах объемных публикаций Айзенка, но лучше всего воспользоваться работой, изданной в 1971 г. (Eysenck, 1971).
Однако, наиболее значительные усилия по конструированию объективных тестов, были предприняты в Иллинойсе Кэттеллом и его коллегами. Их исследования сформировали основу нашего обсуждения, как об этом и было сказано в начале главы. Cattell и Warburton (1967) приводят столь значительный перечень объективных тестов, что их психологическое значение еще предстоит осмыслить. Будущий разработчик объективных тестов должен, конечно, знать этот перечень и опробовать все подходящие тесты, содержащиеся в нем, прежде чем браться за их самостоятельную разработку.
Объективные тесты мотивов или динамики
Все, что до сих пор было сказано о разработке объективных тестов, касается измерения темперамента. Очевидно, что таксономия типов тестов в равной степени применима и к объективным тестам мотивов. То же касается и второго подхода, основанного на изучении результатов факторного анализа. Тем не менее, Кэттеллом и его коллегами были предложены определенные принципы для разработки объективных тестов мотивов, которые не применимы к тестам темперамента, их мы сейчас и обсудим.
Принципы конструирования объективных тестов мотивов были подробно описаны в следующих работах: Cattell (1957), Cattell и Warburton (1967), Cattell и Child (1975), Cattell и Kline (1977). Здесь вы найдете краткое изложение этих принципов, вполне удовлетворяющее потребности разработчика тестов.
ТЕОРЕТИЧЕСКИЕ ОСНОВАНИЯ
В теоретическом подходе Кэттелла к мотивации поведения предполагается, что мотивы проявляются в аттитюдах. Так, например, тот факт, что некоторый индивидуум очень заинтересован в получении денег, должен отражаться в силе его побуждения (drive).
Cattell и Child (1976) использовали динамическую решетку, чтобы показать, как такие аттитюды могут соотноситься с побуждениями. В данном примере наличие денег желательно для высокой самооценки (самоощущение), для обеспечения своей семьи (супружеские чувства) и для гарантированного будущего своих детей (эрг защиты) . Обратите внимание, что здесь предполагается конечное количество побуждений у людей, как следует, например, из представлений McDougall (1932). Считается, что побуждения могут быть двух видов: (1) эрги, базовые для всех человеческих существ (например, половое побуждение); и (2) чувства, сформированные культурой и воспитанием (такие, как чувства к семье). Если мы в чем-либо заинтересованы, то наши аттитюды зависят существенным образом от того, как посредством активности они выражаются в наших побуждениях и чувствах. Интерес к психоанализу, например, может оказаться средством выражения полового побуждения. Все это означает, что сущность объективных тестов, предназначенных для измерения мотивационных факторов, связана с аттитюдами и интересами.
Заслуживает упоминания еще один аспект теоретического подхода, принятого Кэттеллом и его коллегами. Это касается силы интереса. Два человека могут быть заинтересованы в одном и том же. но их интересы могут значительно различаться по силе. В работе, проведенной Cattell и Child (1975), четко показано, что из анализа аттитюдов с помощью объективных тестов, выделяются факторы силы и интересов, как и факторы, отражающие структуру интересов, то есть основные человеческие побуждения, эрги и чувства.
Принципы конструирования объективных тестов мотивов должны исходить из этих основополагающих теоретических положений. Это основа для измерения мотивов при помощи тестов аттитюдов и интересов. Cattell и Kline (1977) перечисляют шестьдесят восемь психологических принципов, на которых должно основываться измерение мотивов. Их можно также найти в Cattell и Kline (1975). Эти принципы приведены в табл. 4.1.
Как это подробно описано у Cattell и Child ( 1975), многие из этих принципов были реализованы в тестах и в воспроизводимых (повторно измеряемых) факторах силы интереса, были выделены и некоторые отчетливые эрги и чувства. Например, были опубликованы групповой тест MAT (Cattell и др., 1970) и его версия для подростков - SMAT.
Таблица 4.1. Некоторые принципы измерения мотивов, применяемые при конструировании тестов
С возрастанием интереса в направлении действия ожидайте, что будут нарастать:
(1) Предпочтения. Готовность признать предпочтение в направлении действия.
(2) Аутизм: неправильное, искаженное восприятие объектов, звуков и т.п., в соответствии с интереумым (примером является исследование Брунера по восприятию величины монет) .
(3) Аутизм: ошибочные убеждения. Необоснованная уверенность в том, что факты и происходящие события благоприятствуют направлению действий.
(4) Искажение логических построений: средства - конечный результат. Готовность утверждать, что малоэффективные средства достижения цели в действительности являются эффективными.
(5) Искажение логических построений: конечный результат - средства. Готовность утверждать, что конечного результата можно легко достичь при помощи несоответствующих для этого средств.
(6) Искажение логических построений: индуктивных.
(7) Искажение логических построений: дедуктивных.
(8) Искажение логических построений: выявление отношений из воспринимаемого (напр., аналогий).
(9) Выбор вспомогательных средств. Готовность использовать землю, труд и капиталовложения во имя интереса.
(10) Макиавеллианизм. Желание использовать предосудительные средства для достижения конечного результата во имя своего интереса. (Желание достичь цели любой ценой - все средства хороши).
(11) Предпочтения в воображении. Готовность выбирать связанные с интересом темы для чтения, рассказа или объяснения.
(12) Предпочтения в размышлениях. Проведение времени в размышлениях над тем. что связано с интересом.
(13) Предпочтения в идентификации. Предпочитает быть похожим на индивидуумов, одобряющих направление его действий.
(14) Защитная сдержанность (скрытность). Запинание ("спотыкание") при перечислении (назывании) негативных последствий избранного направления действий.
(15) Защитная беглость речи. Беглость речи при перечислении позитивных следствий направления действий.
(16) Защитная беглость речи. Беглость речи при перечислении оправдывающих обстоятельств в пользу действия.
(17) Рационализация. Готовность интерпретировать информацию таким образом, чтобы представить свой интерес в более респектабельном виде, чем он есть, и т.п.
(18) Наивная проекция. Ошибочное восприятие других людей как имеющих его собственные интересы.
(19) Истинная проекция. Ошибочное восприятие других людей как осуществляющих столь же предосудительное поведение, связанное с преследованием интереса, как его собственное.
(20) Проекция Id. Ошибочное восприятие других как имеющих его собственные примитивные желания, связанные с интересом.
(21) Проекция Superego. Ошибочное восприятие других как имеющих его собственные убеждения в правоте, связанные с интересом.
(22) Чувство вины. Выражение чувства вины от неучастия в деятельности, связанной с интepecoм.
(23) Вовлеченность в конфликт. Трата времени на принятие решения при выборе путей для реализации интереса (оба альтернативных пути благоприятны для реализации интереса).
(24) Вовлеченность в конфликт. Трата времени на принятие решения в конфликте, вызванном желанием избежать альтернативных решений (обе альтернативы противоположны интересу).
(25) Реагирование на угрозу. При возникновении угрозы интересу падает сопротивление при измерении КГР.
(26) Реагирование на угрозу. При возникновении угрозы интересу усиливается сердечно-сосудистая активность.
(27) Физиологическая вовлеченность. При возрастании интереса (под угрозой или нет) усиливается сердечно-сосудистая активность.
(28) Физиологическая вовлеченность. При возрастании интереса увеличивается температура пальцев.
(29) Физиологическая вовлеченность. При возрастании интереса увеличивается ригидность мышц.
(30) Интеграция при восприятии. Организация неструктурированного материала в соответствии с интересом.
(31) Перцептивная замкнутость. Способность видеть незавершенные рисунки завершенными, если материал имеет отношение к интересу.
(32) Избирательность восприятия. Легкость нахождения связанного с интересом материала, вкрапленного в сложно оформленные объемы информации.
(33) Острота сенсорных ощущений. Тенденция ощущать свет ярче, звуки громче и т.п. при возросшем интересе.
(34) Внимательность. Сопротивление отвлекающим факторам (световые сигналы, звуки и т.п.) при работе с относящимся к интересу материалом.
(35) Спонтанное внимание. Непроизвольные движения, вызванные связанными с интересом раздражителями (напр., движения глаз).
(36) Вовлеченность. Кажущаяся быстрота, с которой течет время при занятиях, связанных с интересом.
(37) Настойчивость. Продолжение работы во имя интереса даже при встрече с трудностями.
(38) Персеверативность. Упорство в неадаптивном поведении, связанном с интересом.
(39) Рассеянность. Неспособность управлять вниманием при помехе со стороны связанного с интересом раздражителя (стимула).
(40) Ретроактивное торможение при помехе выполнению связанной с интересом задачи.
(41) Проактивное торможение заданием, связанным с интересом.
(42) Рвение: усилия. Предвосхищение затраты еще больших усилий в направлении действия.
(43) Деятельность: время. Трата времени в направлении действий.
(44) Рвение: деньги. Предвосхищение еще больших затрат денег в направлении действия.
(45) Деятельность: деньги. Трата денег в направлении действий.
(46) Рвение: исследования. Готовность предпринять исследования для достижения связанных с интересом конечных результатов.
(47) Импульсивность: решения. Быстрота принятия решений в пользу интереса, почти отсутствие конфликта.
(48) Импульсивность: согласие. Быстрота согласия с мнениями, благоприятными для интереса.
(49) Сила решения. Высшая степень уверенности в ситуациях, благоприятствующих направлению действия.
(50) Быстрота воодушевления (раскачки): обучение. Быстрота воодушевления (раскачки) для изучения задач, связанных с интересом.
(51) Обучение. Быстрота обучения связанному с интересом материалу.
(52) Моторные навыки. Соответствующая производительность, когда затрагивается интерес.
(53) Информация. Знания, имеющие отношение и влияющие на направление действия.
(54) Сопротивление угасанию реакций, относящихся к интересу.
(55) Контроль. Способность координировать деятельность, преследующую интерес.
(56) Расположенность: легкость. Легкость, непринужденность в письменном изложении того, что связано с направлением действий.
(57) Расположенность: свободные ассоциации. Готовность к ассоциациям на темы связанного с интересом материала без каких-либо ориентирующих стимулов.
(58) Расположенность: скорость свободных ассоциаций. Увеличивающееся количество ассоциаций при возросшем интересе.
(59) Расположенность: ориентированные ассоциации. Готовность к ассоциациям на темы связанного с интересом материала при стимуляции.
(60) Расположенность: память. Свободное воспроизведение связанного с интересом материала.
(61) Память на вознаграждения. Немедленное воспоминание о наградах, связанных с интересом.
(62) Реминисценция. Эффект Уорда-Ховлэнда. Улучшение сохранения связанного с интересом материала при его воспроизведении через небольшие промежутки времени.
(63) Реминисценция. Эффект Бэлларда-Уилльямса. Улучшение сохранения связанного с интересом материала при его воспроизведении через значительные промежутки времени.
(64) Сохранение в памяти по Зейгарник. Тенденция вспоминать незавершенные задачи, связанные с интересом.
(65) Персеверативность по Зейгарник. Готовность возвращаться к незавершенной задаче, связанной с интересом.
(66) Защитная забывчивость. Неспособность вспомнить относящийся к интересу материал, если цель недостижима.
(67) Фацилитативность рефлекса. Легкость, с которой возбуждаются определенные рефлексы при возросшем интересе.
(68) Торможение рефлекса. Трудность возбуждения определенных рефлексов при возросшем интересе.
Источник: R.B.Cattell and D.Child. Motivation and Dynamic Structure. London: Hoil, Rinehartand Winston, 1975.
Однако, как и в случае объективных тестов темперамента, разработчику объективных тестов следовало бы посоветовать попытаться использовать тесты из "Сборника объективных тестов" (Cattell и Warburton, 1967), прежде чем приступать к разработке каких-либо собственных средств измерения. Действительно, конструирование объективных тестов требует значительного опыта и мастерства, а для психологов, которые хотят получить какие-либо тесты для практического использования, будь то решение исследовательских задач или профотбор, попытка конструировать такие тесты вряд ли будет удачной, несмотря на значительные затраты времени и работу по апробации вариантов теста и их валидизации. Внимательный читатель мог заметить, что я опустил изложение специальных методов для измерения динамических конфликтов. Дело в том, что в настоящее время свидетельства исследователей в пользу валидности этих методик слишком умозрительны, чтобы в полной мере использовать их на практике, а не только для дальнейшей разработки этой несомненно важной области исследования мотивов. (Более подробные сведения читатели могут получить в работе Cattell и Child, 1975).
Другие аспекты конструирования объективных тестов мотивов
Хотя в таблице 4.1. приведены основополагающие принципы, в свете которых должны разрабатываться объективные тесты мотивов, засуживают внимания и некоторые другие аспекты.
ЧУВСТВА И ЭРГИ
Как уже было сказано в кратком изложении теоретических основ разработки объективных тестов мотивов, есть два аспекта в измерении мотивов: сила интереса и базовые мотивационные цели, побуждения (drives); в принятом нами подходе - эрги (ergs) и чувства (sentiments). Принципы конструирования тестов, представленные в табл.4.1., предназначены для решения первой задачи: измерения силы мотивов.
Следовательно, здесь имеет смысл рассмотреть конструирование тестов, направленных на измерение эргов и чувств. Фактически, как указывают Cattell и Warburton (1967), обсуждавшиеся принципы применимы к тестам побуждений потому, что, например, тест аутизма (принципы 2 и 3 в табл. 4.1.) может быть использован для измерения желаемого, принимаемого за действительное применительно к большому разнообразию объектов: к пище (эрг голода), к женщинам (половой эрг) или к решению задач (эрг любопытства). Здесь все зависит, как и всегда при конструировании тестов, от изобретательности разработчика тестов. Однако, специфические свойства каждого конкретного теста оказывают влияние на то, какие аспекты побудительно-мотивируемого поведения будут измеряться. Из этого следует, что для того, чтобы измерить весь диапазон мотивов индивидуума необходим широкий выбор тестов (включающих столько принципов из табл.4.1., сколько возможно), измеряющих адекватный набор его аттитюдов, чем обеспечивается полный охват всего разнообразия чувств и эргов.
Пол Клайн
ГЛАВА 3. СОЗДАНИЕ НАДЕЖНЫХ ТЕСТОВ II: ЛИЧНОСТНЫЕ ОПРОСНИКИ. РАЗРАБОТКА ЗАДАНИЙ.
Личностные опросники - широко используемые методики измерения личностных качеств, поскольку они могут разрабатываться так, что им будут присущи многие атрибуты эффективных тестов: надежность, дискриминативность и стандартизованность. Однако, в силу природы личностных переменных, труднее всего бывает установить валидность именно этих методик.
Проблемы конструирования личностных опросников
Как и в случае тестов способностей, качество отдельных заданий (вопросов, утверждений) является определяющим для всего опросника, и поэтому в данной главе будут рассматриваться трудности, возникающие при формулировании заданий, а также преимущества различных типов заданий.
При разработке заданий для личностных опросников необходимо учитывать следующие проблемы, которые, если их не обойти, неизбежно приведут к низкой валидности тестов.
(1) Установка на согласие (response set of acquiescence). Это тенденция испытуемого соглашаться с утверждениями или отвечать на вопросы "да" независимо от их содержания. Чаще всего проявляется, согласно Guilford (1959), когда утверждения (вопросы) неоднозначны и неопределенны.
(2) Установка на социально одобряемые ответы (response set of social desirability). Это тенденция испытуемых отвечать на вопросы теста так, чтобы выглядеть "социально положительным": если возможен "социально желательный" ответ, то весьма вероятно, что испытуемые будут его давать. Эта установка, как показал Edwards (1957), оказывает, в частности, влияние на результаты теста ММРI (Minnesota Multiphasic Personality Inventory).
(3) Установка на неопределенные или средние ответы (response set of using the uncertain or middle category). Если в опроснике представлена средняя категория ответов, отражающая нерешительность или неуверенность в ответе (напр., "не уверен", "не знаю", или "затрудняюсь ответить"), то многие испытуемые склонны к ней прибегать, как к безопасному компромиссу. Это приводит к снижению валидности заданий, поскольку большинство методов анализа вопросов основывается на крайних значениях показателей.
(4) Установка на "крайние" (расположенные по краям шкалы) ответы (response set of using the extreme response). Эта установка может проявляться при использовании многоэлементной рейтинговой шкалы. Некоторые испытуемые, независимо от содержания вопросов, предпочитают выбирать крайние ответы (Vernon, 1964).
(5) Очевидная валидность (face validity) вопросов (утверждений). Несомненно, в тестах личности необходима уверенность в том, что ответы на вопросы могут рассматриваться как правдивые. Cattell и Kline (1977) рассматривают данные опросника как данные Q и Qi. Данные из первого множества рассматриваются так, как если бы они отражали поведение испытуемого, данные из второго - как ответ на отдельный вопрос, ответ, который либо нагружен некоторым фактором, либо нет, независимо от того, отражает ли он поведение испытуемого.
(6) Выборка из генеральной совокупности вопросов. В тестах интеллекта и специальных способностей, обсуждавшихся в предыдущей главе, относительно легко убедиться в том, что задания принадлежат или с высокой степенью вероятности выглядят принадлежащими к подразумеваемой для них генеральной совокупности. Лингвистические задания нелегко перепутать с математическими или какими-либо другими. Однако, в области особенностей личности и темперамента все гораздо сложнее.
В самом деле, иногда даже опытные и искусные разработчики вопросов (например, Cattell, 1957) бывают удивлены тем, что вопросы нагружены не теми факторами, для выявления которых они были созданы, а также тем, что вопросы вообще не нагружены ни одним из факторов. Эта проблема с точки зрения классической теории тестов состоит в трудности определения конкретной выборочной совокупности вопросов. В результате возникает проблема подбора адекватной выборки из выборочной совокупности вопросов или утверждений для теста, а без этого тест не может быть валидным.
(7) Выборка из генеральной совокупности испытуемых. Как указано выше, в личностных тестах труднее обеспечить адекватность выборки из выборочной совокупности, чем в тестах способностей. При использовании тестов способностей обычно известна вполне определенная категория лиц (популяция), для которой данный тест предназначен, и таким образом, по крайней мере в принципе, можно эффективно подбирать выборки. Однако, в личностных тестах, в отличие от тестов, разрабатывающихся для испытуемых с той или иной патологией, в идеале нужны выборки из общей популяции (т.е. всего населения страны), в которой встречаются все возможные показатели. Такие выборки, как показано, должны быть большими, и их обычно трудно получить.
(8) Проблемы в установлении адекватного критерия валидности. Существует, как уже подробно обсуждалось в разделе о валидности, значительная трудность в нахождении адекватного критерия. Например, если мы пытаемся измерить авторитаризм, то будем вынуждены полагаться на рейтинги, поскольку нет никаких других внешних мерил (в отличие от, например, школьных экзаменов в случае диагностики способностей). Рейтинги - это неадекватный инструмент, а если бы они подходили, тест был бы не нужен. Аналогично, если существуют высокоэффективные тесты авторитаризма, которые могут быть использованы в качестве критерия валидности, вероятно, в новом тесте нет необходимости.
Таким образом, мы вынуждены ограничиваться исследованиями конструктной валидности, обычно основывающимися на мультивариативном анализе разрабатываемого теста по сравнению с другими переменными, а также исследованиями специальных групп, имеющих по предположению контрольные показатели по рассматриваемой переменной.
Таковы основные сложности, возникающие при конструировании личностных опросников, и следует отчетливо их себе представлять, прежде чем вы приступите к формулированию вопросов или утверждений. Две последние проблемы, хотя они и являются определяющими, выходят на первый план уже после того, как подобраны задани