Конструирование и анализ заданий теста

ЧАСТЬ IV. УГРОЗЫ ПСИХОМЕТРИЧЕСКОМУ КАЧЕСТВУ ТЕСТА

ГЛАВА 10

УСТАНОВКИ НА ОТВЕТ

В самом начале обсуждения проблемы валидности приводился пример, в котором при собеседовании на получение рабочего места используется личностный опросник. Обратимся к данному примеру снова: представьте, что вы заполняете анкету. Перед вами вопрос: «Вы когда-нибудь крали у вашего работодателя?», и еще один: «Всегда ли вы говорите правду?». Пока вы раздумываете над этими вопросами, в памяти всплывает случай, когда вы «позаимствовали» хорошую шариковую ручку с предыдущего места работы, но «забыли» вернуть ее. Кроме того, вы думаете о том, как на прошлой неделе сказали лучшему другу, что должны были работать в выходные, хотя на самом деле вы просто хотели отдохнуть дома в одиночестве. Тем не менее, вы также думаете о том, что хотели бы получить эту работу, и используете те варианты ответа, которые с большей вероятностью повлияют на решение работодателя нанять вас. Соответственно, несмотря на тот факт, что правдивый ответ на первый вопрос – «да», а на второй – «нет», вы, как и большинство людей, будете склонны к тому, чтобы дать «альтернативные» ответы на оба вопроса.

Каким образом ваше желание получить работу влияет на качество заполнения личностного опросника? Работодатель может интерпретировать ваши ответы как свидетельствующие об искренности или честности. Однако, если вы выберете альтернативные ответы, тогда ваши результаты больше не могут быть интерпретированы как честность. На результат оказывает влияние ваше стремление впечатлить работодателя, и он не отражает ваш истинный уровень честности, который несколько не соответствует идеальному.

В этой главе рассматривается проблема установок респондента на те или иные ответы и дается несколько вариантов решения данной проблемы, разработанных психологами. В идеале ответы респондента на утверждения опросника должны абсолютно точно отражать те психологические характеристики, для измерения которых данный опросник предназначается. Однако известно, что на ответы респондента может систематически влиять ряд посторонних факторов. Эти факторы могут уменьшать достоверность результатов теста и валидность интерпретации результатов психодиагностических инструментов, таких как личностные опросники, опросники отношений, тесты способностей, тесты достижений, а также нейропсихологические тесты. Сниженная валидность психодиагностического инструментария может, в свою очередь, отразиться на решениях, принимаемых в отношении людей, а также вызвать проблемы с интерпретацией исследований, основанных на этом инструментарии.

Установки на ответ являются в практике психологических измерений постоянным предметом заботы, независимо от того, являются ли они осознанными или нет, движимы ли они эгоистическими мотивами или альтруистическими, отражают ли они стремление выглядеть лучше или стремление выглядеть хуже, чем на самом деле. Несомненно, необъективность в выборе ответов – фундаментальная проблема для тех, кто изучает поведение людей. Более того, проблема эта возникает, вероятно, только лишь в науках о поведении. Ученые, изучающие камни, планеты, насекомых, химические реактивы, вулканы или цветы редко попадают в ситуацию, когда предмет их исследования желает произвести впечатление разумного или непонятливого, здорового или больного, дружелюбного или недружелюбного, приветливого или властного, компетентного или некомпетентного, честного или добродетельного. Психологи же определенно должны беспокоиться об этих и других проблемах.

Будучи осведомленными об этих проблемах, психологи посвятили себя идентификации, пониманию, обнаружению и контролю над установками респондентов, оказывающими влияние на их ответы в психологических тестах (например, Cronbach, 1946, 1950). Сначала в данной главе приводится описание некоторых установок на ответ, которые получили наибольшее внимание со стороны ученых. Затем рассматриваются методы и подходы (некоторые из которых простые, другие – сложные), которые используются, чтобы понять, раскрыть, свести к минимуму или проконтролировать эти установки.

Социальная желательность

Проблема социальной желательности приобрела, пожалуй, наибольшее внимание среди психологов, занимающихся установками респондентов на определенные виды ответов. Установка на социальную желательность ответов – это склонность человека отвечать не так, как есть на самом деле, а так, как ему кажется социально одобряемым. В начале данной главы рассматривался пример с заполнением опросника при приеме на работу. Мы отмечали вероятность возникновения склонности отвечать на вопросы с установкой на то, чтобы понравиться работодателю. Респондент может поддаться искушению отвечать в таком ключе, который усиливает желаемые качества, такие как честность, прямота, добросовестность и эмоциональная стабильность. Если ответы респондента обусловлены его желанием выглядеть социально привлекательным, они не отражают истинный уровень выраженности измеряемого признака. Это может уменьшить надежность и валидность тестирования.

Установка на социальную желательность имеет по крайней мере три источника. Во-первых, содержание теста. Некоторые психологические конструкты имеют больший подтекст социальной привлекательности, чем другие, таким образом, тесты, направленные на измерение этих конструктов, могут быть более подвержены негативному влиянию социальной желательности, чем тесты, измеряющие что-то другое. Например, такие личностные качества, как психологическое здоровье (против переживания психологического дистресса) или честность (против склонности к обману) могут быть тесно связаны с социальной желательностью; здоровье с честностью более предпочтительны, чем переживание дистресса и обман. С другой стороны, такие признаки, как экстраверсия / интроверсия могут быть менее подвержены установке на социальную желательность (John & Robins, 1993). Во-вторых, установка на социально желаемые ответы находится под влиянием ситуации тестирования. Ответы в социально-желательном ключе могут скорее появиться в ситуации, когда респонденты могут быть идентифицированы, нежели когда можно отвечать анонимно. Когда известно, кто и как отвечает на вопросы, респонденты будут больше стараться выглядеть социально привлекательными. Кроме того, ответ с целью выглядеть более привлекательно в социальном плане скорее будет дан в ситуации, когда от исхода тестирования зависят важные для респондента последствия. Пример с ситуацией при приеме на работу представляет собой случай, когда ответы на утверждения теста могут иметь важные последствия – вероятность того, что соискателей наймут, частично зависит от итогов психологического тестирования. Ответы в социально желательном ключе становятся менее вероятными, когда от результатов тестирования мало что зависит (хотя и в этом случае они остаются потенциальной проблемой, как будет показано ниже).

Третья возможная причина возникновения социально желательных ответов – личностные характеристики респондентов. Начиная с 1950-х годов в исследованиях было показано, что в своей склонности давать те ответы, которых от них ожидают, люди отличаются друг от друга. Проблема снова заявляет о себе, т.к. различия в склонности респондентов давать социально привлекательные ответы могут скрывать различия в истинных уровнях выраженности измеряемого признака.

Чтобы понять сущность установки на социальную желательность и ее влияние на результаты исследований, представьте, что исследователь изучает взаимосвязь между эмоциональностью и глубиной взаимоотношений с людьми. Он выдвигает гипотезу о том, что люди, склонные сильно переживать позитивные эмоции (или те, кто склонен не слишком сильно переживать негативные эмоции), устанавливают более глубокие отношения с окружающими. Говоря технически, он ожидает обнаружить положительную корреляцию между положительной эмоциональностью и глубиной взаимоотношений, а также отрицательную корреляцию между негативной эмоциональностью и глубиной взаимоотношений. Для проверки этой гипотезы он просит участников исследования заполнить тест PANAS (Positive and Negative Affect Schedule – Тест позитивных и негативных эмоций; Watson, Clark, & Tellegen, 1988). PANAS – довольно распространенный тест аффективности, он может использоваться для измерения характерной для респондентов (на уровне личностной черты) склонности переживать положительные и отрицательные эмоции. PANAS включает две шкалы – Положительные эмоции (ПЭ) и Отрицательные эмоции (ОЭ) – каждая из которых включает в себя 10 слов, обозначающих эмоции (например, сильный, гордый, возбужденный, раздражительный, виноватый, страдающий). Несмотря на то, что PANAS используется исследователями весьма разнообразными способами, представим, что наш исследователь попросил участников прочитать каждый пункт и оценить степень (по пятибалльной шкале), с которой они обычно переживают ту или иную эмоцию. Баллы по шкалам ПЭ и ОЭ подсчитываются как среднее арифметическое 10 ответов на пункты шкалы, так что итоговый результат для каждой шкалы варьируется от 1 до 5, причем более высокий балл отражает большую предрасположенность респондента испытывать положительные либо отрицательные эмоции. Наконец, исследователь просит респондентов оценить общую глубину их взаимоотношений с окружающими по шкале от 1 до 100, где более высокий балл означает большую глубину взаимоотношений (ГВ).

Заметьте, что данные 3 конструкта – положительные эмоции, отрицательные эмоции и глубина взаимоотношений – потенциально подвержены влиянию склонности респондента выглядеть социально более выигрышно. По крайней мере, в Западных культурах ярко выраженные переживания положительных эмоций культурно более предпочтительны, чем слабые переживания положительных эмоций, а в негативных переживаниях слабая интенсивность предпочтительнее, чем сильная. То есть люди, демонстрирующие силу, гордость и энтузиазм в целом выглядят социально привлекательно и вызывают восхищение, в то время как люди нервозные, чувствующие себя виноватыми, подверженные стрессу, как правило, выглядят социально отталкивающими и не вызывают восхищения. Наконец, большинство культур воспримут глубокие отношения с окружающими как ценные и желаемые. Соответственно, индивид, желающий выглядеть социально привлекательным, насколько можно ожидать, заявит высокую интенсивность переживания положительных эмоций, низкую интенсивность переживания отрицательных эмоций, а также оценит свои взаимоотношения с окружающими как глубокие.

Давайте снова представим, что мы всезнающи и обладаем информацией относительно истинного положения дел: знаем истинный уровень ПЭ, ОЭ и ГВ респондентов. Так, в Таблице 10.3 указано, что респондент 1 имеет наивысший истинный балл по шкале ПЭ (4.5) на втором месте оказывается респондент 2 (его истинный балл составляет 4). Заметьте также, что респондент 4 имеет наивысший истинный балл по шкале ГВ. Высчитывая корреляцию между истинными уровнями ПЭ и ГВ, находим умеренное подтверждение гипотезы исследователя – слабую положительную взаимосвязь (r=0.23). Аналогично, взаимосвязь между истинными значениями ОЭ и ГВ является умеренным подтверждением гипотезы - слабая отрицательная корреляция (r= -0.21). Таким образом, наше «всезнание» позволяет увидеть умеренную по силе тенденцию: люди, склонные к переживаниям положительных эмоций (с одной стороны), а также люди, редко испытывающие отрицательные эмоции (с другой стороны), устанавливают более глубокие взаимоотношения с окружающими.

Давайте также представим, что нам известно про каждого из респондентов, насколько ярко у него выражена установка на социально желательный ответ. Как показано в колонке «Установка на социальную желательность» Таблицы 10.3, респондент 2 имеет ярко выраженную установку на социальную желательность, у респондентов 3 и 5 эта установка также выражена в некоторой степени, однако остальные респонденты не имеют мотивации выглядеть более привлекательно, чем на самом деле.

Заметим, как желание выглядеть социально привлекательно влияет на качество измерения трех признаков. У тех респондентов, кто склонен выглядеть социально предпочтительно, тестовые баллы ближе к «желаемому» уровню, чем истинные баллы (уровни выраженности признака). Например, обратите внимание на респондента 2, у которого установка на социальную желательность выражена ярко. Тестовый балл по шкале ПЭ (5) у него выше, чем истинный уровень ПЭ (4), что отражает желание завысить интенсивность переживания положительных эмоций. Сильная установка на социальную желательность у данного респондента повлияла на то, как он оценивал некоторые из пунктов шкалы ПЭ, что в итоге привело к завышенному тестовому баллу по этой шкале. Аналогично, результат в шкале НЭ (1) ниже, чем реальный уровень НЭ (2), что указывает на желание этого респондента искусственно занизить интенсивность переживания отрицательных эмоций. Таким образом, у респондентов с установкой на социально привлекательные ответы тестовые баллы по социально желаемым показателям, таким как ПЭ и ГВ, искусственно завышены, а тестовые баллы по «нежелательным» показателям (как, например, ОЭ) искусственно занижены. С другой стороны, для респондентов, не стремящихся выглядеть привлекательно в глазах окружающих, тестовый балл совпадает с истинным уровнем выраженности признака, независимо от того, насколько этот признак социально желателен.

Таблица 10.3Пример зависимости результатов исследования от наличия установки на социально желательные ответы

Респондент	Истинный балл (уровень выраженности признака)	Установка на социальную желательность	Тестовый балл (данные по результатам теста)
ПЭ	ОЭ	ГВ	ПЭ	ОЭ	ГВ
	4.5			Нет	4.5
				Высокая
		1.5		Низкая	3.375	1.125
	2.25			Нет	2.25
	1.5			Средняя		3.5
	1.75	3.25		Нет	1.75	3.25
Корреляция с ГВ	0.23	-0.21			0.51	-0.65

Примечание: ПЭ = шкала положительных эмоций,; ОЭ = шкала отрицательных эмоций; ГВ = глубина взаимоотношений.

Важное следствие желания выглядеть привлекательно в глазах окружающих заключается в его негативном влиянии на результаты исследований. Конкретнее, индивидуальные различия в установке на социально желательные ответы могут создавать ложные или искусственно сильные корреляции между результатами тестов, при заполнении которых у респондентов проявилась эта установка. Данные в Таблице 10.3 демонстрируют данный эффект. Как обсуждалось ранее, в этих данных существуют как минимум две проблемы. Во-первых, респонденты различаются по силе выраженности установки на социальную желательность – у некоторых установка по выраженности средняя или сильная, у других слабая или полностью отсутствует. Во-вторых, три переменные связаны с социальной желательностью, таким образом, качество их измерения потенциально может быть испорчено установкой на социальную желательность (действительно, как уже было показано, тестовые баллы в Таблице 10.3 искажены установкой). Следствием данных проблем является тот факт, что респонденты с мотивацией выглядеть социально предпочтительно имеют более высокие баллы по ПЭ и ГВ (и более низкие баллы по НЭ), чем респонденты, у которых эта мотивация отсутствует. Следовательно, желание выглядеть привлекательно завышает степень, с которой люди, склонные к высокому баллу по результатам одного теста, склонны набирать высокий балл по результатам другого. Это, в свою очередь, влияет на корреляции между измеренными переменными.

Эффект установки на социальную желательность очевиден в искусственно завышенных корреляциях между рассматриваемыми тремя признаками. Заметьте, что корреляции между истинными баллами гораздо слабее, чем корреляции между тестовыми баллами. Ранее допущение о «всезнании» позволило нам установить, что «истинная» корреляция между ПЭ и ГВ равнялась всего 0.23, а «истинная» корреляция между НЭ и ГВ составила всего лишь -0.21. Как демонстрирует Таблица 10.3, корреляция между тестовыми баллами сильнее - корреляция между ПЭ и ГВ равна 0.51, корреляция между ОЭ и ГВ составляет -0.61. Таким образом, тенденция выглядеть социально привлекательно может искусственно завысить корреляцию между измерениями. В нашем примере исследователь может интерпретировать искусственно завышенную корреляцию между тестовыми баллами (r=0.51 и r= -0.65) как доказательство очень сильной взаимосвязи между эмоциональностью и глубиной взаимоотношений. И снова допущение о всезнании позволяет увидеть, что подобная интерпретация неверна – взаимосвязь данных двух конструктов гораздо слабее, чем показывает исследование. Исследователь сильно переоценивает силу взаимосвязи, т.к. на исследование необоснованно повлияла установка на социальную желательность. Подобные искаженные оценки могут, в свою очередь, привести к некорректным теоретическим обобщениям, а затем являться причиной неверных решений в практике.

Как отмечалось ранее в данном разделе, склонность давать социально желательные ответы в психологии широко изучалась. Одним из активистов данного направления является Del Paulhus, психолог, интересовавшийся склонностью давать социально желаемые ответы как характеристикой личности. Одним из важнейших результатов его работы стало открытие того, что формы установки на социальную желательность могут варьироваться. Paulhus выделяет два процесса, посредством которых реализуется установка на социальную желательность. Один из этих процессов – сознательное управление впечатлением, когда тестируемый сознательно пытается показаться социально привлекательными. Например, соискатель работы может почувствовать мотивацию искусственно завысить желательные характеристики и искусственно занизить нежелательные характеристики, заполняя тест по отбору персонала. В клинической практике управление впечатлением иногда называется «симуляцией здоровья» (faking good), т.к. к ней относится замалчивание сведений о клинических симптомах. Другими словами, респондент может попытаться выглядеть более здоровым, ложно отрицая в себе различные патологические симптомы. Второй процесс – бессознательный самообман, когда тестируемый придерживается необоснованно положительного мнения о себе, будучи твердо уверенным в тех психологических характеристиках, по которым себя переоценивает.

Paulhus (2002) доказывает, что управление впечатлением и самообман различаются так же, как состояние и черта. Он предполагает, что управление впечатлением больше напоминает состояние, проявляясь в ответах респондента на непосредственные требования ситуации. Другими словами, установка на сознательную социальную желательность обычно является реакцией на определенный контекст или ситуацию тестирования, такую, как заполнение формы при приеме на работу. В противоположность этому, Paulhus считает, что склонность к самообману является чертой личности. Таким образом, некоторые люди более предрасположены к самообману, чем другие, и эта разница может повлиять на их ответы, в независимости от ситуации или контекста тестирования.

Несмотря на долголетний интерес к социальной желательности и ее возможным последствиям для психологических исследований, некоторые исследователи утверждают, что беспокойство в этом плане несколько преувеличено. Один из наиболее убедительных аргументов в пользу этого – эмпирические данные, предполагающие, что «в большинстве сфер практического применения попытки делать поправки тестовых баллов на психологическую защиту или социальную желательность не увеличивают валидность» (McCrae & Costa, 1983). Подобные выводы частично основаны на данных о том, что тесты социальной желательности не коррелируют с такими важными критериями, как, например, профессиональная успешность (Viswesvaran, Ones & Hough, 2001), и что статистический контроль над индивидуальными различиями в социальной желательности не улучшает критериальную валидность опросников личностных черт (McCrae & Costa, 1983; Ones, Viswesvaran, & Reiss, 1996). Несмотря на полученные данные, многие психологи до сих пор озабочены возможным влиянием фактора социальной желательности на психологические тесты и их практическое применение.

Симуляция неблагополучия[2]

Несмотря на то, что многих психологов волнует проблема искусственного преувеличения респондентами социально желательных качеств, другие психологи озабочены иной проблемой. А именно, в некоторых чрезвычайно важных ситуациях тестирования респонденты могут попытаться преувеличить свои психологические проблемы. В частности, в некоторых ситуациях прикладного применения тестов респонденты могут иметь сильное желание показаться более когнитивно ослабленными, эмоционально подавленными, физически уставшими или психологически взволнованными, чем на самом деле. Этот феномен называется симуляцией неблагополучия (стремление показаться хуже, чем на самом деле),или «симуляцией болезни», и он признается диагностическим справочником DSM-IV Американской Психиатрической Ассоциации (1994) как серьезная проблема в психологической оценке и диагнозах.

Задумайтесь на мгновение, почему индивиды могут стараться преувеличить наличие или тяжесть психологических проблем. Примите во внимание некоторые из ситуаций тестирования, в которых симуляция неблагополучия проявляется с большей вероятностью – судебно-психологическая экспертиза, оценка нетрудоспособности, требование денежных компенсаций от работников, экспертиза психологического вреда или ущерба (Berry, Baer, Rinaldo, & Wetter, 2002; Mittenberg, Patton, Canyock, & Condit, 2002). В данных ситуациях тестируемые потенциально выигрывают от нахождения у них психологического или нейропсихологического нарушения. Преступники могут получить относительно легкую меру наказания, если их признают невменяемыми, работники могут получить денежные компенсации, если будет вынесено решение, что им на работе был нанесен вред, а жертвы несчастных случаев получат денежные компенсации, если будет решено, что они получили нейропсихологические проблемы в связи с несчастным случаем. В целом симуляция неблагополучия – серьезное дело в тех ситуациях тестирования, где у респондента могут быть мотивы выглядеть неполноценным.

Очевидно, что симуляция неблагополучия может отрицательно влиять на качество психологической оценки. Например, на такие когнитивные особенности, как внимание и память, может повлиять повреждение мозга. Следовательно, человек, пострадавший в автомобильной аварии, может в результате получить высокую компенсацию по страховке, если сможет убедить суд, что получил мозговую травму, которая ухудшает когнитивные способности. В самом деле, многие нейропсихологические исследования включают в себя тесты на внимание и память, и человек может специально выполнить или попытаться выполнить их плохо, чтобы получить диагноз когнитивного нарушения. Симуляция неблагополучия может иметь конкретные последствия для точности и справедливости постановки диагноза, судебного заключения и решений, основанных на результатах исследования, которые были целенаправленно искажены.

Симуляция неблагополучия – не просто теоретическая, потенциальная угроза прикладному тестированию. По оценке исследователей (например, Berry и др, 2002; Mittenberg и др., 2002), она встречается в 7.3% - 27% случаев в общих психологических исследованиях и в 31% - 45% случаев в судебных разбирательствах (судебно-психологическая экспертиза, слушания по поводу нетрудоспособности и т.д.). На самом деле, как мы увидим ниже, существуют свидетельства того, что адвокаты специально информируют клиентов по поводу методик, используемых для обнаружения симуляции болезни или неблагополучия (Wetter & Corrigan, 1995; Youngjohn, 1995). Таким образом, симуляция болезни или психологических проблем представляет собой реальную угрозу объективной психологической оценке, и эксперты заключают, что неспособность понять влияние этого фактора «потенциально ведет к высоким затратам страховщиков, учреждений социальной защиты и общества в целом» (Berry и др., 2002, с.275).

Бездумные или случайные ответы

Иногда респонденты выбирают ответы по случайному или псевдослучайному принципу. Либо из-за беспечности, либо из-за отсутствия мотивации отвечать обдуманно, они могут выбирать ответы наугад или почти наугад, и в этом случае их ответ никак не соотносится с содержанием пункта теста. Например, индивид, заполняющий тест, в котором на представленные пункты можно давать ответы по пятибалльной шкале (1 = полностью не согласен, 5 = полностью согласен), может просто выбирать предложенные варианты ответов «циклично», отвечая «полностью не согласен» (1) на пункт 1, «не согласен» (2) на пункт 2, «воздержусь» (3) на пункт 3, «согласен» (4) на пункт 4, «полностью согласен» (5) на пункт 5, возвращаясь к варианту «полностью не согласен» на пункт 6, чтобы начать круг заново. Очевидно, это приводит к получению таких тестовых баллов, которые не имеют смысла по отношению к измеряемому конструкту.

Угадывание

Некоторые психологические тесты устроены таким образом, что одни ответы в них являются правильными, а другие - ошибочными. Например, такие тесты достижений, как тест академических способностей SAT и экзамен на получение последипломного образования (GRE[3]) включают в себя пункты, оценивающие вербальные или математические способности респондентов. Каждый пункт в таких тестах имеет единственный правильный ответ, и экзаменующиеся набирают высокий итоговый балл, отвечая правильно на большинство заданий. Подобные тесты обычно используются в ситуациях, когда от результатов теста отчасти зависят какие-то важные последствия (например, поступление в колледж).

При проведении тестирования в таких важных ситуациях респонденты могут стараться угадать правильный ответ. Особенно это актуально для тестов с ограниченным количеством возможных вариантов ответа. Угадывание встречается настолько часто, что некоторые тесты достижений обрабатываются особым образом, с поправкой на угадывание (как именно, мы обсудим ниже в этой главе).

В тех случаях, когда респондент действительно не знает, какой из вариантов ответа правильный, угадывание может ухудшить качество и содержательность итогового результата. Правильная догадка повышает итоговый результат респондента, искусственно завышая его по сравнению с реальным уровнем знаний. Таким образом, выводы, основанные на результатах теста, могут быть искажены влиянием угадывания. Подобным образом, различные успехи в угадывании могут быть источником случайной ошибки измерения. Если некоторые респонденты более «удачливы», чем другие (то есть некоторые респонденты случайно чаще угадывают правильный ответ, чем другие), или если некоторые респонденты пытаются угадывать, а некоторые не пытаются, тогда фактор угадывания создает такие тестовые баллы, которые не соотносятся с истинными различиями между респондентами.

РЕЗЮМЕ

Как было показано в данной главе, установка респондента на ответ может вносить в результаты теста систематическую ошибку, которая может как снизить психометрическое качество теста, так и исказить психологическую интерпретацию тестовых баллов. Было показано также, что установка респондента на ответ может быть обусловлена характеристиками теста (например, непонятными формулировками или неоднозначными вариантами ответа), характеристиками ситуации тестирования (например, когда от результатов по тесту отчасти зависят серьезные последствия), а также характеристиками самих респондентов (например, склонностью респондента к самообману, податливостью или скрытностью).

Ученые, занимающиеся поведением, хорошо осведомлены насчет данных установок и их влияний на прикладные решения и исследовательские выводы (там, где эти выводы и решения основаны на психологическом тестировании). Для того, чтобы избавиться от проблем, обусловленных установками респондентов на тот или иной ответ, психологами было разработано множество стратегий, направленных либо на предотвращение самого существования таких установок, либо на снижение их влияния на тестовые баллы, либо на их обнаружение и внесение в полученные данные соответствующих поправок.

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА

Основательный обзор изданий по симуляции неблагополучия, особенно в контексте психопатологического тестирования:

Berry, D.T.R., Baer, R.A., Rinaldo, J.C., & Wetter, M.W. (2002). Assessment of malingering. In J.N.Butcher (Ed.), Clinical personality assessment (2^nd ed., pp. 269-302). New York: Oxford University Press.

[1] В психометрической литературе первоначально термин «установка на согласие» (acquiescence bias) применялся по отношению к склонности респондента на все вопросы и утверждения теста отвечать «да». В дальнейшем содержание термина расширилось, и он стал применяться по отношению и к тем случаям, когда респондент на все вопросы отвечает «нет». (прим.перев.)

[2] Англоязычный термин – malingering – зачастую в специализированных словарях переводится просто как «симуляция». (прим.перев.)

[3] GRE (Graduate Record Examination) – экзамен на получение последипломного образования, который во многих университетах и колледжах США требуется для поступления в аспирантуру. (прим. перев.).

[4] В оригинале используются следующие термины: response bias, response sets и response styles. Термин response bias в сущности обозначает «систематическую ошибку ответа на утверждение теста, обусловленную не самим содержанием утверждения, а другими факторами». Само слово bias означает «крен», «перекос». Для краткости мы переводим термин response bias как «установка на ответ», следуя при этом традициям, заложенным в классическом для российской психодиагностики переводном тексте П.Клайна «Справочное руководство по конструированию тестов» (установка на согласие, установка на социальную желательность и т.д.). Термин response set означает всю совокупность факторов, связанных с ситуацией тестирования, которые могут оказывать влияние на тот или иной ответ респондента. Термин response style переводится как «стиль ответов». Во избежание путаницы мы взяли на себя смелость перевести данные термины упрощенно: внешние (response sets) и внутренние (response styles) факторы, влияющие на установку респондента на ответ (response bias). Следует иметь в виду, что в англоязычной литературе понятия «внешних» и «внутренних» факторов в этой связи как самостоятельные термины не используются. (прим.перев.)

Конструирование и анализ заданий теста

Наши рекомендации

Выполнение заданий с развернутым ответом. Анализ выполнения заданий ЕГЭ-2016 по русскому языку

Анализ характеристик заданий теста

Определение количества заданий (спецификация теста)

Психологическая характеристика заданий теста по сериям

Психометрическая проверка теста анализ пунктов теста

По видам деятельности учащихся, необходимой при выполнении отдельных заданий теста, банк заданий может быть условно разделен на 5 групп.

Приложения. На выполнение заданий первой части теста отводится 15 мин

Конструирование теста. Основные проблемы. Формирование информационной базыисследования конструирование шкал. Выделение однородных групп испытуемых.

Конструирование надежного теста.

Определение количества заданий (спецификация теста)

← Предыдущая страница | Следующая страница →