Конструктная валидность

Термин «конструктивная валидность» был предложен в 1954 г. известным американским тестологом Ли Кронбахом. В отечественной литературе данное понятие часто фигурирует как «понятийная (концептуальная) обоснованность» или как «логическая обоснованность» теста.

Конструктная валидность − наиболее широкое понятие среди ранее упоминавшихся, поскольку она предполагает все другие виды валидности. По определению Анастази, конструктивная валидность показывает то, насколько результаты теста могут рассматриваться в качестве меры теоретического конструкта (или идей) его автора.

Этапы определения конструктной валидности теста:

1. Исходя из современного ему уровня развития науки, собственного опыта, имеющих место фактов в жизни общества, исследователь постулирует гипотетический конструкт (в терминах дифференциальной психологии формулирует изучаемый психический феномен или явление).

2. В соответствии с выделенным конструктом автор определяет круг, типы возможных проявлений этого конструкта в целостном поведении человека (выдвигает гипотезу о внешней репрезентативности свойства).

3. Данная гипотеза конкретизируется в виде тестовых заданий, которые проверяются на соответствующей выборке.

Вопрос 5

Процедуры измерения валидности.

Выбор процедуры эмпирической валидизации зависит от временного статуса критерия. Если этим критерием является событие, имеющееся в настоящее время или уже свершившееся, то есть проверяется текущая или ретроспективная валидности, то к участию в обследовании привлекаются испытуемые, оказавшиеся на экстремальных полюсах по этому критерию.

Если критерий − будущее событие, то есть производится проспективная (прогностическая) валидизация, то выборка должна быть составлена с запасом, учитывая возможный объем экспериментальных групп в будущем.

Пусть на основании данных исследований статистически известно, что в течение трех лет из 1000 людей заболеют 57 человек. Это означает, что превентивной (предупреждающей) диагностикой должно быть охвачено около 2000 человек, чтобы получить численность «высокой» группы (заболевших) порядка 100.

По-иному производится эмпирическая валидизация в том случае, когда критерием валидности являются экспертные оценки. Для того чтобы групповая оценка была источником действительно валидной информации, эксперт должен согласованно оценивать испытуемых. Мерой согласованности оценщиков может служить известный коэффициент надежности Л. Кронбаха.

Как правило, если коэффициент надежности невысок, то оценка (экспертная) не используется в качестве критерия валидности. Эмпирическое значение коэффициента валидности рассчитывается как линейная или ранговая корреляция между оценками.

ТЕМА 8.

ДОСТОВЕРНОСТЬ ТЕСТОВЫХ ИСПЫТАНИЙ

Краткое содержание лекции:понятие достоверности тестовых испытаний. Проблема достоверности тестовых опросников, факторы, детерминирующие ответы на вопросы. Фальсификация и установки на ответы. Понимание вопросов и изменчивость ответов. Психометрический парадокс. Обобщенный анализ факторов, детерминирующих ответ.

Психологические факторы, влияющие на достоверность результатов тестирований, уровень знаний, социальная желательность, индивидуальная тактика испытуемого. Достоверность психологической информации, полученной в ситуации экспертизы и в ситуации консультирования клиента. Меры борьбы с мотивационными искажениями результатов тестирования; разработка шкал достоверности (шкал лжи), коррекционных коэффициентов, компьютерный контроль достоверности.

ПЛАН ЛЕКЦИИ

Вопрос 1.Факторы, влияющие на достоверность результатов по тесту.

Вопрос 2.Способы повышения достоверности.

РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА:

1. Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике, СПб., 2001.

2. Общая психодиагностика / Под ред. А.А. Бодалева, В.А. Столина. М., 1987.

3. Александрова Ю.В. Методики диагностики отношение взрослого человека: роли, позиция, нравственная сущность. Метод. пособие. М., 2001.

4. Борисова Е.М., Гуревич К.М. Психологическая диагностика в школьной ориентации // Вопросы психологии. 1988. №1.

5. Доскин В.А., Лаврентьева Н.А., Мирошников М.П., Шарай В.Б. Тест дифференцированной самооценки функционального состояния //Вопросы психологии. 1973. № 6.

6. Куликов Л.В. Психологическое исследование: Метод. рекомендации по проведению. СПб., 2001.

7. Практикум по психодиагностике. Психодиагностика мотивации и саморегуляции. М., 1990.

Внутри общей проблемы валидности тестов целесообразно выделить вопрос об обеспечении валидности процедур, в основе которых лежит самоотчет испытуемых. К таким процедурам относятся различные техники шкалирования, классификации, сравнения и тест-опросники. Результаты личностных опросников в наибольшей мере подвержены искажениям или сознательной фальсификации со стороны испытуемого.

Вербальная форма подачи тестового материала в наиболее явной форме наталкивает испытуемого на мысль о связи его ответов с целями тестирования. Если же тестирование в той или иной степени является значимым для испытуемого, затрагивает его интересы (например, при приеме на работу, в ходе следственной экспертизы и т.п.), а для достижения своих целей необходимо фальсифицировать результат, то он редко отказывается от этой возможности.

Валидность, таким образом, - характеристика любых измерений, в том числе и физических. Специфичность объекта психодиагностики - человека -в его активности, сознательности, наличие собственных интересов, которые далеко не всегда совпадают с целями психолога, проводящего тестирование. Эти особые характеристики измеряемого объекта порождают и специфические проблемы тестирования, объединенные названием достоверность.

Достоверность – это способность математики защищать свои результаты от сознательных и бессознательных искажений.

Психологические факторы, от которых зависит достоверность результатов теста, можно условно объединить в три группы:

I. Факторы знания. У испытуемого может быть более или менее четкое представление о следующем:

1.1 свойственно ли в действительности или нет тестируемое поведенческое проявление. С некоторыми ситуациями, имплицитно подразумеваемыми в вопросе теста, испытуемый мог на практике никогда не встречаться, например, "Сидя за рулем, я обычно стремлюсь обогнать едущие впереди машины" или "После выигрыша в спортлото Вы покупаете больше лотерейных билетов". Добиться того, чтобы все содержание опросника было знакомо и актуально для каждого испытуемого, по-видимому, невозможно,

1.2. за тем или иным конкретным поведением, описанным в суждении. В известной степени процесс "разгадывания" испытуемым тестируемого конструкта может быть сглажен правдоподобной инструкцией. Если же информация, изложенная в инструкции совершенно не соответствует содержанию опросника, это может вызвать чрезмерную настороженность испытуемого;

1.3. как это свойство соотносится с общепринятыми моральными нормами и признаками социального успеха.

II. Фактор "социальной желательности"обозначает тенденцию давать о себе социально одобряемую информацию. Такая тенденция, по мнению Г. Айзенка, необязательно означает сознательный облик психодиагноста. Впервые исследовавший данный фактор А.Эдвардс (1957) назвал его "эффектом фасада", т.е. часто неосознаваемым стремлением "выдвигать на первый план свои хорошие стороны". Такое стремление может означать отсутствие понимания себя, самообман или нежелание показать собственные недостатки. Более поздние исследователи (Граун, Марлоу, Фредериксон) получили доказательства, подтвердившие, что частота социально одобряемых ответов связана с более общей потребностью индивида в самозащите, уклонении от критики, социальном согласии и социальном подтверждении.

Таким образом, главным аспектом фактора "социальной желательности" является тенденция к идеализации, морализации образа своего "Я", источником которой может быть как недостаточное знание своей личности, так и чаще, боязнь оказаться неадекватным сложившимся общественным нормам. Помимо такой внутренней тенденции на частоту социально одобряемых ответов существенное влияние оказывает и сама ситуация тестирования. Одно дело, если испытуемый сознает, что исследование проводится только с научными целями, другое - если результаты тестирования могут затронуть его интересы.

Действие фактора "социальной желательности" в некоторой степени опосредовано действием фактора "знания". Искажение результатов не произойдет, если испытуемые не смогут разгадать направленность опросника и связать диагностируемые свойства с тем или иным полюсом "социальной желательности".

III. Факторы "индивидуальной тактики".

Здесь подразуемается действие "Я-концепции" ("Я" для себя) и "Я-образа" ("Я" для других) на тактику выполнения заданий в различных ситуациях тестирования. В процессе заполнения тест-опросника испытуемый всегда невольно находится в диалоге с самим собой и в своих ответах раскрывается не только для других, но и для самого себя. Как правило, в ситуациях высокого социального риска "Я-образ" польностью доминирует: например, преступник при экспертизе чаще всего стермится представить больным или неприспособленным к жизни, хотя в действительности ему приятно было бы думать о себе как о вполне адаптированном здоровом человеке. Клиенты, обратившиеся за помощью к психологу-психотерапевту также склонны подчеркивать свои трудности с тем, чтобы вызвать повышенное внимание к себе и убедить что специалист не напрасно тратит с ними время. В менее регламентированных ситуациях, наоборот может преобладать ситуация самопознания, в этом случае испытуемый стремится подтвердить с помощью теста свое мнение о самом себе.

Заслуживают внимание специфические формы отказа от тестирования: позиционный стиль ответа ("соглашательство" или, наоборот, "отрицание"), случайные ответы и отклонение. Последнее представляет собой стремление давать необычные или необщепринятые ответы. Исследования подобного рода тактик прошли через два этапа:

1. Сначала такие установки на ответы рассматривались в отрыве от личности испытуемых лишь как источник систематической ошибки. Для их выявления обычно использовались довольно простые меры:

1) для исключения влияния соглашательства (отрицания) применяются перечни с прямыми (ответ "верно" в пользу измеряемого свойства) и обратными (ответ "неверно") пунктами. Кроме того, производится подотчет баланса "подтверждающих" и "отвергающих" ответов: если баланс резко нарушается, то протокол ответа признается бракованным;

2) для выявления случайных ответов в большие опросники вводят вопросы-дубли (т.н. синонимические перефразы) или прямые повторы. Если испытуемый слишком часто по-разному отвечает на одинаковые вопросы, значит он применяет случайную тактику;

3) индикатором отклонений является крайне редкие утверждения, с которыми испытуемые, не использующие подобной тактики могут согласиться разве что по ошибке;

Вопрос 2

Наши рекомендации