Какова роль валидности в психиатрических и личностных тестах?

Хотя анализ надежности может установить, что тест измеряет нечто воспроизводимое, анализ валидности может точно установить, что именно мы измеряем. Анализ валидности помогает установить, может ли тест быть использован для клинических целей, таких как скрининг на ранних стадиях заболевания, диагностический процесс, мониторинг реакции на лечение и исследование причин заболеваний.

Исследование уровня валидности обычно требует: 1) подсчета уровня корреляций между тестом и другими связанными с ним измерениями и атрибутами, 2) изучения различий пока­зателей шкал внутри выбранных групп.

Какова роль валидности в психиатрических и личностных тестах? - student2.ru * Ретестовая надежность — характеристика методики, получаемая путем повторного обследования испы­туемых с помощью одного и того же теста.

** Характеристика надежности на основании оценки связей между частями или отдельными заданиями, составляющими тест. - Примеч. ред.

54 II. Диагностические мероприятия

Какова роль валидности в психиатрических и личностных тестах? - student2.ru 7. Как определить, что тест валиден?

Фундаментальный вопрос в рассмотрении валидности теста: «Имеют ли шкалы теста био­логическую или клиническую ценность для специфической задачи, которая значима для ме­ня и обследуемых?» Одна из трудностей оценки валидности в психиатрии и психологии — это отсутствие абсолютного стандарта, по которому можно судить о валидности теста. Хотя это создает проблемы для клиницистов и исследователей многих областей медицины, в области психологии и психиатрии эта проблема имеет особенное значение, поскольку многие психо­социальные феномены не могут быть четко выделены или описаны. В идеале, валидность психиатрических и личностных опросников определяется путем осмысления основательно­сти различных исследований валидности, которые показывают, что тест измеряет именно то, для чего предназначен.

Перечень аспектов опросников, связанных с надежностью и валидностью

Надежность

Тест-ретест -

Коэффициент надежности около 0,8 в течение периода от 2 дней до 2 нед.? Снижаются ли показатели надежности для флуктуирующих переменных или повышаются (при­близительно до 0,9) для стабильных переменных, таких как личностные черты? Внутренняя надежность —

Коэффициент альфа Кронбаха около 0,7—0,8 в группах сравнения или около 0,9 для индивиду­ального скрининга или классификации? Валидность

Содержательная

Покрыта ли вся ширина теоретической концепции лежащей в основе теста? Вошло ли в тест теоретическое понимание клинически важных областей? Прогностическая

Возможно ли прогнозирование поведения субъекта на основе результатов? Конвергентная

Коррелируют ли результаты теста с другими способами измерений?

Возможно ли получение сходных результатов при использовании других методик или при полу­чении информации другим способом, например от самого субъекта, врача или супруга? Дискриминантная

Отличаются ли результаты по шкалам выбранных групп от предсказанных?

Обнаруживаются ли низкие корреляции с переменными теоретически не связанными с тестом,

или найдены негативные корреляции, ожидаемые теоретически? Для целей скрининга имеет ли тест 100% чувствительность и избирательность? Имеет ли тест хорошую реактивность при оценке лечебного процесса (см. вопрос 12)? Конструктивность

Термин представляет собой суждение, основанное на результатах исследований валидности за определенный период, о том, что тест измеряет именно то, что нужно.

Какова роль валидности в психиатрических и личностных тестах? - student2.ru 8. Что такое содержательная валидность?

Это полностью субъективное суждение, основанное на консенсусе специалистов и/или об­зоре литературы о том, что широта теоретической концепции, на основе которой создан тест и для измерения показателей которой он применяется, адекватно покрыта тестом, либо наибо­лее клинически важные части этой концепции (например, критическое содержание) полно­стью покрыты. В целом, когда в литературе появляется новый психиатрический или личност­ный опросник, он имеет некоторые клинические преимущества перед уже существующими. Например, новый тест может быть короче и быстрее в проведении, лучше сформулированы во­просы или введены новые, отражающие последние изменения в теории или клинической практике. Либо это может быть сопутствующим инструментом для целей скрининга, замеща­ющим более длинные опросники или клинические интервью в некоторых ситуациях, в кото­рых использование последних непрактично (например, в исследованиях больших групп).

9. Что такое прогностическая валидность?

Термин отражает наш интерес в прогнозе определенных видов поведения в определенный момент в будущем. Например, ожидается, что шкалы теста скрининга на депрессивные

Глава 7. Самозаполняемые опросники 55

Какова роль валидности в психиатрических и личностных тестах? - student2.ru симптомы должны высоко коррелировать с вероятностью суицидального поведения или ис­пользованием антидепрессантов.

10. Что показывает конвергентная валидность?

Она показывает степень корреляции с другими видами измерений, с которыми тест свя­зан общей теорией создания. Например, один тест для измерения депрессивных симптомов должен коррелировать с другими методами измерения депрессии. Другой подход подразуме­вает, что шкалы теста, по крайней мере, умеренно коррелируют с информацией, полученной из других источников, например, от самого пациента, его врача и членов семьи.

11. Что устанавливает термин «дискриминантная валидность»?

Устанавливает, что тест не коррелирует с методами измерения, с которыми он теоретиче­ски не связан, например, что шкалы депрессивных симптомов не коррелируют со шкалами, измеряющими интеллект. А также то, что показатели по шкалам теста значительно различа­ются в группах, где это различие теоретически очевидно, например, по шкале депрессивных симптомов больные депрессией должны показывать значительно более высокие результаты, чем нормальная группа или группа пациентов, успешно пролеченных антидепрессантами.

Определите реактивность.

Термин описывает способность теста выявлять реальные изменения в состоянии пациен­та с течением времени (обычно в контексте лечения). Например, шкалы депрессии должны быть ниже у пациентов при повторном тестировании после медикаментозного лечения или психотерапии при условии их успешности. Deyo и соавт. привели подробное обсуждение ре­активности и примеры соответствующих показателей.

Наши рекомендации