Какова роль валидности в психиатрических и личностных тестах?
Хотя анализ надежности может установить, что тест измеряет нечто воспроизводимое, анализ валидности может точно установить, что именно мы измеряем. Анализ валидности помогает установить, может ли тест быть использован для клинических целей, таких как скрининг на ранних стадиях заболевания, диагностический процесс, мониторинг реакции на лечение и исследование причин заболеваний.
Исследование уровня валидности обычно требует: 1) подсчета уровня корреляций между тестом и другими связанными с ним измерениями и атрибутами, 2) изучения различий показателей шкал внутри выбранных групп.
* Ретестовая надежность — характеристика методики, получаемая путем повторного обследования испытуемых с помощью одного и того же теста.
** Характеристика надежности на основании оценки связей между частями или отдельными заданиями, составляющими тест. - Примеч. ред.
54 II. Диагностические мероприятия
7. Как определить, что тест валиден?
Фундаментальный вопрос в рассмотрении валидности теста: «Имеют ли шкалы теста биологическую или клиническую ценность для специфической задачи, которая значима для меня и обследуемых?» Одна из трудностей оценки валидности в психиатрии и психологии — это отсутствие абсолютного стандарта, по которому можно судить о валидности теста. Хотя это создает проблемы для клиницистов и исследователей многих областей медицины, в области психологии и психиатрии эта проблема имеет особенное значение, поскольку многие психосоциальные феномены не могут быть четко выделены или описаны. В идеале, валидность психиатрических и личностных опросников определяется путем осмысления основательности различных исследований валидности, которые показывают, что тест измеряет именно то, для чего предназначен.
Перечень аспектов опросников, связанных с надежностью и валидностью
Надежность
Тест-ретест -
Коэффициент надежности около 0,8 в течение периода от 2 дней до 2 нед.? Снижаются ли показатели надежности для флуктуирующих переменных или повышаются (приблизительно до 0,9) для стабильных переменных, таких как личностные черты? Внутренняя надежность —
Коэффициент альфа Кронбаха около 0,7—0,8 в группах сравнения или около 0,9 для индивидуального скрининга или классификации? Валидность
Содержательная
Покрыта ли вся ширина теоретической концепции лежащей в основе теста? Вошло ли в тест теоретическое понимание клинически важных областей? Прогностическая
Возможно ли прогнозирование поведения субъекта на основе результатов? Конвергентная
Коррелируют ли результаты теста с другими способами измерений?
Возможно ли получение сходных результатов при использовании других методик или при получении информации другим способом, например от самого субъекта, врача или супруга? Дискриминантная
Отличаются ли результаты по шкалам выбранных групп от предсказанных?
Обнаруживаются ли низкие корреляции с переменными теоретически не связанными с тестом,
или найдены негативные корреляции, ожидаемые теоретически? Для целей скрининга имеет ли тест 100% чувствительность и избирательность? Имеет ли тест хорошую реактивность при оценке лечебного процесса (см. вопрос 12)? Конструктивность
Термин представляет собой суждение, основанное на результатах исследований валидности за определенный период, о том, что тест измеряет именно то, что нужно.
8. Что такое содержательная валидность?
Это полностью субъективное суждение, основанное на консенсусе специалистов и/или обзоре литературы о том, что широта теоретической концепции, на основе которой создан тест и для измерения показателей которой он применяется, адекватно покрыта тестом, либо наиболее клинически важные части этой концепции (например, критическое содержание) полностью покрыты. В целом, когда в литературе появляется новый психиатрический или личностный опросник, он имеет некоторые клинические преимущества перед уже существующими. Например, новый тест может быть короче и быстрее в проведении, лучше сформулированы вопросы или введены новые, отражающие последние изменения в теории или клинической практике. Либо это может быть сопутствующим инструментом для целей скрининга, замещающим более длинные опросники или клинические интервью в некоторых ситуациях, в которых использование последних непрактично (например, в исследованиях больших групп).
9. Что такое прогностическая валидность?
Термин отражает наш интерес в прогнозе определенных видов поведения в определенный момент в будущем. Например, ожидается, что шкалы теста скрининга на депрессивные
Глава 7. Самозаполняемые опросники 55
симптомы должны высоко коррелировать с вероятностью суицидального поведения или использованием антидепрессантов.
10. Что показывает конвергентная валидность?
Она показывает степень корреляции с другими видами измерений, с которыми тест связан общей теорией создания. Например, один тест для измерения депрессивных симптомов должен коррелировать с другими методами измерения депрессии. Другой подход подразумевает, что шкалы теста, по крайней мере, умеренно коррелируют с информацией, полученной из других источников, например, от самого пациента, его врача и членов семьи.
11. Что устанавливает термин «дискриминантная валидность»?
Устанавливает, что тест не коррелирует с методами измерения, с которыми он теоретически не связан, например, что шкалы депрессивных симптомов не коррелируют со шкалами, измеряющими интеллект. А также то, что показатели по шкалам теста значительно различаются в группах, где это различие теоретически очевидно, например, по шкале депрессивных симптомов больные депрессией должны показывать значительно более высокие результаты, чем нормальная группа или группа пациентов, успешно пролеченных антидепрессантами.
Определите реактивность.
Термин описывает способность теста выявлять реальные изменения в состоянии пациента с течением времени (обычно в контексте лечения). Например, шкалы депрессии должны быть ниже у пациентов при повторном тестировании после медикаментозного лечения или психотерапии при условии их успешности. Deyo и соавт. привели подробное обсуждение реактивности и примеры соответствующих показателей.