Стандартизация, надежность и валидность
Измерения и методы, которые мы используем для изучения поведения ребенка и семьи, должны пройти тщательное исследование, с тем чтобы можно было определить, насколько точно они оценивают определенные конструкты, такие как депрессия, тревога или умственная отсталость. Использование хорошо стандартизованных, надежных и валидных единиц измерения и процедур крайне важно для подлинно научного исследования, как это показано на рис. 3.4.
Стандартизация | Приложение определенных стандартов или норм к приему, чтобы обеспечить его применимость в различных измерениях |
Надежность | Степень согласованности измерения |
Валидность | Степень, в которой прием измеряет то, что предполагается измерить |
Рис. 3.4.Понятия, которые определяют ценность наших методов измерения и оценки.
Стандартизация— это процесс, который определяет набор стандартов или норм для процедуры измерения, с тем чтобы его можно было систематически использовать при различных оценках конструкта. Эти стандарты и нормы относятся к процедурам, которым необходимо следовать во время проведения исследования, сбора и оценки данных. В некоторых случаях измерение может проводиться на больших группах детей, которые различаются по определенным характеристикам, таким как возраст, пол, раса, социально-экономический статус или диагноз. Эти оценки можно затем использовать в целях сравнения. Например, тестовые оценки 8-летнего мальчика из среды с низким социально-экономическим статусом следует сравнивать оценками других детей, подобных ему, а не с оценками 16-летней девушки из среды с высоким социально-экономическим статусом.
Надежностьотносится к согласованности или повторяемости измерений. Чтобы быть надежными, измерения не должны зависеть от какого-то одного наблюдателя или клинициста; разные люди должны приходить к согласию в отношении того, что они видят. Это называют согласием между оценивающими (interrater agreement). Представьте свою реакцию, если вы покажете ребенка трем различным психологам, и они поставят ему три разных диагноза и порекомендуют три разных метода лечения. Как вам определить, какой из диагнозов вереи? В этом случае диагнозы не будут надежными, поскольку два психолога или более не пришли к согласию. Аналогичным образом различные измерения, такие как тесты или интервью, когда они повторяются в течение короткого интервала времени, должны давать схожие результаты в обоих случаях. Другими словами, результаты должны быть стабильными во времени; это называют надежностью теста и повторного теста (test-retest reliability).
Одной надежности недостаточно для определения того, отражает ли метод цели исследователя — должна быть продемонстрирована и валидность.
Валидностьметода показывает, в какой степени он действительно измеряет параметр или конструкт, который исследователь собирается измерить. Валидность можно оценить рядом способов. Во-первых, измерение можно проверить на его лицевую валидность (face validity), или степень, в которой оно, как представляется, оценивает интересующий конструкт. Конструктная валидностъ (construct validity) относится к тому, ведут ли себя при измерении оценки так, как предсказывают теория или прошлые исследования — к значению, вкладываемому в оценки. Конвергентная валидность (convergent validity) отражает корреляцию между измерениями, которые, как ожидается, связаны между собой, — показатель степени, в которой два измерения оценивают схожие или связанные конструкты. С этой валидностью контрастирует дискриминантная валидностъ (discriminant validity), которая относится к степени корреляции между измерениями, которые, как ожидается, не связаны друг с другом.
Наконец, связанная с критерием валидность (criterion-related validity) относится к тому, насколько точно измерение предсказывает поведение в условиях, где, как мы ожидаем, оно должно это делать либо в то же самое время (конкурентная валидность — concurrent validity), либо в будущем (предиктивная валидностъ — predictive validity). Например, высокие показатели ребенка при измерении социальной тревожности должны предсказывать, что ребенок проявит тревогу или избежание в текущих социальных ситуациях и, возможно, будет испытывать трудности с установлением дружеских отношений в будущем. Связанная с критерием валидность говорит, можно ли использовать показатели, полученные при измерении, для той цели, для которой они предназначены, — обладает или нет измерение практической пригодностью.
Измерения
Для оценки важных параметров когнитивного, поведенческого и эмоционального функционирования детей существуют самые разные методы измерения (Mash & Terdal, 1997). Эти методы представляют собой подробные планы наблюдения и оценки детей и их окружения способами, которые выявляют относительно явные связи между интересующими переменными. Важный вопрос, касающийся методов измерения: кто будет делать выводы относительно поведения — участники с помощью методов самоотчета или исследователь, используя методы наблюдения?
Среди методов, используемых в детской патопсихологии, — интервью, вопросники, контрольные листы и оценочные шкалы, психофизиологические записи и непосредственные наблюдения за поведением (Bellack & Hersen, 1998; Kamphaus & Frick, 1996; Mash & Terdal, 1997b). Кроме того, используются разнообразные интеллектуальные, академические и нейропсихологические тесты. В этой главе мы сосредоточим внимание главным образом на том, как эти методы используются в исследовании. Об их использовании в клинической практике и о тестах и тестировании мы поговорим более подробно в главе 4 «Обследование, диагноз и терапия».
Как показано в табл. 3.1, сравнение трех наиболее часто используемых методов сбора данных — интервью, вопросников и наблюдения — демонстрирует, как они различаются между собой по важным параметрам. Поскольку информация, которую мы получаем от детей и семей часто варьирует как функция используемых методов, исследователи нередко полагаются на подход, включающий несколько методов с целью определения и оценки интересующих конструктов.
Таблица 3.1. Интервью, вопросник и наблюдение
Интервью | Вопросник | Наблюдение | |
Структура ситуации | Полуструктурированная или структурированная | Высокоструктурированная | Структурированная или естественная |
Структура ответов | Возможность для зондирования, распространения и прояснения | Высокоструктурированная: нет возможности для зондирования и прояснения | Данные, которые нужно зафиксировать, могут варьировать от очень обширных до высокоизбирательных |
Требования к ресурсам | Требуется значительное время для проведения интервью и кодирования ответов | Экспериментатору требуется мало времени | Требуется много времени для наблюдения и кодирования его результатов |
Источники погрешности | Опирается на восприятие участников и их готовность давать сведения. На ответы могут повлиять характеристики и манеры берущего интервью | Опирается на восприятие участников и их готовность давать сведения | Не опирается на откровение участников, но на результат могут повлиять их реакции |
Редукция данных | Требуется анализ повествовательных ответов или запись с разбиением на категории | Требуется незначительная редукция данных | На объект наблюдения сильно влияет система кодирования результатов наблюдения |
Сообщения
Методы, использующие сообщения, оценивают восприятия, мысли, способности, установки, представления, чувства и прошлый опыт ребенка, родителей и учителей. Этот инструментарий включает относительно неструктурированные клинические интервью, высокоструктурированные диагностические интервью и вопросники. Проблемой со всеми методами сообщения является то, насколько точно дети и родители рассказывают о собственных мыслях, чувствах и поступках. Неточность может иметь место из-за неспособности припомнить важные события, избирательности воспоминания или тенденциозности, а также, в некоторых случаях, из-за намеренных искажений. Например, некоторые информаторы могут попытаться представить себя или других в лучшем или худшем свете. Кроме того, методы сообщения требуют определенного уровня вербальной способности и могут неточно оценивать индивидуумов, которым трудно выразить свои мысли. Очевидно, что в эту категорию попадают маленькие дети — до 7-8 лет они обычно не слишком надежные информаторы.