Проблемы, связанные с конструированием тестов

Конструирование психологических тестов включает в себя большое количество сложных и взаимосвязанных процессов. Двумя основными критериями, которым должны соответствовать тесты, являются надежность и валидность (validity). Кроме того, в большинстве психологических тестов используются нормы, с которыми следует сравнивать результаты тестирования конкретных индивидов. . А. теперь перейдем к поочередному краткому рассмотрению этих понятий.

Надежность. Под надежностью подразумеваются согласованность и точность получаемых результатов. Различные части или разновидности одного и того же теста должны приводить к сходным оценкам, а повторение теста через небольшой промежуток времени должно дать результат, аналогичный первоначальному. Поскольку при тестировании всегда присутствуют случайные факторы, например связанные с концентрацией внимания клиента, ни один из тестов невозможно признать абсолютно надежным; тем не менее, тесты высокого качества позволяют получить достаточно точные результаты, чтобы считать тестовые показатели осмысленными. При оценке отдельного индивида для признания теста в достаточной степени точным коэффициент корреляции должен иметь значение около 0,8 и больше. (Говоря коротко, под корреляцией понимается тенденция, при которой два взаимосвязанных показателя, относящиеся к двум различным множествам тестовых показателей, изменяются совместно, так что, зная результат одного теста, можно с достаточной точностью предсказать средний результат другого). Коэффициенты корреляции варьируют от полного отсутствия связи, или 0,00, до идеальной связи; либо минус или плюс 1,00. Более подробное обсуждение вопросов надежности можно найти в книге Анаста-jn и Урбины (Anastasi & Urbina, 1997). (Мы исходим из того, что читатели имеют некоторое представление о статистических терминах, тогда как подробное объяснение этих терминов можно найти в работах, аналогичных книге Анастази.)

Валидность теста касается того, что именно измеряется данным конкретным тестом и насколько хорошо измеряется этим тестом данный показатель. К примеру. в какой степени тест интеллекта действительности оценивает интеллект? Определение валидности теста — чрезвычайно сложная задача, для решения которой применяются различные техники, в частности связанные с сопоставлением результатов конкретного теста по определенному показателю с резу штатами других тестов по этому показателю или с поведением испытуемого в условиях реальной жизни (конкурентная валидность), с сопоставлением результатов тестирования с последующими достижениями испытуемого (прогностическая валидность), а также с определением того, насколько взаимосвязаны между собой различные показатели одного теста, которые должны быть взаимосвязаны согласно лежащей в основе данного теста теории (конструктивная валидность). При проведении обследований психолог должен понимать, что валидность является наиболее важным фактором в интерпретации результатов теста, особенно если исследуются сходные популяции с аналогичными предполагаемыми проблемами. Как правило, коэффициенты валидности значительно ниже коэффициентов надежности. Фактически можно считать показатель надежности теста верхней границей или пределом для любого показателя валидности, полученного для данного теста (Anastasi & Urbina, 1997). Даже самые «валидные» тесты нередко не позволяют объяснить большую часть тех вариаций, которая наблюдается между тестовыми результатами. (Подробное обсуждение этих вопросов и их связи с оценкой расстройств личности смотрите в книге Millon & Davis, 1996.)

Надежность и валидность в реальном мире. Стандарты, которым должны соответствовать основные процедуры обследования — тестирование, интервьюирование и наблюдение, — приобретают особую важность, когда главной целью обследования становится принятие жизненно важного решения: к примеру, следует ли поместить человека в исправительное учреждение, направить в интернат, оценить качество родительской опеки в ходе судебного разбирательства либо поставить диагноз умственной отсталости, депрессии или расстройства научения. Подобные решения нередко необратимо изменяют ход жизни клиента, подчиняя ее поставленному диагнозу. (Представьте себе, насколько изменилась бы ваша жизнь, если бы вам поставили диагноз умственной отсталости или депрессии.) Очень важно помнить о том, что последствия подобных решений зачастую необратимы. Иными словами, как гласит народная мудрость, «сделанного не воротишь», что полностью относится к тем случаям, когда на индивида уже навешен диагностический ярлык. Проблема с определением валидности и надежности состоит в том. что соответствие релевантным критериям было тщательно изучено лишь для немногих техник. Техники, не удовлетворяющие высоким стандартам, могут иметь некоторую ценность лишь при наличии возможности сверить выводимые на их основании гипотезы с другими данными, как это имеет место в случае продолжительной терапии. Наконец, психолог, проводящий тестирование, должен быть уверен в том, что используемые им тестовые процедуры не слишком навязчивы и что их проведение действительно является клинически показанным.

Нормы. Стандартизированные тесты, как правило, применяются к большой выборке людей. Эта выборка должна быть репрезентативна по отношению к обшей популяции, из которой она отобрана, а также в отношении популяций, которые будут оцениваться при тестировании. Данные, получаемые при стандартизации или нормированию выборки, позволяют вывести показатель среднего результата для данной популяции. Но пожалуй, самым важным показателем, обеспечиваемым нормами, являются частотные показатели отклонений от средней величины. Иными словами, благодаря информации о частоте результатов выше и ниже среднего для нормативной выборки можно установить, в какой степени результаты конкретного индивида являются типичными или нетипичными для его группы (Anastasi & Urbina, 1997). Такие психологические тесты, как тесты интеллекта, зачастую характеризуются нормами, которые изменяются с возрастом, отражая типичные изменения человека по мере взросления. Например, результаты тестирования конкретного 6-летнего ребенка сравниваются с результатами других 6-летних детей. а результаты 10-и-летнего ребенка — с результатами 10-летнпх В качественно сконструированных тестах применяются нормативные выборки, отражающие основные демографические характеристики популяций, для которых предназначены данные тесты; при этом, как правило, предпринимаются попытки добиться того, чтобы представители различных этнических групп, социоэкономических уровней и обоих иолов были адекватным образом представлены в выборке.

Проведение тестов

Согласно этическому кодексу Американской психологической ассоциации (АРА, 1992а, 1992b), прежде чем приступить к самостоятельному проведению тестирования или интерпретации его результатов, психолог должен продемонстрировать наличие соответствующих знаний, профессиональной подготовки и опыта использования тестовых процедур. Как и при проведении интервью, задача тестирующего — побудить клиента к честному, свободному от тревожности и заинтересованному поведению. При работе с клиническими пациентами, многие из которых изначально тревожны или склонны к психологической защите, тестирующему зачастую приходится потратить немало времени и сил для установления раппорта. Клиент, естественно, хочет знать, в чем именно состоит смысл тестирования и как будут использованы результаты. В начале предваряющего тестирование интервью клиницист объясняет основные цели тестирования и отвечает на вопросы. Этические нормы требуют, чтобы, как и в случае интервьюирования, клиент дал свое информированное согласие и был поставлен в известность о том, что может прервать процедуру в любой момент. При тестировании детей или взрослых, не способных понять объяснения клинициста и свои права, к участию в процедуре необходимо привлечь родителей или опекунов.

Если тесты были проведены с соблюдением всех правил и был установлен прочный раппорт, они представляют собой эффективный метод сравнения результатов тестируемого индивида с результатами других людей или с релевантными критериями. В отличие от многих образовательных и производственных тестов, которые в течение последних нескольких десятилетий подвергались в США серьезной критике, клинические тесты проще поддаются адаптации к потребностям пациента или клиента в более широких оценочных контекстах. Клиницисты обычно достаточно хорошо знают своих клиентов, а потому могут интерпретировать результаты, принимая во внимание личные проблемы клиентов и характерные для них стили прохождения тестов.

Наши рекомендации

Проблемы, связанные с беременностью

VIII. Знакомство с бумажным конструированием

Политические проблемы (проблемы, связанные с деятельностью государственной власти)

Тема и связанные с ней проблемы

Теоретические соображения, связанные с использованием дихотических и тахистоскопических тестов

И связанные с ней проблемы

Проблемы и потенциальные возможности применения тестов

Математические проблемы теории тестов

Проблемы, связанные со стрессом

Математические проблемы теории тестов

← Предыдущая страница | Следующая страница →