Репрезентативность, достоверность и дискриминативность психологического теста.
Репрезентативность– одна из ключевых психометрических характеристик теста. Она свидетельствует о возможности использования тестовых норм, выработанных на выборке стандартизации при разработке теста, для всей генеральной совокупности испытуемых, для которых данный тест предназначен.
Репрезентативность означает, что с некоторой определенной статистически погрешностью можно считать, что представленное в выборочной совокупности распределение изучаемых психических свойств соостветствует их реальному распределению.
Для оценки репрезентативности проводится анализ распределения тестовых баллов, полученных при пилотажном тестировании на выборке стандартизации. Обычно при получении кривой нормального распределения делается вывод о том, что тестовые обладают репрезентативностью. Для проверки нормальности распределения используются различные статистические критерии, например критерий Колмогорова-Смирнова. Но нормальность не является необходимым условием репрезентативности. Репрезентативность тестовых норм может достигаться и в отсутствие нормального распределения. Если распределение тестовых баллов отличается от нормального, то для проверки репрезентативности необходимо решить вопрос об устойчивости тестовых норм. Для этого производится расщепление выборки пополам и сравнение распределений тестовых баллов в первой и второй половине выборки. Если не выявлено различий, то распределение тестовых баллов является устойчивым, а тестовые нормы репрезентативными.
Репрезентативность тестовых норм - это возможность использования тестовых норм, полученных по результатам выборочного тестирования, для оценки генеральной совокупности испытуемых. Тест репрезентативен тогда, когда использованная при его разработке выборка обоснована и присущие ей характеристики достаточно равномерно распределены в генеральной совокупности. Чем шире обследованная выборка, чем точнее она отражает структуру генеральной совокупности (по полу, возрасту, уровню образования и т.п.), тем выше репрезентативность тестовых норм.
Репрезентативность позволяет классифицировать результаты тестирования - выделять высокий, средний и низкий уровни выраженности психических свойств. Если тест не репрезентативен, то предлагаемые им оценки выраженности свойств будут неприменимы за пределами выборки стандартизации.
Дискриминативность - это способность отдельных заданий теста и теста в целом дифференцировать обследуемых относительно ''максимального" и "минимального" результатов теста. Дискриминативность измеряется показателем дельта Фергюсона и принимает максимальное значение при равномерном (прямоугольном) распределении показателей (d=1).
Точность информации измеряется тем, насколько дробной шкалой являются применяемые метрики, или, другими словами, насколько чувствителен инструмент. Таким образом, это степень приближения результатов измерения к истинному значению измеряемой величины.
Конечно, каждый исследователь должен стремиться получить наиболее точные данные. Однако создание инструмента, обладающего нужной степенью точности, в ряде случаев достаточно трудное дело. Всегда необходимо решить, какая мера точности является допустимой. При определении этой меры исследователь пользуется всем арсеналом теоретических представлений об объекте.
При помощи тщательного конструирования теста можно обеспечить соответствующий уровень дискриминативности, а это именно то, в чем тесты значительно выигрывают по сравнению с другими формами испытаний. В общем, было обнаружено, что в оценке может быть использовано около девяти градаций, а в опросах, вероятно, наиболее эффективно использовать 3 (или пять) градации: ниже среднего, средний уровень и выше среднего. Подобно этому, шкалы ранжирования редко содержат более девяти градаций. Это означает, что испытуемые разбиваются в лучшем случае на девять групп.
Достоверность теста
Особой разновидностью валидности является достоверность, которая требует специальных усилий и процедур по ее обеспечению. Речь идет о сознательных или бессознательных искажениях, которые вносит тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении.
Способность теста защищать информацию от мотивационных искажений испытуемого и есть достоверность теста. Особенно остро эта проблема стоит в случае тестов-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.
Типичный прием обеспечения достоверности - наличие в тест-опросниках шкал лжи. Шкала лжи - это шкала, состоящая из вопросов, касающихся незначительных проступков, которые совершаются большинством людей. Эти шкалы основываются главным образом на феномене социальной желательности - стремлении испытуемых давать в ходе тестирования социально одобряемую информацию.
Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным и ему предлагается либо выполнить данный тест еще раз, будучи более откровенным, либо выполнить другой тест. Многие более специфичные "ловушки", направленные на измерение достоверности, часто входят как компонент в структуру конкретного теста.
Достоверность тестирования тесно связана со степенью доверительности общения с психологом. Здесь принято различать две диагностические ситуации: консультативную (ситуация клиента) и аттестационную (ситуация экспертизы). В первом случае испытуемый участвует в тестировании на добровольной основе и сам заинтересован получить рекомендации по результатам тестирования (например, в профконсультации). Во втором случае тестирование проводится по инициативе педагога или администрации, психолога, родителей, т.е. других лиц, и эти другие больше заинтересованы в результатах, чем сам испытуемый.
Понятно, что в аттестационной ситуации вопрос о достоверности особенно актуален. И опросники, не снабженные шкалами лжи, использовать в таких ситуациях бесполезно. Наоборот, в ситуации клиента могут быть использованы методики, на которые испытуемый заведомо будет отвечать некорректно в ситуации экспертизы.