Статистическая природа тестовых шкал
Психометрические методики основаны на статистическом подходе и предполагают использование методов математической статистики.
Так, при создании и применении психодиагностической методики часто используется статистический подход к пониманию нормы. С точки зрения данного подхода по любому диагностируемой психической характеристике считается, что нормальных людей большинство. Людей с более сильными и менее сильными проявлениями этой характеристике меньше; причем, чем сильнее отклонения от среднего проявления характеристики, тем меньше таких людей. Иными словами, статистическое понимание нормы предполагает, что при диагностике индивидов или групп действует закон нормального распределения. Теоретически для полного описания нормального распределения используются три переменные: среднее значение, стандартное отклонение, количество обследованных людей. Нормальность распределения оценивается, как правило, с помощью критерия Колмогорова – Смирнова, который считается наиболее состоятельным для определения степени соответствия эмпирического распределения нормальному.
Кривая распределения тестовых баллов отражает диагностическую силу пунктов ПДМ. Если кривая имеет правостороннюю асимметрию (рис. 1а), то в тесте преобладают задания с высокой диагностической силой, а если кривая имеет левостороннюю асимметрию (рис. 1б) – с низкой диагностической силой.
Рис. 1 Асимметрия распределения
Например, если в тесте интеллекта большинство заданий являются трудными, так как с ними не справляются многие испытуемые, то будет иметь место правосторонняя асимметрия и, наоборот, преобладание легких заданий будет обуславливать левостороннюю асимметрию. В первом случае тест плохо дифференцирует испытуемых с низким уровнем интеллектуальных способностей, а во втором случае – с высоким уровнем способностей.
Если пункты ПДМ в своем большинстве обладают средней диагностической силой, то кривая распределения зависит от того, насколько пункты однородны. Если пункты разнородны, то тест представляет собой последовательность независимых испытаний Бернулли. В этом случае при относительно большом количестве заданий кривая распределения суммарных баллов приближается к кривой нормального распределения.
Если ПДМ содержит такие разнородные задания примерно одинаковой диагностической силы (именно такие задания разрабатываются для оценки более или менее интегральных характеристик индивида или группы), то нормальность распределения суммарных баллов возникает автоматически – как артефакт самой процедуры подсчета суммарных баллов. При этом форма кривой распределения тестовых баллов не позволяет говорить о реальной форме распределения измеряемого свойства, каким оно является само по себе – в широкой популяции испытуемых. Нормальность распределения является прямым следствием направленного отбора пунктов с заданными свойствами.
Если подбираются пункты, тесно коррелирующие между собой, то в распределении баллов возникает отрицательный эксцесс (рис. 2а).
Рис. 2 Эксцесс распределения
Максимальных величин отрицательный эксцесс достигает по мере возрастания вогнутости вершин распределения – до образования двух вершин – двух мод (рис. 2б). Бимодальная конфигурация распределения баллов указывает на то, что выборка испытуемых разделилась на две категории (с плавными переходами между ними). Это значит, что в основе пунктов ПДМ лежит какой-то один общий всем признак, соответствующий определенному свойству испытуемых. Если у испытуемых есть это свойство, то они выбирают один вариант ответа, если нет этого свойства – то другой вариант. Например, в тесте интеллекта одна часть испытуемых справилась с большинством заданий, другая – не справилась.
В некоторых тестах пункты могут отрицательно коррелировать друг с другом. В этом случае на кривой возникает положительный эксцесс (рис. 2в): вся совокупность испытуемых по тестовым баллам шкалы концентрируется вблизи среднего значения. Такое возможно в двух случаях: а) неверно составлен «ключ» - объединены при подсчете отрицательно связанные признаки; б) испытуемые применяют, разгадав предназначение методики, определенную стратегию искажения ответов – преднамеренно балансируют ответа «да» и «нет» одного из полюсов измеряемого с помощью методики качества.
Соответствие методики принятым требованиям также устанавливается путем применения математико-статистических процедур. Например, репрезентативность выборки, на которой создаётся и апробируется методика, может быть оценена посредством определения минимального объема выборки с помощью определения доверительного интервала для среднего значения. Надежность-согласованность методики может быть определена с помощью a-коэффициента Кронбаха,факторного или кластерного анализа, а ретестовая надежность – корреляционного анализа. Для оценки конвергентной или дискриминантной валидности часто используют корреляционный анализ.
Для оценки эффективности всей процедуры измерения соотносят размеры ошибки измерения с размерами разброса суммарных баллов, вызванных индивидуальными различиями в измеряемой характеристике между испытуемыми. В терминах статистики речь идет о сравнении так называемой «истинной» дисперсии распределения суммарных баллов с дисперсией ошибки. И т.д.
Обработка результатов тестирования по многим методикам выражается в подсчете суммарного балла с помощью ключа, который устанавливает числовое значение исхода по каждому пункту. Например, за правильное решение задания в тесте интеллекта присваивается условная единица – «1», а за неправильное или пропуск – «0», так что балл буквально выражает количество правильных ответов. Далее, для постановки диагноза конкретному индивиду или группе используются рассчитанные на определенной выборке нормативные данные (среднее значение и стандартное отклонение) и выделенные на их основе статистические зоны проявления диагностируемой характеристики.