Глава 1. Психометрическая парадигма конструирования тестов и шкал
рый считается апробированным и измеряющим то же свойство, что и конструируемый тест.
Жизненные критерии - это объективные социально-демографические и биографические данные (стаж, образования, профессия и т. п.), показатели успеваемости, производственные показатели эффективности выполнения отдельных видов профессиональной деятельности и т. п. Эти критерии наиболее часто применяются для конструирования тестов способностей к обучению, интеллекта, методик для профотбора и профориентации, тестов общих и специальных способностей и т. д.
Технология анализа данных предлагает широкий арсенал методов получения диагностических показателей и отбора информативных признаков при наличии внешнего критерия. В этом случае исследователь решает описанную в предыдущем разделе задачу группировки испытуемых на заданные группы при помощи соответствующих методов.
В частности, для построения диагностического показателя и отбора информативных признаков может использоваться множественный регрессионный анализ, с помощью которого строится линейное аддитивное уравнение вида Z= а0 + aхУх + a2Y2 +...+ атУт + е для оценки значения внешнего критерия 2ио значениям исходных признаков Уь Уъ Ут. Коэффициенты в, (/ = 1, ... , т) выбираются таким образом, чтобы погрешность оценки е была по возможности минимальной [Мельников, Ямпольский, 1985].
Это уравнение, называемое уравнением регрессии, связывает внешний критерий с исходными признаками. Подставляя в правую часть уравнения индивидуальные значения признаков для каждого испытуемого, получают интегральную оценку измеряемого свойства для данного испытуемого. После этого вычисляется коэффициент множественной корреляции, который рассматривается как мера валидности совпадений оценок теста с оценками по внешнему критерию. Статистическая значимость коэффициента множественной корреляции проверяется с помощью критерия Фишера. Если гипотеза о значимости коэффициента множественной корреляции отклоняется, то разрабатываемый тест не может считаться валидным относительно выбранного внешнего критерия.
Квадрат коэффициента множественной корреляции, или коэффициент детерминации, показывает, какая часть дисперсии внешнего критерия может быть объяснена с помощью показателей теста, а какая часть остается необъясненной. Каждый тестовый признак вносит свой вклад в объясняемую часть дисперсии внешнего критерия, поэтому без большой ошибки из теста могут быть исключены все признаки, вносящие незначительный вклад в объясняемую часть дисперсии. В регрес-
Компьютерная психодиагностика
сионном анализе существуют специфические статистические методы отбора переменных, используя которые можно построить уравнение для вычисления интегрального показателя, включающего только наиболее значимые для оценки измеряемого свойства признаки.
Факторно-аналитический принцип конструирования тестов.В основе этого принципа лежит идея о том, что если несколько признаков, измеренных на группе индивидов, изменяются согласованно, то можно предположить существование одной общей причины этой совместной изменчивости - фактора как скрытой (латентной), непосредственно не доступной измерению переменной. Например, если в таблице связи (ТС) обнаруживается группа сильно коррелирующих признаков, то, возможно, это является следствием отражения признаками, вошедшими в группу, эмпирического фактора, соответствующего требуемому диагностическому конструкту.
Ве? Факторно-аналитическийпринципконструированиятестовпред-
} полагает наличие изменяющихся согласованно признаков.
В этомслучае^^^ ностируемой переменной в явном виде отсутствует, однако в неявном виде она должна присутствовать в экспериментальных данных. Такая информация закладывается на первом этапе конструирования психодиагностического теста, когда экспериментатор формирует исходное множество признаков, каждый из которых, по его мнению, должен отражатьопределенные аспекты тестируемого свойства. При этом большинство заданий «чернового» варианта теста должны согласованно «работать» на проявление тестируемого свойства. Внутренняя согласованность признаков означает статистическую направленность признаков на выражение общей, главной тенденции теста, то есть значимую корреляцию признаков с диагностируемым показателем.
Для построения интегрального показателя можно воспользоваться методами факторного анализа. В этом случае обобщенный показатель ищетсяввиделинейнойфункцииотрассматриваемыхпризнаковтеста:
F(Y) = а,У, + a2Y2+...+ атУт.
Коэффициенты я,Ц= 1,... , т) называются весами и подбираются таким образом, чтобы дисперсия значений интегрального показателя по всем испытуемым была максимальной. Полученный в этом случае интегральный показатель будет представлять собой так называемую первую главную компоненту, которая дает максимальный вклад в общую дисперсию.
Глава 1. Психометрическая парадигма конструирования тестов и шкал
Для повышения гомогенности факторного интегрального показателя его расчет ведется по следующей итерационной схеме. Вначале на основе собранного эмпирического материала методами факторного анализа строится интегральный показатель Р{ Y), обобщающий информацию, содержащуюся во всех заданиях теста. Если оказывается, что все признаки вошли в формулу для вычисления значения интегрального показателя с большими весами аь то на этом работа заканчивается. Однако так бывает редко. В большинстве случаев среди признаков теста присутствуют признаки с малыми весами, которые без ущерба могут быть отброшены. После сокращения исходного списка признаков делается повторный расчет для нового интегрального показателя. При этом может оказаться, что часть признаков опять будет иметь низкие нагрузки, так что потребуются дальнейшее сокращение и дополнительные расчеты.
Итогом такой работы будут список информативных признаков и формула для вычисления по этим признакам значения интегрального показателя (фактора). Эта формула позволяет произвести математически обоснованную замену множества отдельных оценок одной интегральной оценкой. Причем интегральные оценки получаются в цен-тронормированном виде, когда среднее арифметическое значение равно нулю, а дисперсия - единице.
Таким образом, факторно-аналитический и критериально-ключевой принципы конструирования тестов предполагают применение методов построения интегральных показателей, существенно различающихся между собой.
При использовании множественного регрессионного анализа обычно стремятся получить оптимальную оценку известного внешнего критерия. В противоположность этому при использовании факторного анализа пытаются построить новую, фиктивную переменную, влиянием которой объясняются основные изменения входящих в тест признаков. Поэтому регрессионная модель интегрального показателя представляет собой линейную комбинацию признаков теста, максимально коррелирующих с внешним критерием и минимально друг с другом, а факторная модель, наоборот, является линейной комбинацией признаков теста, максимально коррелирующих между собой. В связи с этим интегральный показатель, построенный методами регрессионного анализа, будет обладать высокой эмпирической валидностью и низкой гомогенностью, а построенный методами факторного анализа - высокой гомогенностью и конструктивной валидностью.
Однако факторно-аналитический и критериально-ключевой принципы конструирования тестов не следует противопоставлять друг дру-