Процентное соотношение респондентов в дихотомических переменных
Представим, что был разработан самооценочный опросник, направленный на измерение депрессии. Представим также, что конвергентная валидность опросника оценивается путем сопоставления результатов с диагнозами, поставленными квалифицированными клиническими психологами. Набирается группа респондентов, которые заполняют опросник и проходят собеседование у клинического психолога. Психологи ставят диагноз каждому из участников, относя его либо к депрессивным, либо к здоровым. Таким образом, валидизируемый тест дает баллы в непрерывной числовой шкале (шкале интервалов или шкале отношений), а критериальная переменная (т.е. диагноз) – в качественной, дихотомической. О высокой валидности разработанного теста можно было бы говорить, если бы баллы по этому тесту сильно коррелировали с диагнозами клинических психологов.
На величину корреляционной взаимосвязи между результатами опросника и диагнозами клинических психологов оказывает влияние процентная доля респондентов, которым диагностировали депрессию. Рассмотрим эту зависимость. При вычислении данного коэффициента корреляции каждый из респондентов должен иметь баллы по двум переменным - результаты опросника на выявление депрессии и диагноз. В Таблице 9.5 для этого примера приведены гипотетические эмпирические данные. Очевидно, результаты опросника на выявление депрессии уже измеряются в количественной шкале (допустим размах данных от 0 до 30). Что касается категории диагноза, для вычисления коэффициента валидности эту переменную сперва необходимо выразить в количественной форме. Для этого всем респондентам, которые были диагностированы как здоровые, приписывается одно числовое значение, а всем респондентам, которые были диагностированы как депрессивные, приписывается другое числовое значение. Это могут быть значения 1 и 2, 1 и 10, -1000 и +1000, либо же любая другая пара чисел (важно только, чтобы всем респондентам из одной группы было приписано одно и то же число). В данном примере закодируем «недепрессивную» группу числом 1, а депрессивную – числом 2 (см. Таблицу 9.5).
Таблица 9.5. Данные, демонстрирующие влияние процентного соотношения респондентов в дихотомических переменных на коэффициенты валидности
Респондент | Балл по опроснику депрессии | Диагноз | Код диагноза |
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Здоров | |||
Депрессия | |||
Депрессия | |||
Депрессия | |||
Депрессия | |||
Депрессия | |||
Среднее | 7.0 | 0.25 | |
Стандартное отклонение | 3.39 | 0.43 | |
Ковариация | 0.75 | ||
Корреляция | 0.51 |
В одной из предыдущих глав говорилось, что корреляция между двумя переменными – это их ковариация, деленная на произведение двух стандартных отклонений. Корреляция между непрерывной переменной и дихотомической переменной (rCD) составляет:
, (9.2)
где СCD - ковариация между двумя переменными, sC - стандартное отклонение непрерывной переменной, а sD - стандартное отклонение дихотомической переменной.
В данной формуле два значения напрямую зависят от процентного соотношения количества наблюдений в двух группах, определяемых дихотомической переменной. Если группы закодированы числами 1 (группа 1) и 2 (группа 2), тогда ковариация равна
, (9.3)
где p1– процент испытуемых, попавших в группу 1, p2- процент испытуемых, попавших в группу 2, С1 – среднее значение непрерывной переменной для испытуемых в группе 1, а С2 – среднее значение непрерывной переменной для испытуемых в группе 2. Согласно рассматриваемому гипотетическому набору данных, 15 из 20 респондентов принадлежат к группе здоровых (группа 1), а 5 - к группе депрессивных (группа 2). Следовательно, соответствующие пропорции составляют0.75 (15/20=0.75) и 0.25 (5/20=0.25). Кроме того, средний балл по результатам опросника на выявление депрессии в группе «здоровых» составил 6, а в группе «депрессивных» - 10. Таким образом, искомая ковариация равна
СCD = (0.75) (0.25) (10 - 6),
СCD = (0.1875) (4),
СCD = 0.75.
Стандартное отклонение дихотомической переменной - второе значение, зависящее от соотношения респондентов в двух группах, определяемых дихотомической переменной. Если группы закодированы числами 1 (группа 1) и 2 (группа 2), тогда это значение равно
. (9.4)
По данным таблицы 9.5 стандартное отклонение дихотомической переменной (диагноз) равно
,
Принимая во внимание эти данные, можно переписать и упростить уравнение корреляции так, что влияние процентного соотношения респондентов в двух группах станет более очевидным:
, (9.5)
.
Например, для данных, указанных в таблице 9.5, коэффициент корреляции составляет
,
,
.
Данная корреляция положительна и довольно значительна по абсолютной величине. Она свидетельствует о том, что испытуемые, получившие относительно «высокий балл» по переменной «диагноз», набирают более высокие баллы и по итогам опросника депрессивности. Вспомним, что дихотомическая переменная «диагноз» была закодирована таким образом, что респондентам с диагнозом «депрессивный» приписывался более высокий балл (т.е. 2), чем респондентам с диагнозом «здоровый». Следовательно, полученный коэффициент корреляции можно интерпретировать таким образом, что респонденты с диагнозом «депрессивный» (т.е. имеющие относительно высокие баллы по дихотомической переменной) имеют тенденцию набирать более высокие баллы по итогам разработанного опросника депрессивности, чем респонденты из категории недепрессивных (т.е. имеющие относительно низкий результат по дихотомической переменной).
Уравнение 9.5 показывает, каким образом процентное соотношение количества респондентов в двух группах влияет на коэффициент корреляции, отражающий конвергентную или дивергентную валидность теста. При прочих равных условиях группы с одинаковым количеством человек приведут к получению более высоких коэффициентов корреляции, нежели неравные группы. В случае, если обе группы равны по количеству респондентов, их процентное соотношение составит 0.5 и 0.5. Произведение этих двух пропорций (0.5*0.5 = 0.25) является максимально возможным числом в этой формуле. Другими словами, произведение любой другой пары пропорций будет меньше 0.25, и чем больше рассогласование в количестве респондентов в двух группах, тем это произведение меньше (например: 0.40*0.60 = 0.24; 0.10*0.90 = 0.09). При прочих равных условиях более низкие произведения данных двух пропорций будут приводить к получению более низких коэффициентов корреляции.
Итак, еще одним фактором, который может оказывать влияние на некоторые коэффициенты валидности, является количественное соотношение респондентов в двух исследуемых группах. Если коэффициент валидности основан на корреляции между непрерывной переменной и дихотомической переменной, то любая диспропорция размеров групп может снизить итоговый показатель валидности. При интерпретации коэффициентов валидности исследователю следует помнить об этой закономерности.
Дисперсия метода
Дисперсия (вариативность) метода обсуждалась несколько ранее в разделе, посвященном матрицам множественных методов и признаков (МММП). К этому обсуждению мало что можно добавить, однако следует понимать, что вариативность метода имеет значение не только в рамках анализа МММП. Каждый раз, когда исследователь коррелирует баллы валидизируемого теста и баллы другого теста, использующего другой способ измерения, вариативность метода снижает коэффициент корреляции. Точнее говоря, корреляция между двумя разными методами измерения конструкта окажется меньше с большей вероятностью, чем корреляция между двумя тестами, использующими один и тот же метод измерения.
Данное соображение весьма важно для оценки коэффициентов валидности. Производя оценку коэффициентов валидности, исследователь придает большее значение корреляциям между разными методами оценки, нежели между сходными. Например, оценивая новый опросник социальной компетентности, исследователь мог бы скоррелировать его результаты с баллами по самооценочному опроснику экстраверсии. С радостью обнаружив, что коэффициент корреляции составляет 0.40, исследователь мог бы сделать вывод о том, что опросник обладает высокой конвергентной валидностью. В самом деле, данный результат показывает, что респонденты, обладающие (согласно результатам по новому опроснику) высокой социальной компетентностью, обладают, как правило, высокой степенью экстравертированности. Тем не менее, исследователь был бы еще более уверен в результатах валидизации, если бы он обнаружил корреляцию размером 0.40 между самооценочным опросником социальной компетентности и экспертным опросником экстраверсии, заполняемом близкими знакомыми респондента. Результат оказался бы более убедительным, если бы можно было сказать, что люди с высокими показателями социальной компетентности, как правило, описываются своими знакомыми как экстраверты.
Исследования валидности, основанные лишь на методиках самоотчета, информативны и весьма распространены, однако не совершенны. Получение данных самоотчета является относительно простым, недорогим и в целом весьма надежным методом, поэтому мы не считаем, что данные самоотчета хуже данных, полученных другими методами. Тем не менее, корреляции, основанные лишь на процедурах самоотчета, могут оказаться завышенными из-за общей дисперсии метода. С другой стороны, вероятность искусственного завышения корреляций, основанных на данных, полученных различными методами, меньше. Поэтому другие способы измерения психологического конструкта являются существенным дополнением к данным самоотчета. Интерпретируя корреляции, основанные на различных методах измерения, важно понимать, что они могут оказаться меньше, чем корреляции, основанные лишь на методе самоотчета. Это обусловлено меньшей степенью общности дисперсии метода.
Время
Как уже говорилось, конструктная валидность иногда оценивается путем исследования корреляции между каким-либо тестом, который предлагается в один момент времени (напр., тест академических способностей SAT), и критериальной переменной, значение которой определяется в более поздний момент времени (напр., подсчет среднего балла успеваемости студента, GPA). При прочих равных условиях коэффициенты валидности, основанные на корреляциях между переменными, значение которых измеряется в разные моменты времени (то есть корреляциях, отражающих прогностическую валидность теста) могут оказаться меньше, чем коэффициенты, основанные на корреляциях между переменными, значение которых измеряется в один момент времени (то есть корреляциях, отражающих текущую (конкуррентную) валидность). Более того, существует вероятность, что увеличение промежутка между двумя моментами времени в результате приведет к получению более низкого коэффициента прогностической валидности.