Определение валидности

Соотношение валидности и надежности.

Проблема валидизации психологических тестов является центральной для дифференциальной психометрики. Ее решение зависит не от статистического аппарата, а от уровня развития теории дифференциальной психологии. Под валидностью (от англ. validity − обоснованность, состоятельность) понимается способность теста измерить именно ту характеристику, для оценки которой тест создан.

По словам А. Анастази: валидность − это понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает.

Отсюда валидность это комплексная характеристика методики (теста), включающая в себя сведения об области исследуемых явлений и репрезентативности диагностической процедуры по отношению к ним, о том, пригодна ли методика для измерения того, для чего она была создана, а также какова ее действенность, эффективность. Если надежность отражает устойчивость процедуры тестирования относительно объектов (испытуемых), то валидность касается прежде всего содержания тестовых заданий, характера связи теста и той реальностью, которую он должен измерить. Проблема валидности является наиболее актуальной именно для сложных свойств и способностей.

Вопрос 2

Валидность по содержанию.

По мнению Анастази, валидность по содержанию рассматривается по преимуществу для тестов достижений, предназначенных для измерения того, насколько испытуемый овладел конкретными навыками или учебными предметами, поэтому валидность по содержанию должна включать в себя систематическую проверку содержания теста для того, чтобы установить соответствие измеряемой области поведения. При проверке содержательной валидности возникает проблема соответствия заданий теста структуре деятельности, то есть навыкам, знаниям, необходимым для ее выполнения.

Чем сложнее деятельность, тем сложнее выдержать содержательную валидность.

Валидность по содержанию закладывается в тест при отборе тестовых заданий, то есть составлении так называемой спецификации теста, в которой указываются: область содержания (темы), задачи (процессы) обучения, а также относительные значения каждой темы и процесса. Валидность по содержанию крайне актуальна для критериально-ориентированных тестов. Кроме того, данный тип применим и к некоторым тестам, предназначенным для отбора и расстановки кадров. В личностных тестах и тестах способностей валидность по содержанию обычно не применяется.

Валидность по содержанию не следует смешивать с так называемой очевидной валидностью (по А. Анастази), которая не является валидностью с научной точки зрения и отражает субъективные соображения обследуемого относительно того, что с его точки зрения диагностирует тест.

Вопрос 3

Критериальная валидность теста –

Или валидность по критерию.

Валидность по критерию (синонимы - внешняя, эмпирическая валидность) отражает то, насколько по результатам теста можно судить об интересующих исследователя аспектах поведения в настоящее (диагностическая, текущая валидность) или будущее время (прогностическая валидность).

Существует 2 группы критериев: объективные и субъективные. Объективные критерии – это внешние по отношению к психологии критерии. Субъективные критерии − основаны на оценках экспертов из числа людей, хорошо знающих испытуемого (педагог, мастер и т. п.).

Модификации метода субъективных оценок: 1) индивидуальная оценка; 2)групповая оценка; 3) рейтинг; 4) метод ранжирования; 5) метод парных сравнений; 6) метод контрольных списков.

При использовании метода субъективных оценок следует учи­тывать ряд специфических особенностей:

− необходимо обеспечить одинаковое понимание экспертами терминов;

− эксперт должен достаточно хорошо знать оцениваемого;

− необходимо учитывать возможную пристрастность эксперта по отношению к оцениваемому (гало-эффект);

− необходимо учитывать индивидуальную стратегию оценивания, которую использует эксперт.

В процессе эмпирической валидизации теста исследователь фактически решает две задачи:

1) задачу измерения валидности;

2) задачу измерения практической эффективности своей психодиагностической программы.

Если между критерием и оценками по тесту испытуемый получил значимый коэффициент корреляции, можно сказать, что решены обе задачи.

Если же корреляции не обнаружено, то психолог оказывается перед дилеммой: либо невалидна сама процедура измерения психического свойства, либо неверна гипотеза о наличии причинно-следственной связи между психическим свойством и социальнозначимым показателем.

На практике достаточно часто имеет место подмена прогностической валидности диагностической (или текущей). Помимо этого, прогностическая валидность всегда должна соотноситься с определенными временными рамками, а они, как правило, являются достаточно узкими.

Вопрос 4

Наши рекомендации