Понятие надежности, валидности, репрезентативности и достоверности тестов
Репрезентативность: соответствие характеристик выборки характеристикам популяции или генеральной совокупности в целом.( Геренральная савокпность -
совокупность всех объектов (единиц), относительно которых учёный намерен делать выводы при изучении конкретной проблемы. Генеральная совокупность
состоит из всех объектов, которые подлежат изучению). Репрезентативность определяет, насколько возможно обобщать результаты исследования с привлечением
определенной выборки на всю генеральную совокупность, из которой она была собрана. Также, репрезентативность можно определить как свойство выборочной
совокупности представлять параметры генеральной совокупности, значимые с точки зрения задач исследования. Достоверность: Особая разновидность валидности. Речь идет о сознательных или бессознательных искажениях, которые вносит в тестовые результаты сам
испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении. Способность теста защищать
информацию от МОТИВАЦИОННЫХ ИСКАЖЕНИЙ и есть достоверность теста. Типичный прием обеспечения достоверности наличие в тест-опросниках ШКАЛ ЛЖИ. Эти шкалы основываются главным образом на феномене СОЦИАЛЬНОЙ ЖЕЛАТЕЛЬНОСТИ стремлении испытуемых давать в ходе тестирования социально
одобряемую информацию.
Надежность теста в статистическом смысле постоянство, устойчивость результатов, получаемых с его помощью. Н. т. определяется путем установления
корреляций между результатами первого и повторного использования теста (коэффициент Н. т.) или сопоставления данных, полученных при проведении теста, с
результатами применения эквивалентного теста. Надёжностью называется один из критериев качества теста, его устойчивость по отношению к погрешностям
измерения. Виды надежности: 1. Надежность измерительного инструмента. Стабильность измеряемого св-ва зависит от однородности методики. Однородность
то насколько задания в методике направлены на изучение заданного признака или св-ва. 2. Определение стабильности изучаемого признака. Настолько данная
методика может применяться повторно. 3. Определение константности. Константность относительно независимости рез-тов от личности эксперементатора. Соответствие теста измеряемому психическому свойству называется Валидностью теста. Понятие В включ. В себя 2 хар-ки: 1. Пригодност методики для измерения того, для чего она была создана. 2. Действенность и эффективность самой методики. Виды валидности: 1. Теоретическая В. Необходимо определить что методика измеряет заданной св-во. Опред. отношение между псих. явлениями, св-вами и показательяи при помщи которых их мождно изучить. 2. Прагаматическая В. Направлена на то, что бы доказать что то, что измерят методика имеет связь с опред. областями практики.
-критерий исполнения: кол-во выполн.работ, успеваемость, время
-cубъективный критреий: различ виды ответов кот отраж отноше человека к чему либо. получ при помощи интервью, анкет, опросников.
-физиолог.критерий: использ.при изучении влияния окр среды и др ситуациооных перемнных на писихику человека.
-критерий случайности: когда цель исследования касается отбор лиц, имеющих опрел.личностиные особенности
Надежность - одно из трех главных психометрических свойств любой измерительной психодиагностической методики (теста). Надежность - это помехоустойчивость теста, независимость его результатов от действия всевозможных случайных факторов. К числу таких факторов следует отнести:
разнообразие внешних материальных условий тестирования, меняющихся от одного испытуемого к другому (время суток, освещенность, температура в помещении, наличие посторонних звуков, отвлекающих внимание и т.п.);
динамичные внутренние факторы, по-разному действующие на разных испытуемых в ходе тестирования (время так называемой “вырабатываемости” - выхода на стабильные показатели темпа и точности действий после начала тестирования, скорость утомления и т.п.);
информационно-социальные обстоятельства (различная динамика в установлении контакта с психологом или лаборантом, проводящим тестирование; возможное наличие других людей в помещении; наличие предыдущего опыта знакомства с данным тестом; наличие какого-то знания и отношения к тестам и т.п.).
Валидность - это степень, в которой тест является инструментом, измеряющим то, для чего он предназначен.
Валидность теста
Соответствие теста измеряемому психическому свойству называется валидностью теста. Это, без преувеличения, важнейшее психометрическое свойство теста. Если высокая надежность теста говорит нам о том, что тест действительно “что-то” измеряет, то высокая валидность указывает на то, что тест измеряет именно то, что мы хотим. Конечно, на валидность теста также негативно влияют случайные факторы. Поэтому в психометрике принято следующее основное психометрическое неравенство:
ВАЛИДНОСТЬ< НАДЕЖНОСТЬ,
что означает, что валидность не может превышать надежности теста.
Но в отличие от надежности, помимо случайных факторов, на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты. Эти факторы есть другие психические свойства, которые мешают проявиться в результатах теста тому свойству, на которое тест направлен.
Любые тестовые заключения при использовании статистических тестовых норм являются относительными. Они зависят от той выборки, на которой производилась стандартизация теста. То, насколько выборка стандартизации позволяет применять тест на широкой популяции, называется РЕПРЕЗЕНТАТИВНОСТЬЮ тестовых норм.
Достоверность теста
Особой разновидностью валидности является достоверность, которая не всегда выделяется в учебниках по психодиагностике, хотя требует специальных усилий и процедур по обеспечению. Речь идет о сознательных или бессознательных искажениях, которые вносит в тестовые результаты сам испытуемый, руководствуясь в ходе теста особой мотивацией, отличающейся от той, которая присуща ему в реальном поведении. Способность теста защищать информацию от мотивационных искажений и есть достоверность теста. Особенно остро проблема достоверности стоит в случае тест-опросников, которые допускают больше свободы в выборе испытуемым любого варианта ответа.
Типичный прием обеспечения достоверности - наличие в тест-опросниках ШКАЛ ЛЖИ. Эти шкалы основываются главным образом на феномене социальной желательности - стремлении испытуемых давать в ходе тестирования социально одобряемую информацию.
Если испытуемый набрал по шкале лжи балл выше критического, то его протокол объявляется недостоверным и ему предлагается либо выполнить данный тест еще раз более откровенно, либо выполнить другой тест. Многие более специфичные “ловушки”, направленные на измерение достоверности, часто входят как компонент в структуру конкретного теста, а иногда даже не подлежат разглашению как элемент “ноу-хау” (информационного изобретения) и профессиональной тайны, разделяемой разработчиками только с лицензированными пользователями методики, подписавшими особое лицензированное соглашение при приобретении теста.
Достоверность тестирования тесно связана со степенью доверительности общения, которую психолог смог установить с данным испытуемым.