Понятия стандартизации, надежности и валидности методик.
Стандартизация– это единообразие процедуры проведения и оценки исполнения теста. Таким образом, стандартизация рассматривается в двух планах: как выработка единых требований к процедуре диагностирования и как определение единого критерия оценки результатов диагностики.
Стандартизация диагностической процедуры подразумевает унификацию инструкций, бланков обследования, способов регистрации результатов, условий проведения обследования.
К числу требований, которые необходимо соблюдать при проведении диагностики, можно, например, отнести такие:
· инструкции следует сообщать испытуемым так, как говорится в используемом тесте.
· не следует давать отдельным испытуемым дополнительные пояснения;
· необходимо соблюдать временные ограничения, если это указано в инструкции к тесту.
Обычно авторы диагностической методики в руководстве приводят точные и подробные указания по процедуре ее проведения. Формулирование таких указаний составляет основную часть стандартизации новой методики, так как только строгое их соблюдение дает возможность сравнить между собой показатели, полученные разными испытуемыми.
Другим важным этапом в стандартизации методики является выбор критерия, по которому следует проводить сравнение результатов диагностических испытаний, поскольку диагностические методики не имеют заранее определенных стандартов успешности или неудачи в их выполнении. Так, например, ребенок шести лет, выполняя тест умственного развития, получил балл, равный 117. Как это понимать? Количественный результат как таковой ничего не означает. Полученный дошкольником балл нельзя интерпретировать как показатель относительно высокого, среднего или низкого развития, так как это развитие выражено в единицах измерения, присущих данной методике, и, таким образом, абсолютного значения полученные результаты иметь не могут. Очевидно, нужно располагать точкой отсчета и какими-то строго определенными мерами, чтобы с их помощью оценивать полученные при диагностировании индивидуальные и групповые данные. Возникает вопрос, что за эту точку отсчета брать? В традиционном тестировании такая точка добывается статистическим путем — это так называемая статистическая норма.
В общих чертах стандартизация диагностической методики, ориентированной на норму, осуществляется путем проведения этой методики на большой группе испытуемых, для диагностирования которых она предназначена. Относительно этой группы испытуемых, называемой выборкой стандартизации, вырабатываются нормы, указывающие не только средний уровень выполнения, но и его относительную вариативность выше и ниже среднего уровня. В результате можно оценить разные степени успешности или неуспешности в выполнении диагностической пробы. Это позволяет определить положение конкретного испытуемого относительно нормативной выборки или выборки стандартизации (А. Анастази, 1982).
Вернемся к результату, полученному ребенком шести лет, о котором упоминалось выше. Его успешность по тесту равна 117 баллов. Этот результат выше нормы, но очень незначительно (верхняя граница нормы по данному тесту 116 баллов).
Если процедура стандартизации к конкретной диагностической методике не применялась, обработка результатов возможна только качественная.
Диагностические методики разрабатывают специалисты, процедуры стандартизации очень сложны, к тому же они должны также соответствовать требованиям надежности и валидности.
Обоснуйте, почему при диагностировании детей, родителей, педагогов необходимо применять именно стандартизированные методики? Как Вы определите, стандартизирована ли выбранная Вами диагностическая методика?
Прежде чем психодиагностические методики могут быть использованы для практических целей, они должны пройти проверку по ряду формальных критериев, доказывающих их высокое качество и эффективность. Эти требования в психодиагностике складывались годами в процессе работы над тестами и над их совершенствованием. В результате появилась возможность оградить психологию от всевозможных безграмотных подделок, претендующих на то, чтобы называться диагностическими методиками.
К числу основных критериев оценки психодиагностических методик относится надежность и валидность.
В традиционной тестологии термин «надежность» означает относительное постоянство, устойчивость, согласованность результатов теста при первичном и повторном его применении на одних и тех же испытуемых. Как пишет А. Анастази (1982), вряд ли можно с доверием относиться к тесту интеллекта, если по нему в начале недели ребенок имел показатель, равный 110, а к концу 80. Повторное применение надежных методик дает сходные оценки. Конечно, при повторении опыта возможны некоторые расхождения, но важно, чтобы они были незначительными. Таким образом, можно сказать, что надежность методики – это такой критерий, который говорит о точности психологических измерений, т.е. позволяет судить о том, насколько внушают доверие полученные результаты.
Каким образом Вы самостоятельно можете проверить диагностическую методику на надежность?
Другим после надежности ключевым критерием оценки качества является валидность.
А. Анастази: «Валидность теста — понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает» (1982) – это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность.
Валидность – соответствие теста измеряемому психическому свойству, что доказывается в руководстве к методике.
Некоторые виды валидности:
· содержательная – по мнению специалистов-психологов;
· эмпирическая (критериальная) – прогностическая – высчитывается коэффициент соответствия (корреляции) между прогнозируемым (по применяемому тесту) и реальным поведением или результатом по классическому тесту.
· концептуальная – доказывает правильность теоретических постулатов, положенных в основу диагностической методики.