Тема 1.2. Психометрические основы психодиагностики. Проблемы этики в психодиагностике. Этический кодекс психодиагноста
Общие положения о психометрики.
Первые исследования проведения качественного обследования психометрики связаны с именем Ч. Спирмена (ученик Ф. Гальтона).
Психометрика – область психодиагностики, которая изучает особенности научного обоснования, создания и исследования психологических методов измерения психических свойств и проверку их надёжности. Это математизированная технология создания стандартизированных, измерительных, психодиагностических методик, т.е. обосновывает требования, которым должны удовлетворять эти методики.
Цель психометрики – обеспечить качественные результаты: повышение качества методики и качества процедуры обследования, т.е. решает 2 вопроса: чем и как проводить обследование.
Задачи психометрики:
- создание новых методик, обоснование требований к методикам;
- разработка процедуры применения методики;
- обоснование требований предъявляемых к психодиагносту.
Качественная методика достигается при соблюдении условий:
надёжность, валидность, достоверность, дискриминативность.
Качественная процедура диагностического обследования достигается при соблюдении условий: репрезентативность выборки, стандартизация процедуры, нормативность данных.
Показатели качества психодиагностических методик.
1. Надёжность – отражает точность, относительное постоянство диагностических измерений и устойчивость при первичном и повторном его применении на одних и тех же испытуемых. Результаты д.б. устойчивы к действиям случайных факторов.
Выделяют факторы:
· Разнообразные внешние условия (освещённость, время суток, температура). Важно соблюдать единообразия проведения обследования: например, если первое тестирование проводилось утром, то и повторное д.б. утром; если 1-ый опыт сопровождался предварительным показом заданий, то и при 2-ом испытании это условие д.б. соблюдено.
· Внутренние факторы (утомляемость, недомогание, сонливость...)
· Информационно-социальные обстоятельства (опыт, личность).
Методика будет эффективна, когда результаты не будут зависеть от этих факторов.
Надёжность в отношении времени является выражением того, что метод является независимым от случайных колебаний во времени.
Под достоверностью понимаем вероятность совпадения результатов при повторном измерении у одних и тех же испытуемых, когда второе обследование непосредственно следует за первым.
Стабильность метода обозначает, что результаты одних и тех же испытуемых не меняются значительно даже при повторном обследовании после длительного времени (приблизительно спустя 8 недель – 3 месяца, но не более 6 мес.). Однако нельзя рассчитывать на абсолютную стабильность психологических признаков. Колебания исследуемого признака не должны быть резкими.
Для проверки стабильности диагностируемого признака используется тест- ретест, который заключается в повторном обследовании испытуемых с помощью той же методики. О стабильности признака судят по коэффициенту корреляции между результатами первого и второго обследования.
Надёжность в отношении заданийговорит о том, насколько каждое задание (вопрос, задача) метода вносят вклад в изучение данной характеристики. Имеется в виду, что метод настолько хорош, насколько качественными являются элементы, из которых он состоит. Различают 2 формы: эквивалентность и согласованность.
Эквивалентностьобозначает, что метод существует в двух или нескольких вариантах, которые взаимозаменяемы. Согласованностьявляется существенным свойством каждого метода, предназначенного для выявления одной характеристики личности.
Надёжность субъективных оценок–это степень согласия между разными экспериментаторами при оценке результатов одного метода или при оценивании тех же испытуемых. Гетерогенностьопределяет, насколько метод применим для разных групп испытуемых, которые различаются по возрасту, образованию, профессии, национальности и т.п.
2. Валидность – выражает практическую полезность теста, его диагностическую прогностическую силу и возможность его использования в определённых целях. Это комплексная характеристика, включающая, с одной стороны, сведения о том, пригодна ли методика для измерения того, для чего она была создана, а с другой стороны, какова ее действенность, эффективность, практическая полезность. Анастази: «Валидность теста – понятие, указывающее нам, что тест измеряет и насколько хорошо он это делает». Т.е. это способность методики измерить именно те характеристики, которые нужно измерить. Проверка валидности методики называется валидизацией.
Подлинная валидность отражает отношения между результатами метода и тем, что с помощью метода изучалось.
В ложной валидности зафиксирована видимость ценности метода основанная на опыте, на убеждении, которые исходят из необоснованного убеждения, что данный метод является хорошим, потому, что хорошей является теория, на которой он построен. Часто такое убеждение усиливается по мере овладения методом, без исследования его реальной валидности. Валидность, основанная на желании, предполагает участие предубеждений исследователя относительно возможностей метода.
С точки зрения подлинной валидности можно говорить о следующих типах валидности: содержательная, конструктная, текущая, прогностическая.
Содержательная – выражает соответствие между тестом и исследуемой характеристикой. Включение таких заданий исходит из знаний автора, отзывов специалистов о предполагаемых явлениях. Например, включение в опросник вопросов, о которых предполагаем, что они направлены на проявление интровертированного поведения.
Прогностическая валидность – выражает соответствие между результатами теста и критерием спустя определённое время. Например, при исследовании доминантности мы следим за поведением и сопоставляем его с результатами тестирования.
Валидизация теста – это поиск ответа на вопрос, измеряет ли данная методика то, что, по замыслу автора, она должна измерять, и насколько точно она это делает.
Способы проверки валидности:
1. сравнение результатов, полученных с помощью данной методики, с методикой, которая уже прошла проверку;
2. использование экспертных оценок (оценивается содержательная валидность);
3. использование объективных показателей (оценивается прогностическая валидность).
Для расчета валидности испытуемых не д.б. меньше 50, лучше всего более 200.
3. Достоверность – психометрическое свойство теста, обеспечивающее защиту его результатов от сознательных фальсификаций или непреднамеренных мотивационных искажений. Обеспечивается с помощью шкалы лжи или коррекционной шкалы. Она состоит из вопросов, касающихся незначительных поступков, которые, как правило, совершают большинство людей. Используется в личностных опросниках.
Критерий объективности применительно к психологическим тестам имеет три значения. Два из них являются общими для всех психологических тестов. Это, во-первых, стандартность условий тестирования по отношении ко всем испытуемым. Во-вторых, строгая регламентация процедуры оценивания, обусловливающая выставление одной и той же оценки за данный результат любым количествам оценщиков. Третье значение – специфическое для личностных тестов – заключается в обеспечении независимости результатов теста от возможных попыток их сознательного искажения испытуемым.
4. Дискриминативность – способность методики дифференцировать испытуемых относительно максимального и минимального результатов. Это способность методики разделить на группы испытуемых. Оптимальный вариант – 5-7 групп.
5. Репрезентативность. Репрезентативная выборка – это выборка, которая представляет все характеристики генеральной совокупности по всем показателям. Выборка должна быть достаточно большой: мин. – 25 человек, статистические данные получают при выборке мин 200- 250 человек. Ошибки репрезентативности появляются тогда, когда характеристики выборки и генеральной совокупности не совпадают по каким-то параметрам (систематические или случайные ошибки). Систематические ошибки возникают, когда неправильно построена выборка, случайные – определяются вероятностью.
Стандартизация методики предполагает строгие правила работы с методикой, единые требования к инструкции, к способам регистрации результатов, к условиям проведения обследования.
- стандартизация результатов – чтобы сравнить результаты разных методик: перевод сырых баллов в стандартную шкалу. Распространённые шкалы: Z – шкала Линерта, SN – шкала школьных оценок, Т – шкала (100-бальная), шкала IQ. Или Векслера (200 бальная). Z – шкала с центром, равным 0.
Данные – множество определённых показателей из чётко определённой выборки. У каждой выборки свои нормативные данные (по полу, возрасту, профессии).
Нормативное оценивание – подход к оценке и интерпретации измеряемых тестом показателей, отражающих особенности личности и поведения, путем сравнения индивидуальных результатов со статистическими значениями нормативной выборки.
Специфика психодиагностических процедур по сравнению с обычными физическими измерениями заключается в том, что здесь сама процедура измерения взаимодействует с «объектом» измерения. В физических измерениях объект в значительных пределах пассивен и не влияет со своей стороны на физический прибор. Человек, напротив, всегда активен и может применять такую тактику, которую психодиагност при разработке методики вовсе не предусматривал.
Строгое следование требованиям психометрики особенно необходимо при переносе тестов, разработанных за рубежом. В условиях недостаточной разработки отечественных методик многие психологи склонны рассматривать в качестве готовых зарубежные методики. Тогда как реальные языковые и социокультурные различия бывают столь сильны, что полная эмпирическая адаптация зарубежных методик по своему объёму не уступает разработке оригинальной методики. Это относится к шкалам ценностных ориентаций, к характерологическим опросникам и другим личностным тестам. Для того чтобы убедиться в пригодности того или иного зарубежного теста, психолог должен уметь повторить процедуру, с помощью которой конструировался и обосновывался этот тест его авторами. Если при конструировании многомерного теста использовался факторный анализ, то нельзя считать адаптированным тест без повторного факторного анализа.