Глава 1. история и методология психодиагностического исследования
Носс И.Н.
Введение в технологию психодиагностики. — М.: Изд-во Института Психотерапии, 2003. -- 251 с.
Эта книга представляет собой пособие для студентов и начинающих психологов. Она знакомит с основами методологии и технологии психодиагностики — одного из основных инструментов комплексного психологического исследования личности. В ней излагаются основные вехи истории психодиагностики, дается представление о ее предмете и особенностях использования тестовых методик, рассматривается проблема достоверности тестовых измерений в психологии, приводится классификация тестов и методик, обсуждаются этические требования к психологам, занимающимся диагностикой. Практическая работа проиллюстрирована на реальном примере профессиональной психологической диагностики конкретного специалиста и межличностных отношений в группе. Отдельная глава посвящена проблемам компьютерной психодиагностики.
В результате изучения курса психодиагностики психолог должен не просто усвоить приемы использования отдельных методик и тестов, а научиться конструированию метода психологического исследования, системы знаний, умений и навыков понимания других людей.
ISBN 5-89939-084-5
© Носс И. Н., 2002
© Изд-во Института Психотерапии, 2002
Моему учителю и наставнику, профессору
Съедину Сергею Ивановичу посвящается
ВВЕДЕНИЕ
Представления о психодиагностике в настоящее время складываются на основе суждений по поводу тестов. Мода на тестирование, завладевшая умами психологов, иногда приравнивает психодиагностическую процедуру к тестологическому ритуалу.
Если под диагностикой в психологии понимать собственно исследование какого-либо психологического феномена, то диагностическая оценка представляет собой сложную систему всестороннего изучения личности. В ее рамках тестам должна отводиться роль отправной точки, объективной базы, на основе которой строится психологическая диагностика. Подмена психодиагностики тестированием, на наш взгляд, является большой ошибкой.
Основной специфически психологический предмет психодиагностики — измерение психологических особенностей в сопоставлении с нормативными, критериальными или ипсативными показателями. Психолог, оценивая личностные особенности человека, «входит» в индивидуальный образ испытуемого. Тестовые методы дают ему некий «объективный» образ-норматив. Наблюдение, проводимое как во время тестирования, так и в ходе всей диагностической процедуры, формирует субъективное представление. Беседа по итогам изучения документов, фактов биографии, тестирования и др. помогает сопоставить тестовые данные и другую информацию и построить некое представление об изучаемом индивиде. И, наконец, герменевтический анализ структурирует вывод о психологических особенностях испытуемого.
Таким образом, целью психологической науки является исследование психики индивида. А задача психодиагностики очень проста и в то же время неимоверно сложна — сделать это изучение адекватным. Психодиагностика — это создание инструмента, метода психологического исследования, его процессуальный аспект.
В результате изучения курса психодиагностики психолог должен усвоить знания, умения и навыки понимания других людей посредством психологических методов. Он должен представлять, что диагностическая процедура состоит из формально-количественной и детально-качественной оценки испытуемых, а количественные показатели интерпретируются как в сопоставлении друг с другом, так и в глубинной увязке с качественным исследованием, основанным на чувстве, интуиции и опыте психолога.
В ходе преподавания психодиагностики как учебной дисциплины сложилось расхожее мнение, что она представляет собой процесс изучения тестов. Безусловно, тестологическая процедура занимает значительное место в ее содержании. Но центральная позиция все же должна быть отдана конструированию метода, технологии психологического исследования, а не приемам использования отдельных методик и тестов.
Можно привести множество примеров, когда так называемые практические психологи используют в своей работе набор методик и тестов, связанных между собой лишь в воображении экспериментатора. К сожалению, этого недостаточно. Различные психологические инструменты должны быть согласованы не только интуитивно-чувственно, не только теоретически, но и процессуально, и статистически, и организационно. Прослеживается значимая связь знаний основ математической статистики, принципов соблюдения достоверности психологических измерений, профессионально-этических норм деятельности психологов и опыта их практической работы в области реальной психодиагностики.
Вряд ли начинающий практический психолог ринется в омут разработки новых, оригинальных методик и тестов. Для этого требуется много времени и значительные объемы экспериментальных выборок*. Поэтому наша задача заключается прежде всего в ознакомлении студентов и начинающих психологов с методологией и технологией конструирования тестовых «батарей», научении адекватно интерпретировать не отдельные тесты (хотя мы описываем и процедуру разработки некоторых психодиагностических методик), а результаты исследований, полученные при помощи тестовых комплексов, связанных в единую методику. Вот основная цель данного пособия.
* См. Анастази А., Урбина С. Психологическое тестирование. — СПб.: Питер, 2001. - С. 303.
Глава 1 посвящена истории психодиагностики и обсуждению ее специфически психологического предмета. В ней приводятся исторические этапы развития так называемых донаучных психодиагностических традиций, тестологии и психотехники. История психодиагностики представлена здесь в виде этюдов о зарубежной и российской психологии. Психологическая наука и ее методы развивалась не равномерно. Великие потрясения в социальной жизни человечества отражались и в истории психодиагностики. Видные экспериментаторы порой сами являлись тормозом ее развития. Только в России психология дважды оказывалась «вне закона» — в середине XIX и первой трети XX века. После известного решения 1850 года о прекращении преподавания философии и психологии в университетах «...ввиду предосудительного развития этой науки современными германскими учеными (левыми гегельянцами) и передачи чтения логики и опытной психологии профессорам богословия...»* только в 1863 году были восстановлены кафедры философии, на которых читался курс психологии. Исследования М.М. Троицкого («Немецкая психология в текущем столетии») и К.Д. Кавелина («Задачи психологии», 1872) положили начало дальнейшему развитию психологических изысканий в России. Печально известна также взаимосвязь между государственной политикой Советского Союза в 20-30-е годы XX столетия и крушением отечественных психотехнических достижений.
* Ивановский В.Н. Очерк о жизни и деятельности Н.Я. Грота //Вопросы философии и психологии. Т. 51(1), 1900.
Все это накладывает яркий отпечаток и на современную психодиагностику. Мы недостаточно хорошо знаем своих отечественных исследователей. И поистине прав был А. А. Леонтьев, утверждая, что истоки некоторых психологических теорий «по существу остаются не проанализированными»*. Это в полной мере относится и к психодиагностике.
* Леонтьев А.А. Ключевые идеи Л.С. Выготского — вклад в мировую психологию XX столетия // Психологический журнал. — 2001. — Т. 22. — № 4.— С. 10.
О предмете психологической диагностики в научно-практической литературе ведется долгий и особый разговор. Можно ли в полной мере отнести ее к психологической науке или это часть эпистемологии? Хочется думать, что психодиагностические изыскания как вид эксперимента являются областью именно психологической эпистемологии.
В данной главе приведено несколько наиболее популярных классификаций методических средств психологической оценки. Упорядочение методик и тестов по различным основаниям дает возможность психологам оптимизировать поиск инструментария для своих исследований.
Глава 2 посвящена психометрическим аспектам разработки, адаптации и использования методик. Здесь даны понятия об измерении в психологии. Выделены проблемы использования конкретных статистических процедур в процессе анализа эмпирических данных. На реальных примерах показаны пункты применения мер центральной тенденции, мер изменчивости, мер связи и статистического вывода. Обсуждаются два подхода к анализу распределения переменных, а также принципы и методы стандартизации «сырых» тестовых баллов.
В начале главы 3 помещена так называемая технологическая классификация тестов и методик. Особое место отводится нормативно-этическим требованиям к психологам, занимающимся диагностикой. Исследуется и обсуждается проблема достоверности тестовых измерений. Приводится реальный пример профессиональной психологической диагностики конкретного субъекта (специалиста) и межличностных отношений в группе (отделе).
Глава 4 посвящена проблемам компьютерной психодиагностики. Основание спора ученых о возможности создания «искусственного интеллекта» вряд ли всецело лежит в плоскости психологии. История развития дискуссии «о думающих машинах», зародившейся в средние века, продолжается и по сей день. Видимо, в ближайшее время компьютеру уготована только роль «помощника» психолога, выполняющего рутинную работу. В главе 4 приведен краткий обзор некоторых автоматизированных психодиагностических методов, который отражает лишь часть из множества сконструированных компьютерных тестов.
В конце книги приведен перечень литературы по проблемам психологических исследований, а также помещены контрольные вопросы к темам курса «Основы психодиагностики».
Непараметрические шкалы
2. Нечеткая (размытая) классификация. Содержанием данной шкалы является сопоставление признаков реальных объектов с «эталоном». Эталоном может выступать идеальный объект (например, перечень профессионально значимых качеств специалистов) или реальный объект (лучший в профессии), то есть подобие эталону (А). Абсолютного подобия (идентичности) эталону не существует. Поэтому подобие определяется степенью совпадения признаков. В практике распространена следующая ситуация: «В подобно А; С подобно А; но В не подобно С».
Пример (см. рис. 5): выявлены характерологические черты у одного (А), другого (В) и третьего (С) испытуемых. Некоторые черты (признаки) одного субъекта (А) имеют место в характеристике другого (В). (На рисунке обозначены символами ^^^.) Эти люди имеют сходные и отличающиеся черты в индивидуальных характеристиках. А подобно В. Если нет сходных черт характера у субъектов В и С, то В не подобно С. А у А и С могут быть сходные характерологические черты (рис. 6).
Если в процессе психодиагностики редко встречается оценка «подобия» психологических характеристик людей при помощи математических расчетов, то в психологии профессий идентичность специальностей определяется с использованием коэффициента сопряженности.
Вывод: А подобно В, А подобно С, но С не подобно В.
Рис. 5. Иллюстрация «нечеткой (размытой) классификации»
Пример: для расчета сопряженности профессий (специальностей) воспользуемся данными, приведенными в табл. 4.
Таблица 4
Параметрические шкалы
Когда исследователь может измерить психологический признак, сказав при этом, что данные феномены различаются между собой на такое-то количество условных единиц, то появляется новый уровень измерений, основанный на параметре. Именно на параметрическом уровне измерения базируется математическая статистика.
К параметрическим относят шкалу интервалов, шкалу отношений и абсолютную шкалу.
5. Шкала интервалов (интервальная). Отличие данной шкалы от других параметрических шкал состоит в том, что начало отсчета (ноль) и интервалы выбираются условно. Здесь действует логическое правило, например, что между психологическими признаками А и В существует различие, измеряемое десятью условными единицами. Это интерпретируется так: А больше (или меньше) В на 10 единиц. Если, например, качество «коммуникабельность» субъекта А составляет стандартные 10 стэнов, а субъекта В — 7 стэнов, то по данному признаку субъект А более коммуникабелен, чем субъект В на 3 стэна. Из этого примера видно, что и точка отсчета величины признака, и интервал выбраны условно. Однако расчетный стандартизированный интервал дает возможность полагать, что на доверительном уровне (95%) разница между А и В постоянна и равна определенному значению. На практике измерение температуры (по Цельсию) происходит в шкале интервалов, так как, во-первых, нулевая температура не означает, что температура не отсутствует вообще, а во-вторых, интервалы, выраженные в градусах, являются делением относительным.
6.Шкала отношений. Измерение по шкале отношений осуществляется в области психофизиологических исследований. Содержанием данной шкалы является наличие абсолютной точки отсчета, то есть нуля, от которого идет относительно равный отсчет. Примером такой шкалы является измерение длины и веса, где имеется точка отсчета — ноль (отсутствие веса или длины), а интервалами являются общепринятые единицы измерения.
7. Абсолютная шкала (Lord F., Novick M., 1968). Данная оценочная шкала применяется в ситуации, когда есть ноль (отсутствие признака или качества), от которого идет отсчет в абсолютных долях. Примерами могут служить физические измерения, в частности, регистрация количества электронов в атоме, заряд ядра и т. п.
Названные одномерные шкалы (кроме абсолютной) могут быть преобразованы в другие шкалы более низкого уровня (понижение мощности шкалы). Так, интервальная шкала довольно легко может быть представлена в форме ранговой (по рейтингу балла), а также при наличии критерия (величины признака или его границ) — в номинальной.
Возможно преобразование шкалы более низкого, уровня в шкалу более высокого уровня (повышение мощности шкалы)*.
* См.: Дружинин В.Н. Экспериментальная психология: Учебное пособие. — М.: ИНФРА-М, 1997. - С. 189.
Одномерные психологические шкалы, полученные в результате измерения одного и того же признака у одного и того же объекта при использовании различных инструментов, могут также преобразовываться в многомерные шкалы* путем конструирования функциональных зависимостей между ними.
* См.: Осипов Г.В., Андреев Э.П. Методы измерения в социологии. — М.: Наука, 1977. — С. 121-164; Математические методы анализа и интерпретации социологических данных. — М.: Наука, 1989. — С. 12-60; Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. — М.: Владос, 1998. — С. 129-130; Носс И.Н. Психодиагностика. Тест, психометрия, эксперимент. — М.: "КСП+", 1999. — С. 137-142.
Глава 3. ТЕСТОЛОГИЯ
Подкласс: Анкеты
Анкета кандидата на работу (учебу) и др.
Требования к психодиагностическим методикам
1. Измерительные методики (тесты).
a) однозначная формулировка цели, предмета и области применения методики;
b) процедура проведения должна быть задана в виде однозначного алгоритма, пригодного для передачи пользователю (или компьютеру);
c) процедура обработки должна включать статистически обоснованные методы подсчета и стандартизации тестового балла (по статистическим или критериальным тестовым нормам). Выводы (диагностические суждения) на основе тестового балла должны сопровождаться указанием на вероятностный уровень статистической достоверности этих выводов;
d) тестовые шкалы должны быть проверены на репрезентативность, надежность, валидность в заданной области применения (с возможностью воспроизведения данного стандартизированного исследования);
e) процедуры, основанные на самоотчете, должны быть снабжены средствами контроля достоверности результатов, позволяющих автоматически отсеивать недостоверные протоколы;
f) создание базы тестовых данных с целью периодической коррекции всех стандартов методик.
2. Экспертные методы.
a) однозначная формулировка цели, предмета и области применения методики. Получение надежных данных обеспечивает достаточное число экспертов, обладающих необходимым уровнем квалификации;
b) инструкции должны пройти испытания на однозначность их выполнения экспертами по отношению к некоторому стандартному набору данных (эталону);
c) обработка результатов должна быть стандартизированной, позволяющей однозначно интерпретировать промежуточные данные любому эксперту;
d) создание базы тестовых данных с целью периодической коррекции всех стандартов методик, подготовка и переподготовка пользователей.
Методический инструментарий должен пройти аттестацию в межведомственной комиссии при Обществе психологов РФ.
Требования к пользователям:
a) знание и практическое применение общих теоретико-методологических принципов; владение основами дифференциальной психометрии; анализ психодиагностической литературы; создание банка информационных данных и банка тестовых средств;
b) ответственность за решения, принимаемые на основе тестовых данных, за обеспечение соответствия репрезентативности и прогностической валидности методики;
c) обеспечение необходимого уровня надежности диагноза с применением параллельного тестирования или экспертной оценки;
d) разработка тестовой батареи на основе наибольшей эффективности диагностики — максимум надежности при минимуме затрат;
e) проведение научно-исследовательской работы по совершенствованию методик в заданной области;
f) соблюдение требований стандартизации методов, подсчета баллов, интерпретации данных, прогноза профпригодности;
g) корректное использование и распространение методических средств психодиагностики;
h) обеспечение конфиденциальности психодиагностической информации, полученной от испытуемого на основе личного доверия;
i) выполнение требований по охране авторских прав разработчиков психодиагностических методик.
Перечисленные требования носят рекомендательный характер и, к великому сожалению, по сей день в России не приобрели еще статуса нормативных правовых актов, которые в настоящее время законодательно регулируют психодиагностическую деятельность исследователей, например, в США*. Они полностью основываются на нравственно-этических качествах психологов. И поэтому моральная ответственность каждого исследователя, психолога-практика за чистоту психологического эксперимента над живыми людьми очень велика. Многие психологи в организациях и учреждениях влияют на решение кадровых вопросов, к их советам прислушиваются в процессе консультаций или психотерапии. Во всех случаях основной принцип «не навреди» в сознании каждого психолога должен быть возведен в ранг закона практической деятельности, а профессиональные решения должны пропускаться через его совесть.
* См.: Анастази А., Урбина С. Психологическое тестирование. — СПб.: Питер, 2001. - С. 583-608.
Валидность тестов
Валидностью как элементом достоверности психодиагностического измерения свойств субъекта называется мера соответствия тестовых оценок представлениям о сущности свойств или их роли в той или иной деятельности человека. В теории психометрии определяют два основных типа и по крайней мере одиннадцать видов валидности методик (см. рис. 7).
Рис. 7. Структура валидности
Различают два типа валидности — внешнюю и внутреннюю*. Внешняя валидность есть мера возможности распространения результатов тестирования на генеральную совокупность**. Внешняя валидизация осуществляется путем расчета репрезентативности экспериментальной выборки при отработке теста и перекрестной валидизации, то есть определения валидности теста на выборке, отличающейся от той, на которой отрабатывался стимульный материал и задания к тесту.
* См.: Анастази А., Урбина С. Психологическое тестирование. — СПб., 2001.— С. 133-193.
** Там же.
Репрезентативность выборки — это представительность экспериментальной выборки, которая отражает основные свойства генеральной совокупности. Репрезентативность определяется путем сопоставления качественных и количественных характеристик экспериментальной выборки с характеристиками исследуемой популяции с целью определения их однородности.
К качественным характеристикам могут быть отнесены социально-демографические, видовые, интеллектуальные (образовательные), профессиональные и другие характеристики популяции (группы), которые являются предметом исследования или существенно влияют на него.
Количественная характеристика экспериментальной группы — это минимальная ее численность, сохраняющая свойства генеральной совокупности. Формирование репрезентативной выборки по количественному признаку осуществляется при помощи теоремы П. А. Чебышева о вероятности ошибки репрезентативности, которая гласит: «С вероятностью сколь угодно близкой к единице можно утверждать, что при достаточно большом числе независимых наблюдений выборочная средняя будет сколь угодно мало отличаться от генеральной средней» и далее (следствие 1 из теоремы П. А. Чебышева) «...что с вероятностью, как угодно близкой к единице («практически достоверно»), выборочная доля будет как угодно мало отличаться от генеральной доли, если объем выборки достаточно велик»*.
* Карасев А.И. Основы математической статистики. — М.: Росвузиздат, 1962. — С. 172.
В психологической литературе существует несколько теоретических подходов к расчету объема минимально репрезентативной выборки*. Часто приводятся таблицы опытно полученных данных**. Так, С. Москвин отмечает, что при объемах генеральной совокупности 400, 500, 1000, 2000, 5000, 10000 и более 10 тыс. человек минимальная выборка составляет соответственно 200, 222, 286, 333, 370, 398 и 400 испытуемых (указ. публ., с. 28). Г. Лоза указывает на следующее соотношение генеральной совокупности и объема экспериментальной выборки при проведении социологических исследований 100/16-17 чел., 300/50 чел., 1000/100 чел. и 5000/200 испытуемых. В лекции А. Гончарова минимальная репрезентативная выборка относительно генеральной совокупности соответственно составляет: 500/222, 1000/286, 2000/333, 3000/350, 4000/360, 5000/370, 10 000/385, 100 000/398 и более 100 000 - 400 респондентов.
* Введение в профессию. — М.: Воениздат, 1992; Карасев А.И. Основы математической статистики. — М.: Росвузиздат, 1962; Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. — СПб.: Питер-Ком, 1999 и др.
** Введение в профессию. — М.: Воениздат, 1992; Москвин С. Выборка в социологическом исследовании // Военно-социологическое исследование, 1993. С. 27-30; Гончаров А.И. Методы изучения общественного мнения и социальной информации (Лекция). - М.: ГА ВС, 1993.
В ходе анализа психологических данных для расчета объема минимальной репрезентативной выборки используются следующие формулы:
1) формула расчета объема минимальной репрезентативной выборки* при нахождении доли элементов генеральной совокупности, обладающих некоторым признаком (номинальная измерительная шкала):
* Карасев А.И. Основы математической статистики. — М.: Росвузиздат, 1962. — С. 213.
2) формула расчета объема минимальной репрезентативной выборки* при нахождении средней признака (интервальная измерительная шкала):
*Там же, с. 212.
3) формула расчета объема минимальной репрезентативной выборки*:
где n— объем минимальной репрезентативной выборки испытуемых;
t — коэффициент кратности ошибки, связанный с вероятностью гарантии ошибки выборочного наблюдения (величина t-критерия Стъюдента);
δ — величина стандартного отклонения;
D — размер ошибки доверительного интервала измерения признаков;
N — объем генеральной совокупности;
p — частота проявления данного признака;
q = 1 - р.
* Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. -СПб.: Питер-Ком, 1999. - С. 64-65.
Практическое задание. Рассчитать объем минимально-репрезентативной выборки испытуемых, если объем генеральной совокупности 5000 чел., а вероятность проявления исследуемого признака («угадывания» при помощи теста) — 0.8.
Дано: t — коэффициент кратности ошибки, связанный с вероятностью (Pt), с которой требуется гарантировать результаты выборочного наблюдения; D — размер ошибки доверительного интервала измерения признаков = 0,05; N — объем генеральной совокупности = 5000; р — частота проявления данного признака = 0.8; q = 1 — р = 0.2.
Определить: n — минимально необходимую численность экспериментальной выборки.
Ответ: n = 235.
Вывод: При повышении достоверности измерений происходит заметное уменьшение объема минимально репрезентативной выборки. Аналогичное влияние отказывает точность измерений (D).
Перекрестная валидизация производится путем апробации теста на выборке, отличной от экспериментальной. Перекрестная валидизация осуществляется для того, чтобы определить границы применения методики по критерию «характеристика популяции» (для определения уровня развития свойства у детей, подростков, мужчин-женщин, определенной группы специалистов и т. д.). В ходе перекрестной валидизации рассчитываются коэффициенты корреляции между одними и теми же показателями, полученными в результате тестирования разных групп испытуемых. Вывод о возможности применения теста на данной популяции делается при помощи параметрических критериев (t-критерий Стъюдента, n — критерий Уэлша).
Практическое задание. Рассчитать объем экспериментальной выборки по критерию обучаемости испытуемых (применялся тест ОСО*).
* ОСО — тест «Оценка общей способности к обучению».
Дано:
Группа 1 (школьники 9-го класса — 15 лет):
Количество испытуемых n = 471
Среднее значение показателя Мх = 3.75
Среднеквадратическое отклонение δ = 1.4
Группа 2 (школьники 10-го класса — 16 лет):
Количество испытуемых n =178
Среднее значение показателя Мх = 3.66
Среднеквадратическое отклонение δ = 0.8
Группа 3 (курсанты училища связи — 18 лет):
Количество испытуемых n=104
Среднее значение показателя Мх = 3.20
Среднеквадратическое отклонение δ=1.1
Решение: Для расчетов используется формула t-критерия:
* Экспериментальные выборки значимо не различаются на уровне р≤0.05.
** Экспериментальные выборки значимо различаются на уровне р≤0.05.
Вывод: в результате расчетов выявлено значимое различие показателей обучаемости между первой и третьей и между второй и третьей исследованными группами, которые не могут считаться однородными и составлять единую совокупность. Только между первой и второй выборками по данному критерию не существует значимых различий (р<0.05). В целях проверки валидности первую и вторую группы можно объединить в одну экспериментальную выборку и считать единой популяцией в количестве 649 человек.
Уяснив содержание внешней валидности методик, перейдем к рассмотрению аспектов внутренней валидности.
Внутренняя валидность — это мера соответствия тестовых оценок уровню развития измеряемого свойства. Она состоит по крайней мере из пяти элементов:
а) концептуальная (теоретическая) валидность — теоретическое обоснование возможности измерения исследуемого свойства данным психодиагностическим средством;
б) содержательная валидность — степень репрезентативности содержания заданий теста измеряемой области психических свойств;
в) конструктная валидность — степень репрезентативности исследуемого психологического конструкта в результатах теста («насколько результаты теста рассматриваются в качестве меры исследуемого психологического конструкта — фактора, свойства»)*
г) операционная валидность — степень репрезентативности в конкретных экспериментальных операциях реальных операциональных условий психической деятельности;
д) эмпирическая валидность — совокупность характеристик валидности теста, полученная сравнительным статистическим способом оценивания. К этим характеристикам относятся так называемые очевидная и критериальная виды валидности.
* Анастази А. Психологическое тестирование. В 2-х книгах. — М.: Педагогика. Т 1. С. 140.
Очевидная валидность — это представление о тесте, сфере его применения, результативности и прогностической ценности, которое возникает у испытуемого и другого лица, не располагающего специальными сведениями о характере использования и целях методики.
Критериальная валидность — комплекс характеристик, включающий текущую и прогностическую валидности методики и отражающий соответствие диагноза и прогноза определенному кругу критериев развития измеряемого свойства. Критериальная валидность оценивается величиной связи, корреляции показателя теста с «внешним критерием».
Эмпирическая валидность измеряется при помощи коэффициентов валидности.
Текущая [диагностическая (конкурентная)] валидность* мера способности теста дифференцировать испытуемых по изучаемому признаку. Текущая валидность теста определяется исходя из его «трудности» и мер изменчивости измеряемого признака.
* Текущая, диагностическая и конкурентная валидности здесь употребляются как синонимы.
Трудностью теста называется отношение количества решенных заданий методик к нерешенным заданиям*. Уровень трудности характеризуется коэффициентом трудности (Тт), который вычисляется по формулам А и Б.
* Анастази А. Психологическое тестирование. В 2-х книгах. — М.: Педагогика. Т. 1.С. 180-182.
где Np— количество решенных заданий теста; Nh — количество нерешенных заданий теста.
Оптимальная «трудность теста», рассчитанная с помощью формулы А, должна колебаться в пределах 50%, однако, как признают многие психологи, достичь такого положения крайне затруднительно. На практике критериальная «трудность» рассчитывается для всей тестовой батареи и уже ее значение должно колебаться в пределах 50%, а «трудность» входящих в нее тестов - находиться в пределах «умеренного разброса». Видимо, этот «умеренный разброс» находится в пределах d, то есть ± 16%. (Следует также учитывать 5%-ю ошибку вычислений.)
где δ — стандартное отклонение, которое вычисляется по формуле:
Трудность теста, рассчитанного по формуле (Б), находится в пределах от 1 до 25 (цифры 13 и 4 выбраны экспериментально в целях исключения отрицательных и дробных показателей и удобства расчетов). Средняя трудность теста имеет значение 13.
Практическое задание. Рассчитать трудность тестовой батареи, состоящей из двух субтестов.
Решение:
К мерам изменчивости измеряемых признаков, как правило, относят характеристики распределения эмпирических данных (нормальность распределения) и характеристики вариации признаков.
Нормальность распределения данных определяет численную характеристику дифференциации испытуемых. Она вычисляется при помощи критерия Хи-квадрат Пирсона, а также с использованием коэффициентов асимметрии и эксцесса распределения переменных.
Ширина полосы разброса данных по шкале измерений от min до max; это характеристика вариации признаков. Простейшими измерителями вариации признаков являются размах вариации R (это разность между наибольшим и наименьшим значениями признаков, то есть R = xmax — xmjn) и дискриминатив-ность заданий — субтестов (способность отдельных пунктов (заданий) теста дифференцировать обследуемых относительно «максимального» или «минимального» результата теста). Мера соответствия успешности выполнения одного субтеста всей методике является показателем дискриминативности заданий теста и называется коэффициентом дискриминации (индексом дискриминативности). Индекс дискриминативности теста рассчитывается в процессе разработки тестов и тестовой батареи. Он вычисляется при помощи а) точечно-биссериального коэффициента корреляции (Rpb) (см. выше) и б) метода контрастных групп в виде разности между долей лиц, правильно решивших задание из «высокопродуктивной» и «низкопродуктивной» групп (D)*.
* См. Словарь-справочник по психологической диагностике / Бурлачук Л.Ф., Морозов С.М. - Киев, 1989. - С. 47-48.
Наибольший интерес представляет характер группировки значений признака вокруг их средней. Мерой ее определения являются дисперсия (среднеквадратическое отклонение) и коэффициент вариации (V), который определяется как отношение дисперсии (dx) к среднему (Мх), выраженное в процентах:
Между характеристиками распределения и вариативностью переменных имеется связь, которая предопределяет оптимальное сочетание формы распределения с вариативностью. Большая вариативность признаков говорит о том, что распределение ненормально, асимметрично и сильно скошено. Малая вариативность показывает, что тест не дифференцирует испытуемых по измеряемому признаку (испытуемые отвечают или решают задание одинаково). При анализе трудности, нормальности распределения и вариативности показателей тестов необходимо соблюдать МЕРУ, которая вырабатывается в процессе накопления опыта диагностической работы и статистической обработки данных.
Прогностическая валидность является элементом содержания достоверности тестов и определяется как степень точности и обоснованности суждения о диагностируемом психическом свойстве по его результату спустя определенное время после измерения.
Показателем прогностичности теста является степень регрессии тестовых данных к объективным критериям. Регрессия представляет собой функцию f (х1 х2 х3, ... хn), описывающую зависимость среднего показателя теста, измеряющего данное свойство от заданных фиксированных значений реального проявления этого свойства (внешнего критерия — у). Эта функция может носить линейный и нелинейный характер (линейная регрессия: у = b + ах; параболическая зависимость: у = b + ах + сх2; гиперболическая зависимость: у = b + а/х; показательная функция: у = b + а).
В практической психодиагностике для прогноза развития или проявления измеренного свойства чаще применяют линейную или множественную линейную регрессию (у = b + а1 х1 +а2 х2… +аn хn). Физический смысл ее заключается в приравнивании зависимой и независимой переменных. Изменение зависимой переменной прямо определяет изменение независимой переменной. Коэффициент а показывает угол наклона оси регрессии, а свободный член b — отстояние начала оси регрессии от начала координат. Коэффициент корреляции показывает уровень прогностичности функции, a R2 - уровень объясняемой дисперсии у за счет изменения х. При использовании тестовой батареи прогноз измеряемого свойства осуществляется посредством связанных между собой нескольких зависимых переменных (х1, x2, x3,... xn), которые и формируют множественную линейную регрессию. При использовании множественной линейной функции при прогнозе развития измеряемого свойства повышается уровень прогностичности тести