Глава 1. история и методология психодиагностического исследования

Носс И.Н.

Введение в технологию психодиагностики. — М.: Изд-во Института Психотерапии, 2003. -- 251 с.

Эта книга представляет собой пособие для студентов и начинаю­щих психологов. Она знакомит с основами методологии и техноло­гии психодиагностики — одного из основных инструментов комп­лексного психологического исследования личности. В ней излагаются основные вехи истории психодиагностики, дается представление о ее предмете и особенностях использования тестовых методик, рас­сматривается проблема достоверности тестовых измерений в психо­логии, приводится классификация тестов и методик, обсуждаются этические требования к психологам, занимающимся диагностикой. Практическая работа проиллюстрирована на реальном примере про­фессиональной психологической диагностики конкретного специа­листа и межличностных отношений в группе. Отдельная глава по­священа проблемам компьютерной психодиагностики.

В результате изучения курса психодиагностики психолог должен не просто усвоить приемы использования отдельных методик и тес­тов, а научиться конструированию метода психологического исследо­вания, системы знаний, умений и навыков понимания других людей.

ISBN 5-89939-084-5

© Носс И. Н., 2002

© Изд-во Института Психотерапии, 2002

Моему учителю и наставнику, профессору

Съедину Сергею Ивановичу посвящается

ВВЕДЕНИЕ

Представления о психодиагностике в настоящее время скла­дываются на основе суждений по поводу тестов. Мода на тести­рование, завладевшая умами психологов, иногда приравнивает психодиагностическую процедуру к тестологическому ритуалу.

Если под диагностикой в психологии понимать собственно исследование какого-либо психологического феномена, то ди­агностическая оценка представляет собой сложную систему всестороннего изучения личности. В ее рамках тестам должна отводиться роль отправной точки, объективной базы, на осно­ве которой строится психологическая диагностика. Подмена психодиагностики тестированием, на наш взгляд, является большой ошибкой.

Основной специфически психологический предмет психо­диагностики — измерение психологических особенностей в сопоставлении с нормативными, критериальными или ипсативными показателями. Психолог, оценивая личностные особен­ности человека, «входит» в индивидуальный образ испытуемо­го. Тестовые методы дают ему некий «объективный» образ-нор­матив. Наблюдение, проводимое как во время тестирования, так и в ходе всей диагностической процедуры, формирует субъективное представление. Беседа по итогам изучения доку­ментов, фактов биографии, тестирования и др. помогает сопо­ставить тестовые данные и другую информацию и построить некое представление об изучаемом индивиде. И, наконец, гер­меневтический анализ структурирует вывод о психологических особенностях испытуемого.

Таким образом, целью психологической науки является ис­следование психики индивида. А задача психодиагностики очень проста и в то же время неимоверно сложна — сделать это изучение адекватным. Психодиагностика — это создание ин­струмента, метода психологического исследования, его процес­суальный аспект.

В результате изучения курса психодиагностики психолог должен усвоить знания, умения и навыки понимания других людей посредством психологических методов. Он должен пред­ставлять, что диагностическая процедура состоит из формаль­но-количественной и детально-качественной оценки испыту­емых, а количественные показатели интерпретируются как в сопоставлении друг с другом, так и в глубинной увязке с каче­ственным исследованием, основанным на чувстве, интуиции и опыте психолога.

В ходе преподавания психодиагностики как учебной дис­циплины сложилось расхожее мнение, что она представляет собой процесс изучения тестов. Безусловно, тестологическая процедура занимает значительное место в ее содержании. Но центральная позиция все же должна быть отдана конструиро­ванию метода, технологии психологического исследования, а не приемам использования отдельных методик и тестов.

Можно привести множество примеров, когда так называе­мые практические психологи используют в своей работе набор методик и тестов, связанных между собой лишь в воображении экспериментатора. К сожалению, этого недостаточно. Различ­ные психологические инструменты должны быть согласованы не только интуитивно-чувственно, не только теоретически, но и процессуально, и статистически, и организационно. Просле­живается значимая связь знаний основ математической стати­стики, принципов соблюдения достоверности психологичес­ких измерений, профессионально-этических норм деятельно­сти психологов и опыта их практической работы в области ре­альной психодиагностики.

Вряд ли начинающий практический психолог ринется в омут разработки новых, оригинальных методик и тестов. Для этого требуется много времени и значительные объемы эксперимен­тальных выборок*. Поэтому наша задача заключается прежде всего в ознакомлении студентов и начинающих психологов с методологией и технологией конструирования тестовых «бата­рей», научении адекватно интерпретировать не отдельные тес­ты (хотя мы описываем и процедуру разработки некоторых пси­ходиагностических методик), а результаты исследований, по­лученные при помощи тестовых комплексов, связанных в еди­ную методику. Вот основная цель данного пособия.

* См. Анастази А., Урбина С. Психологическое тестирование. — СПб.: Питер, 2001. - С. 303.

Глава 1 посвящена истории психодиагностики и обсужде­нию ее специфически психологического предмета. В ней при­водятся исторические этапы развития так называемых донауч­ных психодиагностических традиций, тестологии и психотех­ники. История психодиагностики представлена здесь в виде этюдов о зарубежной и российской психологии. Психологичес­кая наука и ее методы развивалась не равномерно. Великие по­трясения в социальной жизни человечества отражались и в ис­тории психодиагностики. Видные экспериментаторы порой сами являлись тормозом ее развития. Только в России психо­логия дважды оказывалась «вне закона» — в середине XIX и первой трети XX века. После известного решения 1850 года о прекращении преподавания философии и психологии в уни­верситетах «...ввиду предосудительного развития этой науки современными германскими учеными (левыми гегельянцами) и передачи чтения логики и опытной психологии профессорам богословия...»* только в 1863 году были восстановлены кафед­ры философии, на которых читался курс психологии. Иссле­дования М.М. Троицкого («Немецкая психология в текущем столетии») и К.Д. Кавелина («Задачи психологии», 1872) поло­жили начало дальнейшему развитию психологических изыска­ний в России. Печально известна также взаимосвязь между го­сударственной политикой Советского Союза в 20-30-е годы XX столетия и крушением отечественных психотехнических дос­тижений.

* Ивановский В.Н. Очерк о жизни и деятельности Н.Я. Грота //Вопросы филосо­фии и психологии. Т. 51(1), 1900.

Все это накладывает яркий отпечаток и на современную психодиагностику. Мы недостаточно хорошо знаем своих оте­чественных исследователей. И поистине прав был А. А. Леон­тьев, утверждая, что истоки некоторых психологических теорий «по существу остаются не проанализированными»*. Это в полной мере относится и к психодиагностике.

* Леонтьев А.А. Ключевые идеи Л.С. Выготского — вклад в мировую психологию XX столетия // Психологический журнал. — 2001. — Т. 22. — № 4.— С. 10.

О предмете психологической диагностики в научно-прак­тической литературе ведется долгий и особый разговор. Мож­но ли в полной мере отнести ее к психологической науке или это часть эпистемологии? Хочется думать, что психодиагнос­тические изыскания как вид эксперимента являются областью именно психологической эпистемологии.

В данной главе приведено несколько наиболее популярных классификаций методических средств психологической оцен­ки. Упорядочение методик и тестов по различным основаниям дает возможность психологам оптимизировать поиск инстру­ментария для своих исследований.

Глава 2 посвящена психометрическим аспектам разработки, адаптации и использования методик. Здесь даны понятия об измерении в психологии. Выделены проблемы использования конкретных статистических процедур в процессе анализа эм­пирических данных. На реальных примерах показаны пункты применения мер центральной тенденции, мер изменчивости, мер связи и статистического вывода. Обсуждаются два подхода к анализу распределения переменных, а также принципы и ме­тоды стандартизации «сырых» тестовых баллов.

В начале главы 3 помещена так называемая технологичес­кая классификация тестов и методик. Особое место отводится нормативно-этическим требованиям к психологам, занимаю­щимся диагностикой. Исследуется и обсуждается проблема до­стоверности тестовых измерений. Приводится реальный при­мер профессиональной психологической диагностики конкрет­ного субъекта (специалиста) и межличностных отношений в группе (отделе).

Глава 4 посвящена проблемам компьютерной психодиаг­ностики. Основание спора ученых о возможности создания «искусственного интеллекта» вряд ли всецело лежит в плос­кости психологии. История развития дискуссии «о думающих машинах», зародившейся в средние века, продолжается и по сей день. Видимо, в ближайшее время компьютеру уготована только роль «помощника» психолога, выполняющего рутин­ную работу. В главе 4 приведен краткий обзор некоторых ав­томатизированных психодиагностических методов, который отражает лишь часть из множества сконструированных ком­пьютерных тестов.

В конце книги приведен перечень литературы по пробле­мам психологических исследований, а также помещены конт­рольные вопросы к темам курса «Основы психодиагностики».

Непараметрические шкалы

2. Нечеткая (размытая) классификация. Содержанием дан­ной шкалы является сопоставление признаков реальных объектов с «эталоном». Эталоном может выступать идеальный объект (например, перечень профессионально значимых ка­честв специалистов) или реальный объект (лучший в профессии), то есть подобие эталону (А). Абсолютного подобия (иден­тичности) эталону не существует. Поэтому подобие определя­ется степенью совпадения признаков. В практике распрост­ранена следующая ситуация: «В подобно А; С подобно А; но В не подобно С».

Пример (см. рис. 5): выявлены характерологические чер­ты у одного (А), другого (В) и третьего (С) испытуемых. Не­которые черты (признаки) одного субъекта (А) имеют место в характеристике другого (В). (На рисунке обозначены сим­волами ^^^.) Эти люди имеют сходные и отличающиеся чер­ты в индивидуальных характеристиках. А подобно В. Если нет сходных черт характера у субъектов В и С, то В не подоб­но С. А у А и С могут быть сходные характерологические чер­ты (рис. 6).

Если в процессе психодиагностики редко встречается оценка «подобия» психологических характеристик людей при помощи математических расчетов, то в психологии профессий идентич­ность специальностей определяется с использованием коэф­фициента сопряженности.

Вывод: А подобно В, А подобно С, но С не подобно В.

Рис. 5. Иллюстрация «нечеткой (размытой) классификации»

Пример: для расчета сопряженности профессий (специаль­ностей) воспользуемся данными, приведенными в табл. 4.

Таблица 4

Параметрические шкалы

Когда исследователь может измерить психологический при­знак, сказав при этом, что данные феномены различаются меж­ду собой на такое-то количество условных единиц, то появля­ется новый уровень измерений, основанный на параметре. Именно на параметрическом уровне измерения базируется ма­тематическая статистика.

К параметрическим относят шкалу интервалов, шкалу от­ношений и абсолютную шкалу.

5. Шкала интервалов (интервальная). Отличие данной шка­лы от других параметрических шкал состоит в том, что начало отсчета (ноль) и интервалы выбираются условно. Здесь действу­ет логическое правило, например, что между психологическими признаками А и В существует различие, измеряемое деся­тью условными единицами. Это интерпретируется так: А боль­ше (или меньше) В на 10 единиц. Если, например, качество «коммуникабельность» субъекта А составляет стандартные 10 стэнов, а субъекта В — 7 стэнов, то по данному признаку субъект А более коммуникабелен, чем субъект В на 3 стэна. Из этого примера видно, что и точка отсчета величины признака, и ин­тервал выбраны условно. Однако расчетный стандартизирован­ный интервал дает возможность полагать, что на доверитель­ном уровне (95%) разница между А и В постоянна и равна оп­ределенному значению. На практике измерение температуры (по Цельсию) происходит в шкале интервалов, так как, во-пер­вых, нулевая температура не означает, что температура не от­сутствует вообще, а во-вторых, интервалы, выраженные в гра­дусах, являются делением относительным.

6.Шкала отношений. Измерение по шкале отношений осу­ществляется в области психофизиологических исследований. Содержанием данной шкалы является наличие абсолютной точ­ки отсчета, то есть нуля, от которого идет относительно равный отсчет. Примером такой шкалы является измерение длины и веса, где имеется точка отсчета — ноль (отсутствие веса или длины), а интервалами являются общепринятые единицы измерения.

7. Абсолютная шкала (Lord F., Novick M., 1968). Данная оце­ночная шкала применяется в ситуации, когда есть ноль (отсут­ствие признака или качества), от которого идет отсчет в абсо­лютных долях. Примерами могут служить физические измере­ния, в частности, регистрация количества электронов в атоме, заряд ядра и т. п.

Названные одномерные шкалы (кроме абсолютной) могут быть преобразованы в другие шкалы более низкого уровня (по­нижение мощности шкалы). Так, интервальная шкала доволь­но легко может быть представлена в форме ранговой (по рей­тингу балла), а также при наличии критерия (величины при­знака или его границ) — в номинальной.

Возможно преобразование шкалы более низкого, уровня в шкалу более высокого уровня (повышение мощности шкалы)*.

* См.: Дружинин В.Н. Экспериментальная психология: Учебное пособие. — М.: ИНФРА-М, 1997. - С. 189.

Одномерные психологические шкалы, полученные в резуль­тате измерения одного и того же признака у одного и того же объекта при использовании различных инструментов, могут также преобразовываться в многомерные шкалы* путем конст­руирования функциональных зависимостей между ними.

* См.: Осипов Г.В., Андреев Э.П. Методы измерения в социологии. — М.: Наука, 1977. — С. 121-164; Математические методы анализа и интерпретации социологических данных. — М.: Наука, 1989. — С. 12-60; Шевандрин Н.И. Психодиагностика, коррекция и развитие личности. — М.: Владос, 1998. — С. 129-130; Носс И.Н. Психодиагностика. Тест, психометрия, эксперимент. — М.: "КСП+", 1999. — С. 137-142.

Глава 3. ТЕСТОЛОГИЯ

Подкласс: Анкеты

Анкета кандидата на работу (учебу) и др.

Требования к психодиагностическим методикам

1. Измерительные методики (тесты).

a) однозначная формулировка цели, предмета и области при­менения методики;

b) процедура проведения должна быть задана в виде одно­значного алгоритма, пригодного для передачи пользователю (или компьютеру);

c) процедура обработки должна включать статистически обоснованные методы подсчета и стандартизации тестового балла (по статистическим или критериальным тестовым нор­мам). Выводы (диагностические суждения) на основе тестово­го балла должны сопровождаться указанием на вероятностный уровень статистической достоверности этих выводов;

d) тестовые шкалы должны быть проверены на репрезента­тивность, надежность, валидность в заданной области приме­нения (с возможностью воспроизведения данного стандарти­зированного исследования);

e) процедуры, основанные на самоотчете, должны быть снаб­жены средствами контроля достоверности результатов, позволя­ющих автоматически отсеивать недостоверные протоколы;

f) создание базы тестовых данных с целью периодической коррекции всех стандартов методик.

2. Экспертные методы.

a) однозначная формулировка цели, предмета и области применения методики. Получение надежных данных обеспе­чивает достаточное число экспертов, обладающих необходимым уровнем квалификации;

b) инструкции должны пройти испытания на однозначность их выполнения экспертами по отношению к некоторому стан­дартному набору данных (эталону);

c) обработка результатов должна быть стандартизированной, позволяющей однозначно интерпретировать промежуточные данные любому эксперту;

d) создание базы тестовых данных с целью периодической коррекции всех стандартов методик, подготовка и переподго­товка пользователей.

Методический инструментарий должен пройти аттеста­цию в межведомственной комиссии при Обществе психоло­гов РФ.

Требования к пользователям:

a) знание и практическое применение общих теоретико-методологических принципов; владение основами дифферен­циальной психометрии; анализ психодиагностической литера­туры; создание банка информационных данных и банка тесто­вых средств;

b) ответственность за решения, принимаемые на основе те­стовых данных, за обеспечение соответствия репрезентативно­сти и прогностической валидности методики;

c) обеспечение необходимого уровня надежности диагноза с применением параллельного тестирования или экспертной оценки;

d) разработка тестовой батареи на основе наибольшей эф­фективности диагностики — максимум надежности при мини­муме затрат;

e) проведение научно-исследовательской работы по совер­шенствованию методик в заданной области;

f) соблюдение требований стандартизации методов, подсче­та баллов, интерпретации данных, прогноза профпригодности;

g) корректное использование и распространение методи­ческих средств психодиагностики;

h) обеспечение конфиденциальности психодиагностической информации, полученной от испытуемого на основе личного доверия;

i) выполнение требований по охране авторских прав разра­ботчиков психодиагностических методик.

Перечисленные требования носят рекомендательный харак­тер и, к великому сожалению, по сей день в России не приобре­ли еще статуса нормативных правовых актов, которые в настоя­щее время законодательно регулируют психодиагностическую деятельность исследователей, например, в США*. Они полнос­тью основываются на нравственно-этических качествах психо­логов. И поэтому моральная ответственность каждого исследо­вателя, психолога-практика за чистоту психологического экспе­римента над живыми людьми очень велика. Многие психологи в организациях и учреждениях влияют на решение кадровых воп­росов, к их советам прислушиваются в процессе консультаций или психотерапии. Во всех случаях основной принцип «не на­вреди» в сознании каждого психолога должен быть возведен в ранг закона практической деятельности, а профессиональные решения должны пропускаться через его совесть.

* См.: Анастази А., Урбина С. Психологическое тестирование. — СПб.: Питер, 2001. - С. 583-608.

Валидность тестов

Валидностью как элементом достоверности психодиагнос­тического измерения свойств субъекта называется мера соот­ветствия тестовых оценок представлениям о сущности свойств или их роли в той или иной деятельности человека. В теории психометрии определяют два основных типа и по крайней мере одиннадцать видов валидности методик (см. рис. 7).

Рис. 7. Структура валидности

Различают два типа валидности — внешнюю и внутреннюю*. Внешняя валидность есть мера возможности распространения результатов тестирования на генеральную совокупность**. Вне­шняя валидизация осуществляется путем расчета репрезента­тивности экспериментальной выборки при отработке теста и перекрестной валидизации, то есть определения валидности теста на выборке, отличающейся от той, на которой отрабаты­вался стимульный материал и задания к тесту.

* См.: Анастази А., Урбина С. Психологическое тестирование. — СПб., 2001.— С. 133-193.

** Там же.

Репрезентативность выборки — это представительность эк­спериментальной выборки, которая отражает основные свой­ства генеральной совокупности. Репрезентативность опреде­ляется путем сопоставления качественных и количественных характеристик экспериментальной выборки с характеристи­ками исследуемой популяции с целью определения их одно­родности.

К качественным характеристикам могут быть отнесены со­циально-демографические, видовые, интеллектуальные (обра­зовательные), профессиональные и другие характеристики по­пуляции (группы), которые являются предметом исследования или существенно влияют на него.

Количественная характеристика экспериментальной груп­пы — это минимальная ее численность, сохраняющая свойства генеральной совокупности. Формирование репрезентативной выборки по количественному признаку осуществляется при помощи теоремы П. А. Чебышева о вероятности ошибки реп­резентативности, которая гласит: «С вероятностью сколь угод­но близкой к единице можно утверждать, что при достаточно большом числе независимых наблюдений выборочная средняя будет сколь угодно мало отличаться от генеральной средней» и далее (следствие 1 из теоремы П. А. Чебышева) «...что с вероят­ностью, как угодно близкой к единице («практически досто­верно»), выборочная доля будет как угодно мало отличаться от генеральной доли, если объем выборки достаточно велик»*.

* Карасев А.И. Основы математической статистики. — М.: Росвузиздат, 1962. — С. 172.

В психологической литературе существует несколько тео­ретических подходов к расчету объема минимально репрезен­тативной выборки*. Часто приводятся таблицы опытно полу­ченных данных**. Так, С. Москвин отмечает, что при объемах генеральной совокупности 400, 500, 1000, 2000, 5000, 10000 и более 10 тыс. человек минимальная выборка составляет соот­ветственно 200, 222, 286, 333, 370, 398 и 400 испытуемых (указ. публ., с. 28). Г. Лоза указывает на следующее соотношение ге­неральной совокупности и объема экспериментальной выбор­ки при проведении социологических исследований 100/16-17 чел., 300/50 чел., 1000/100 чел. и 5000/200 испытуемых. В лек­ции А. Гончарова минимальная репрезентативная выборка от­носительно генеральной совокупности соответственно состав­ляет: 500/222, 1000/286, 2000/333, 3000/350, 4000/360, 5000/370, 10 000/385, 100 000/398 и более 100 000 - 400 респондентов.

* Введение в профессию. — М.: Воениздат, 1992; Карасев А.И. Основы математи­ческой статистики. — М.: Росвузиздат, 1962; Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. — СПб.: Питер-Ком, 1999 и др.

** Введение в профессию. — М.: Воениздат, 1992; Москвин С. Выборка в социоло­гическом исследовании // Военно-социологическое исследование, 1993. С. 27-30; Гон­чаров А.И. Методы изучения общественного мнения и социальной информации (Лек­ция). - М.: ГА ВС, 1993.

В ходе анализа психологических данных для расчета объема минимальной репрезентативной выборки используются следу­ющие формулы:

1) формула расчета объема минимальной репрезентативной выборки* при нахождении доли элементов генеральной сово­купности, обладающих некоторым признаком (номинальная измерительная шкала):

* Карасев А.И. Основы математической статистики. — М.: Росвузиздат, 1962. — С. 213.

2) формула расчета объема минимальной репрезентативной выборки* при нахождении средней признака (интервальная измерительная шкала):

*Там же, с. 212.

3) формула расчета объема минимальной репрезентативной выборки*:

где n— объем минимальной репрезентативной выборки испы­туемых;

t — коэффициент кратности ошибки, связанный с вероят­ностью гарантии ошибки выборочного наблюдения (вели­чина t-критерия Стъюдента);

δ — величина стандартного отклонения;

D — размер ошибки доверительного интервала измерения признаков;

N — объем генеральной совокупности;

p — частота проявления данного признака;

q = 1 - р.

* Бурлачук Л.Ф., Морозов С.М. Словарь-справочник по психодиагностике. -СПб.: Питер-Ком, 1999. - С. 64-65.

Практическое задание. Рассчитать объем минимально-реп­резентативной выборки испытуемых, если объем генеральной совокупности 5000 чел., а вероятность проявления исследуе­мого признака («угадывания» при помощи теста) — 0.8.

Дано: t — коэффициент кратности ошибки, связанный с вероятностью (Pt), с которой требуется гарантировать резуль­таты выборочного наблюдения; D — размер ошибки довери­тельного интервала измерения признаков = 0,05; N — объем генеральной совокупности = 5000; р — частота проявления дан­ного признака = 0.8; q = 1 — р = 0.2.

Определить: n — минимально необходимую численность экспериментальной выборки.

Ответ: n = 235.

Вывод: При повышении достоверности измерений проис­ходит заметное уменьшение объема минимально репрезента­тивной выборки. Аналогичное влияние отказывает точность измерений (D).

Перекрестная валидизация производится путем апроба­ции теста на выборке, отличной от экспериментальной. Пе­рекрестная валидизация осуществляется для того, чтобы оп­ределить границы применения методики по критерию «ха­рактеристика популяции» (для определения уровня развития свойства у детей, подростков, мужчин-женщин, определен­ной группы специалистов и т. д.). В ходе перекрестной валидизации рассчитываются коэффициенты корреляции между одними и теми же показателями, полученными в результате тестирования разных групп испытуемых. Вывод о возмож­ности применения теста на данной популяции делается при помощи параметрических критериев (t-критерий Стъюдента, n — критерий Уэлша).

Практическое задание. Рассчитать объем эксперименталь­ной выборки по критерию обучаемости испытуемых (приме­нялся тест ОСО*).

* ОСО — тест «Оценка общей способности к обучению».

Дано:

Группа 1 (школьники 9-го класса — 15 лет):

Количество испытуемых n = 471

Среднее значение показателя Мх = 3.75

Среднеквадратическое отклонение δ = 1.4

Группа 2 (школьники 10-го класса — 16 лет):

Количество испытуемых n =178

Среднее значение показателя Мх = 3.66

Среднеквадратическое отклонение δ = 0.8

Группа 3 (курсанты училища связи — 18 лет):

Количество испытуемых n=104

Среднее значение показателя Мх = 3.20

Среднеквадратическое отклонение δ=1.1

Решение: Для расчетов используется формула t-критерия:

* Экспериментальные выборки значимо не различаются на уровне р≤0.05.

** Экспериментальные выборки значимо различаются на уровне р≤0.05.

Вывод: в результате расчетов выявлено значимое различие показателей обучаемости между первой и третьей и между вто­рой и третьей исследованными группами, которые не могут счи­таться однородными и составлять единую совокупность. Толь­ко между первой и второй выборками по данному критерию не существует значимых различий (р<0.05). В целях проверки валидности первую и вторую группы можно объединить в одну экспериментальную выборку и считать единой популяцией в количестве 649 человек.

Уяснив содержание внешней валидности методик, перейдем к рассмотрению аспектов внутренней валидности.

Внутренняя валидность — это мера соответствия тестовых оценок уровню развития измеряемого свойства. Она состоит по крайней мере из пяти элементов:

а) концептуальная (теоретическая) валидность — теорети­ческое обоснование возможности измерения исследуемого свойства данным психодиагностическим средством;

б) содержательная валидность — степень репрезентативно­сти содержания заданий теста измеряемой области психичес­ких свойств;

в) конструктная валидность — степень репрезентативности исследуемого психологического конструкта в результатах теста («насколько результаты теста рассматриваются в качестве меры исследуемого психологического конструкта — фактора, свой­ства»)*

г) операционная валидность — степень репрезентативнос­ти в конкретных экспериментальных операциях реальных опе­рациональных условий психической деятельности;

д) эмпирическая валидность — совокупность характеристик валидности теста, полученная сравнительным статистическим способом оценивания. К этим характеристикам относятся так называемые очевидная и критериальная виды валидности.

* Анастази А. Психологическое тестирование. В 2-х книгах. — М.: Педагогика. Т 1. С. 140.

Очевидная валидность — это представление о тесте, сфере его применения, результативности и прогностической ценно­сти, которое возникает у испытуемого и другого лица, не рас­полагающего специальными сведениями о характере исполь­зования и целях методики.

Критериальная валидность — комплекс характеристик, включающий текущую и прогностическую валидности методи­ки и отражающий соответствие диагноза и прогноза определен­ному кругу критериев развития измеряемого свойства. Крите­риальная валидность оценивается величиной связи, корреля­ции показателя теста с «внешним критерием».

Эмпирическая валидность измеряется при помощи коэффи­циентов валидности.

Текущая [диагностическая (конкурентная)] валидность* мера способности теста дифференцировать испытуемых по изу­чаемому признаку. Текущая валидность теста определяется ис­ходя из его «трудности» и мер изменчивости измеряемого при­знака.

* Текущая, диагностическая и конкурентная валидности здесь употребляются как синонимы.

Трудностью теста называется отношение количества решен­ных заданий методик к нерешенным заданиям*. Уровень труд­ности характеризуется коэффициентом трудности (Тт), кото­рый вычисляется по формулам А и Б.

* Анастази А. Психологическое тестирование. В 2-х книгах. — М.: Педагогика. Т. 1.С. 180-182.

где Np— количество решенных заданий теста; Nh — количе­ство нерешенных заданий теста.

Оптимальная «трудность теста», рассчитанная с помощью формулы А, должна колебаться в пределах 50%, однако, как признают многие психологи, достичь такого положения край­не затруднительно. На практике критериальная «трудность» рассчитывается для всей тестовой батареи и уже ее значение должно колебаться в пределах 50%, а «трудность» входящих в нее тестов - находиться в пределах «умеренного разброса». Видимо, этот «умеренный разброс» находится в пределах d, то есть ± 16%. (Следует также учитывать 5%-ю ошибку вычисле­ний.)

где δ — стандартное отклонение, которое вычисляется по фор­муле:

Трудность теста, рассчитанного по формуле (Б), находится в пределах от 1 до 25 (цифры 13 и 4 выбраны экспериментально в целях исключения отрицательных и дробных показателей и удобства расчетов). Средняя трудность теста имеет значение 13.

Практическое задание. Рассчитать трудность тестовой бата­реи, состоящей из двух субтестов.

Решение:

К мерам изменчивости измеряемых признаков, как прави­ло, относят характеристики распределения эмпирических дан­ных (нормальность распределения) и характеристики вариации признаков.

Нормальность распределения данных определяет числен­ную характеристику дифференциации испытуемых. Она вычис­ляется при помощи критерия Хи-квадрат Пирсона, а также с использованием коэффициентов асимметрии и эксцесса рас­пределения переменных.

Ширина полосы разброса данных по шкале измерений от min до max; это характеристика вариации признаков. Простей­шими измерителями вариации признаков являются размах ва­риации R (это разность между наибольшим и наименьшим зна­чениями признаков, то есть R = xmax — xmjn) и дискриминатив-ность заданий — субтестов (способность отдельных пунктов (заданий) теста дифференцировать обследуемых относительно «максимального» или «минимального» результата теста). Мера соответствия успешности выполнения одного субтеста всей методике является показателем дискриминативности заданий теста и называется коэффициентом дискриминации (индексом дискриминативности). Индекс дискриминативности теста рас­считывается в процессе разработки тестов и тестовой батареи. Он вычисляется при помощи а) точечно-биссериального ко­эффициента корреляции (Rpb) (см. выше) и б) метода контрас­тных групп в виде разности между долей лиц, правильно ре­шивших задание из «высокопродуктивной» и «низкопродуктив­ной» групп (D)*.

* См. Словарь-справочник по психологической диагностике / Бурлачук Л.Ф., Морозов С.М. - Киев, 1989. - С. 47-48.

Наибольший интерес представляет характер группировки значений признака вокруг их средней. Мерой ее определения являются дисперсия (среднеквадратическое отклонение) и ко­эффициент вариации (V), который определяется как отноше­ние дисперсии (dx) к среднему (Мх), выраженное в процентах:

Между характеристиками распределения и вариативностью переменных имеется связь, которая предопределяет оптимальное сочетание формы распределения с вариативностью. Большая ва­риативность признаков говорит о том, что распределение ненор­мально, асимметрично и сильно скошено. Малая вариативность показывает, что тест не дифференцирует испытуемых по измеряе­мому признаку (испытуемые отвечают или решают задание оди­наково). При анализе трудности, нормальности распределения и вариативности показателей тестов необходимо соблюдать МЕРУ, которая вырабатывается в процессе накопления опыта диагнос­тической работы и статистической обработки данных.

Прогностическая валидность является элементом содержа­ния достоверности тестов и определяется как степень точнос­ти и обоснованности суждения о диагностируемом психичес­ком свойстве по его результату спустя определенное время после измерения.

Показателем прогностичности теста является степень рег­рессии тестовых данных к объективным критериям. Регрессия представляет собой функцию f (х1 х2 х3, ... хn), описывающую зависимость среднего показателя теста, измеряющего данное свойство от заданных фиксированных значений реального про­явления этого свойства (внешнего критерия — у). Эта функция может носить линейный и нелинейный характер (линейная рег­рессия: у = b + ах; параболическая зависимость: у = b + ах + сх2; гиперболическая зависимость: у = b + а/х; показательная функция: у = b + а).

В практической психодиагностике для прогноза развития или проявления измеренного свойства чаще применяют линей­ную или множественную линейную регрессию (у = b + а1 х12 х2… +аn хn). Физический смысл ее заключается в приравнивании зависимой и независимой переменных. Изменение зависимой переменной прямо определяет изменение независимой пере­менной. Коэффициент а показывает угол наклона оси регрес­сии, а свободный член b — отстояние начала оси регрессии от начала координат. Коэффициент корреляции показывает уро­вень прогностичности функции, a R2 - уровень объясняемой дисперсии у за счет изменения х. При использовании тестовой батареи прогноз измеряемого свойства осуществляется посред­ством связанных между собой нескольких зависимых переменных (х1, x2, x3,... xn), которые и формируют множественную ли­нейную регрессию. При использовании множественной линей­ной функции при прогнозе развития измеряемого свойства повышается уровень прогностичности тести

Наши рекомендации