Развитие психодиагностики в 1990-е гг.

Чем ближе та точка в истории психодиагностики, которая называется «сегодня», тем труднее говорить о событиях, происходящих в этой области психологического знания, выделить наиболее значительные из них. И в этом нет ничего удивительного. История – это, как хорошо известно, рассказ о прошедшем, узнанном. Когда же события, о которых нужно было бы писать, в силу их близости к настоящему времени автору неизвестны, а известные еще не получили должной оценки и понимания, что возможно только по истечении некоторого времени, складывается весьма своеобразная ситуация, подразумевающая возможность переосмысления этой истории. Эту возможность мы и оставляем за собой на будущее.

Опубликованный в 1992 г. одиннадцатый выпуск Ежегодника психических измерений содержал сведения о 477 коммерческих тестах (тесты, которые, в отличие от исследовательских, изданы и предназначены для продажи специалистам)*. Наибольшая часть этих тестов предназначалась для диагностики личности (28,3 %), тогда как на исследование интеллекта были ориентированы всего 4,6 % от общего числа новых тестов (напомним, что каждый новый выпуск Ежегодника не повторяет ранее опубликованные тесты за исключением случаев их переиздания или рестандартизации).

* Десятый выпуск «Ежегодника» вышел в свет в 1989 г.

Среди тестов для диагностики интеллекта по-прежнему первые по популярности места занимают предназначенные для разных возрастных групп шкалы Векслера. Эти шкалы совершенствуются: так в 1991 г. выходит третья редакция шкалы для детей (WISC-R), а в 1998 г. – третья редакция шкалы для взрослых (WAIS-III).

Продолжают разработку новых тестов для измерения интеллекта А. Кауфман и Н. Кауфман. В 1990 г. был опубликован «Краткий тест интеллекта Кауфмана»,состоящий из одного вербального и одного невербального субтестов и охватывающий возрастной диапазон от 4 до 90 лет. В 1993 г. этими исследователями предложен «Тест интеллекта подростков и взрослых Кауфмана».При разработке теста была предпринята попытка интегрировать теорию текучего и кристаллизованного интеллекта с взглядами других исследователей. Отличительной чертой теста является множество необычных и интересных заданий, привлекающих внимание обследуемых.

Следует упомянуть и о развитии в США «Британской шкалы способностей»,о которой уже упоминалось ранее. Ее пересмотренная и расширенная версия под названием «Дифференциальные шкалы способностей»была издана Элиоттом в 1990 г. В этих шкалах автор избегает понятия интеллекта и предпочитает говорить о специфических способностях. Теоретическое обоснование шкал носит эклектический характер; используется однопараметрическая модель теории «задание–ответ», что позволяет градуировать каждое задание по уровню трудности (используется стратегия адаптивного тестирования). В целом шкалы, благодаря множеству психометрических новшеств, характеризуются высокой сложностью проведения и обработки результатов, что может препятствовать их распространению. Новые взгляды на измерение познавательной деятельности нашли свое отражение и в «Системе когнитивной оценки», разработанной Дж. Дасом и Наглиери (1997). Задания, входящие в тест, определяющий так называемый когнитивный статус, предназначены для измерения основных познавательных функций, участвующих в научении, но, как предполагается, не зависимых от школьного обучения. Тест создан в соответствии с авторской моделью интеллекта, полагающей планирование, внимание, симультанную и сукцессивную обработку информации его важнейшими составляющими.

Не остаются забытыми и тесты для оценки познавательной деятельности младенцев. Среди наиболее интересных и вызвавших внимание исследователей можно назвать «Фэгена тест интеллекта младенцев»(Pagan Test of Infant Intelligence, 1992) и «Оценка возрастного развития младенцев и детей раннего возраста»(Infant- Toddler Developmental Assessment, 1995).

Интерес к проблеме интеллекта в том виде, как он измеряется тестами, оказался весьма устойчивым, и своеобразным итогом более чем двадцатилетних исследований в этой области была публикация «Энциклопедии человеческого интеллекта» (Encyclopedia of Human Intelligence, 1994). В то же время не прекращается воистину вечная дискуссия о врожденном (генетическом) и приобретенном в интеллекте. Выходит в свет книга американских психологов Ричарда Хернстайна и Чарльза Мюррея «Кривая "колокола"». Интеллект и классовая структура американского общества» (The bell curve: Intelligence and class structure in American life, 1994). Констатируя различия в IQ между разными этническими группами, населяющими США, авторы, полагая наследуемость интеллекта очень высокой, указывают на негативные общественные явления, связанные с появлением замкнутых элит и низших каст. Книга эта не только задела расовые чувства многих американцев, но и послужила, как пишет Анастази, еще большему укреплению разнообразных стереотипов и заблуждений, касающихся этнических и тендерных различий в выполнении тестов интеллекта, добавила путаницы и разногласий в этой сложной проблеме.

Процессы развития и использования личностных тестов не были столь дискуссионными в этот период. Незначительно, сравнительно с прошлым десятилетием, изменяется ситуация с популярностью личностных опросников. Анализ данных, содержащихся в PsyLit*, за период с января 1990-го по июль 1996 г. позволяет указать на следующие наиболее часто цитируемые опросники (табл. 1.1).

* PsyLit - база данных, издаваемая на лазерных дисках Американской психологической ассоциацией. Предоставляет информацию (резюме) о статьях, публикуемых примерно в 1300 психологических журналах более чем из 50 стран мира. Также включены резюме книг и глав из книг, посвященных психологии и смежным наукам. Информация обновляется каждые три месяца.

Таблица 1.1

Название личностного опросника Количество статей, в которых упоминается
Опросник депрессии Бека
Опросник для диагностики тревожности как черты и состояния
ММРI -2
Опросник Айзенка (EPQ)
Опросник общего здоровья
Опросник Айзенка (ЕРI)
Опросник 16 факторов личности
Опросник Миллона (I, II, III)

В 1992 г. публикуется вариант ММРI, предназначенный для обследования подростков – MMPI-A. Этот опросник, который начали разрабатывать в 1989 г., был стандартизирован на выборке, состоящей из 805 юношей и 815 девушек в возрасте от 14 до 18 лет. В опросник были включены новые шкалы: четыре шкалы валидности и шесть дополнительных шкал.

В 1990-е гг. в психодиагностике продолжается изучение роли ситуаций в поведении индивидуума. Естественно, что по большей части это относится не к обычным житейским ситуациям – основное внимание уделяется анализу поведения человека в сложных, стрессовых условиях. Разрабатываются и соответствующие диагностические инструменты. К изучаемым феноменам в первую очередь относятся посттравматические стрессовые расстройства,для измерения которых создаются многочисленные опросники. Все большее значение придается разработке инструментов, позволяющих оценить особенности реагирования на сложную ситуацию (защитные механизмы, совладающее поведение и др.).

Не теряют своего авторитета среди психологов и проективные тесты. Наряду с появлением новых, идет развитие уже известных. Преобладающей схемой интерпретации результатов по тесту Роршаха становится та, которая развивается в работах Дж. Экснера. В 1993 г. Экснер публикует нормативные данные, опирающиеся на обследование 700 нормальных взрослых и 1390 детей в возрасте от 5 до 16 лет. Ирвинг Вейнер, известный специалист по тесту Роршаха, отмечает, что за последние два десятилетия эта популярная методика превратилась в стандартный и надежный с точки зрения психометрии инструмент оценки личности, применение которого позволяет сделать множество обоснованных выводов. Сказанное относится к разработкам Дж. Экснера, носящим, как уже отмечалось ранее, отчетливую психометрическую направленность. В то же время остаются и сторонники качественного анализа результатов по тесту Роршаха, хотя их становится все меньше и меньше. Проходят очередные международные конгрессы, посвященные тесту Роршаха и проективным методикам (XIV – в 1990-м, XV – в 1996-м, последний, XVI конгресс, состоялся в 1999 г. в Амстердаме). Выходит в свет 23-й том пользующейся большой популярностью среди специалистов по проективным методикам «Роршахианы»(1999).

Сравнительный анализ популярности проективных тестов и личностных опросников показывает, что и за рамками клинической психологии проективная техника не утратила своего значения. Проведенный в США в 1990 г. опрос 64 руководителей консультационных психологических программ по вопросу использования тренинга личностной оценки при подготовке психологов-консультантов показал, что 45 % опрошенных используют в своих программах так называемую «объективную» личностную оценку, а 32 % – проективную. Для проведения «объективной» личностной оценки чаще всего используют ММРI, Калифорнийский психологический опросник и опросники Кеттелла. Для проективной личностной оценки применяют тест Роршаха, ТАТ и методики незаконченных предложений.

Начало 1990-х гг. отмечено значительным возрастанием числа тестов, использование которых предполагает наличие компьютера. Институт психических измерений Буроса сообщал о том, что количество таких тестов возрастает от 4 – в 1965 г. до 400 – в 1990 г. В то же время в большинстве своем это компьютеризированные уже известные тесты, а не тесты, специально разработанные с учетом возможностей компьютера (компьютерные тесты). К концу 1990-х гг. можно констатировать определенный спад интереса к компьютеризированным тестам, и не только потому, что зачастую возникают проблемы с их надежностью и валидностью. Многие психологи, прежде всего работающие в клинике, не удовлетворены предлагаемыми программами интерпретации получаемых результатов, вполне обоснованно полагая, что данная работа – задача диагноста.

В 1990-е гг. Центр психических измерений Буроса* начинает очередной проект – публикацию реферативных настольных книг по отдельным направлениям тестирования. В 1994 г. выходит том, посвященный психологической оценке в школе. Своеобразным подведением итогов развития психодиагностики в 1990-е гг. стали публикации очередного, тринадцатого, выпуска «Ежегодника психических измерений» (1998), в котором сообщается о 370 новых тестах (в 1999 г. выходит приложение к этому Ежегоднику) и двухтомного Tests in Print (1999). Нельзя не упомянуть и уникальное 6-томное издание (1995), посвященное некоммерческим тестам (тесты, которые не вышли за рамки научных исследований и не предназначены для продажи другим пользователям), осуществленное Американской психологической ассоциацией (Directory of Unpublished Experimental Mental Measures).

Все возрастающая заинтересованность правительственных органов США в применении психологических тестов приводит в 1993 г. к образованию Совета по тестированию и оценке. Главная задача этого Совета состоит в разъяснении разнообразным правительственным службам значения психологических тестов как орудий государственной политики. Опубликованные Советом отчеты свидетельствуют о том, что наибольшее значение американское правительство придает тестированию в области образования, а также совершенствованию имеющихся тестов.

* В 1994 г. Институт психических измерений Буроса был преобразован в Центр психических измерений Буроса, см. выше.

Итак, «1990-е гг. свидетельствовали о неуклонном повышении и расширении интереса к психологическому тестированию. На это указывает как разработка новых тестов, часть которых отражает принципиально новые подходы, так и непрекращающиеся исследования существующих тестов наряду с систематическим пересмотром их более ранних версий» (Анастази, Урбина, 2001, с. 12). Добавим также, что по завершению этого десятилетия закончился более чем столетний период развития психодиагностики. За это время значительный прогресс был достигнут в разработке методик, с помощью которых пытались измерять едва ли не все возможные проявления индивидуальности. Психодиагностика прошла как через пики популярности и признания, так и по низинам яростной критики и даже забвения в отдельных странах мира. В новое тысячелетие эта наука, как и вся психология, вошла с множеством нерешенных проблем, но с обоснованной убежденностью в возможности их решении.

1.4. Тестирование в образовании

Сразу оговоримся, что к собственно психологическим тесты образовательные (или тесты достижений) не относятся, поскольку направлены прежде всего на оценку степени усвоения того или иного учебного материала. Тем не менее разработка психологических тестов во многом влияла и на развитие инструментов оценки знаний, эти исследования шли рука об руку, в них участвовали психологи, а поэтому в истории психодиагностики нельзя обойти вниманием тестирование в сфере образования, которая была и остается основным потребителем психологических тестов. А. Анастази справедливо замечает, что в тестах достижений основной интерес сосредоточен на том, что индивид может делать к настоящему времени. Эти тесты, в отличие от тестов интеллекта и способностей, в основном оцениваются в терминах валидности по содержанию.

Самые ранние сведения о проверке успеваемости в европейской школе датируются примерно 1200 г. В это время университет Болоньи проводил первый устный экзамен на получение степени доктора философии. Это был единственный экзамен, который в то время сдавали студенты, и обычно продолжался он около недели. Интересно, что экзамен этот проходил в таверне, и студенты быстро установили традицию угощать едой и напитками как своих коллег, так и преподавателей. Естественно, что экзамен нередко переходил в пьяные ссоры и потасовки. Почти 500 лет такой устный экзамен оставался единственным видом «теста» на академическую успеваемость. В 1700 г. в Кембриджском университете устный экзамен был введен и для получения более низкой степени магистра. В начале XIX в. письменные экзамены становятся в Европе общепринятыми. В США первые письменные экзамены были введены в Массачусетсе в 1845 г.

Считается, что первопроходцем в области педагогического измерения был Реверенд Джордж Фишер, директор школы в Англии. Еще в начале 1860-х гг. этот педагог понял необходимость установления стандартов успеваемости в обучении. Для использования в своей школе Фишер разработал так называемые «книги шкал». Он присваивал значение единицы для выражения высшего показателя, который возможно достичь, и значение пяти для обозначения наименьших достижений в таких предметах, как правописание, математика, навигация, библия, французский язык, общая история, рисование и др.

Американский врач и психолог Дж. М. Райс (1857-1934) заслуживает признания как первый из тех, кто начал массовое тестирование в школе. Он изобрел три различных теста на правописание, которые использовал для проверки примерно 33 000 учеников 4-8-х классов, расположенных в 21 городе США. Отчет о результатах этого исследования был издан в 1897 г.

Этот отчет произвел фурор среди американских преподавателей. Одним из выводов исследования было то, что количество времени, проведенного в ежедневной тренировке по правописанию, не имеет непосредственной связи с успехами в нем (много позже по оригинальным данным Райса был рассчитан коэффициент корреляции равный -0,12) Из этого следовало заключение о том, что детей нужно не столько учить правописанию, сколько развивать их ум. Впоследствии Райс направил свое внимание на поиск инструментов, позволяющих оценить уровень овладения арифметикой. В 1902 г. он составил серию арифметических тестов для 4-8-х классов и провел их примерно с 6000 учащимися из 18 школ, расположенных в 7 городах. На следующий год был подготовлен языковой тест в форме презентации рассказа, по которому ученики должны были писать сочинение. Более чем 8000 учащихся из 9 различных городов писали такие сочинения. Они были оценены Райсом по изобретенной им пятибалльной шкале, которой, как известно, предстояло большое будущее. Однако работы Райса, несмотря на их новаторский характер, не были достойно оценены его современниками. Отцом измерения в образовании в США был признан Э. Торндайк.

Проявляя интерес к статистике, Торндайк совместно с Фоксом в 1903 г. опубликовал исследование, в котором были разработаны и использованы несколько тестов, связанных с арифметическими операциями. Целью их исследования было изучение взаимоотношений между различными арифметическими операциями. В том же году Торндайк издает книгу под названием «Образовательная психология» (Educational Psychology). В ней описывались те виды тестов, которые считались наилучшими для определения успеха в обучении.

Публикация этой книги ознаменовала появление новой области – образовательной психологии, в которой нашлось место и проблемам измерения. Разработке этих проблем посвящена ставшая классической работа Торндайка «Введение в теорию умственных и социальных измерений» (Introduction to the Theory of Mental and Social Measurements, 1904). Помимо статистических методов в этой книге обсуждались принципы построения тестов.

В декабре 1909 г. Торндайк представил научной общественности свою широко известную «Шкалу почерка».Эта шкала, по сути дела, была первым инструментом для измерения продукта образования. Торндайк собрал образцы почерков, которые классифицировались экспертами как различные по качеству. Для того чтобы образовать шкалу, он расположил эти образцы в порядке возрастания их качества. Шкала почерка Торндайка положила начало этапу стремительного развития тестов по многим образовательным предметам. Этому в немалой степени способствовал приток в США иммигрантов, обусловивший увеличение набора учащихся. Также возрастала необходимость в квалифицированных рабочих, что требовало их обучения и, конечно, развития инструментов для оценки его эффективности. К этому времени относится разработка арифметических тестов С. Стоуном, одним из последователей и учеников Торндайка. Широко известные как «Стандартные тесты Стоуна»,они внесли вклад в образовательное измерение и стали основой для исследований другого ученика Торндайка – С. А. Куртиса. Результатом усилий Куртиса стала «Серия арифметических тестов А»(1909). Позднее появляется значительно усовершенствованная серия В (1914).

При проверке бесплатных школ Нью-Йорка в 1910-1911 гг. впервые были использованы тесты для измерения успеваемости учеников как средство оценки эффективности школьной системы. Среди используемых в ходе этой проверки тестов (было обследовано более 30 000 учеников) были и тесты Куртиса. Они же были задействованы в последующих широкомасштабных исследованиях в Бостоне, Кливленде, других крупных городах США.

Среди других подготовленных Торндайком исследователей, внесших свой вклад в развитие образовательного измерения, был Б. Р. Букингем. В 1913 г. он разработал шкалу правописания, которая представляла новый тип измерительного инструмента. Уровни сложности 50 слов, отобранных для шкалы, были определены на основании процента правильных ответов учеников различных классов. После этого слова были расставлены в шкале в соответствии с их уровнем сложности. В шкалу вошли также 125 вспомогательных слов. Теоретической основой теста Букингема было положение о том, что способность к правописанию может быть измерена тем уровнем трудности, которую может достичь ученик по этой шкале. Принцип построения шкалы Букингема был использован Л. П. Айресом в его «Шкале правописания»,а также другими специалистами по образовательному измерению при создании тестов для разных предметных областей: С. Вуди – для тестов на математические операции; X. Г. Хотсом – для алгебры; В. А. С. Хенмоном и X. А. Брауном – для латыни, М. Р. Трабу – для языкознания, а также М. Дж. Ван-Вагененом – для тестов по истории.

Результаты тестовых исследований в крупных городах побуждают руководство школ к соответствующим нововведениям. В «Двенадцатом ежегоднике Национального общества по исследованию образования» (1913) впервые были даны официальные рекомендации по использованию тестов в школе. Руководство школ начинает активно использовать статистические методы. В университетах были разработаны специальные курсы для обучения статистическим методам будущих администраторов и технических специалистов в области образования. Основным учебником служило переработанное Торндайком «Введение в теорию умственных и социальных измерений» (1913).

Для содействия изучению работы школ независимыми организациями, городскими и окружными школьными департаментами, государственными отделами общественного обучения, а также университетскими центрами были созданы «Бюро образовательных исследований» под руководством выдающихся специалистов в развитии измерения. Это обеспечило прогресс в области школьных измерений. Этими Бюро предоставлялись услуги по обеспечению тестами персонала школ, проводилась стандартизация имеющихся тестов, создавались новые. Администрация и учителя школ знакомились с тестами и техникой их проведения. Продажа и использование тестов, по мнению Ашбо (1918), выросли до беспрецедентных размеров. Этот автор сообщал о том, что в 1916 г. было реализовано около 900 000 копий одного из популярных тестов, а ежегодная продажа некоторых других перевалила за 100 000 экземпляров. Использование тестов не ограничивалось пределами США. Они рассылались во многие страны мира. К 1918 г. В. С. Монро представил список 109 стандартизированных тестов на измерение успеваемости, которые уже были на рынке, включая 84 теста, созданных для младших классов (до 8-го класса включительно), а также 25 тестов – для старших классов. Большинство тестов для начальной школы составляли тесты на измерение успехов в математике и только один тест оценивал эффективность обучения рисованию. Тесты по иностранному языку лидировали среди тех, которые предназначались для старшеклассников.

Накануне Первой мировой войны тесты для измерения интеллекта были признаны как наиболее важные инструменты образовательной психологии. Интеллект стал особой областью исследования в образовательной психологии, и лидером этого направления также был Торндайк. В 1918 г. Торндайк формулирует принцип, на котором должно базироваться тестирование в образовании. Суть этого принципа состоит в том, что если нечто существует, то оно существует в определенном количестве. Обучение связано с изменениями в человеке; изменение заключается в различии между двумя ситуациями; каждая из этих ситуаций известна нам только по произведенному продукту – изготовленным вещам, произнесенным словам, выполненным действиям и т. п. Измерение любого из этих продуктов означает определение его количества таким образом, что в итоге мы будем знать его величину лучше, чем до измерения.

В течение 10 лет, предшествующих Первой мировой войне, а также какое-то время после нее Торндайк был своего рода оракулом образовательной психологии США, его взгляды на тесты и интеллект представлялись незыблемыми и не подлежали обсуждению.

Сегодня образовательные тесты обычно подразделяются на батареи общих достижений и тесты по конкретным учебным предметам. Батареи тестов общих достижений позволяют получить профиль показателей успешности по основным областям школьных знаний. Основное достоинство этих тестов в том, что исследователь имеет возможность сравнения основных результатов ученика, достигнутых в разных областях знаний. Иногда такое сравнение возможно и на достаточно длительных отрезках обучения, при переходе из класса в класс. Тесты по конкретным учебным предметам позволяют более глубоко проникнуть в структуру успешности усвоения определенной области знания, что особенно важно при специализации учащихся в какой-либо науке. На сегодняшний день, во всяком случае в США, наверное, очень трудно найти учебную дисциплину, по которой не существовало бы стандартизированного теста достижений. Помимо упомянутых тестов, в образовании используются близкие друг другу диагностические и критериально-ориентированныеметодики. Первые используются для выявления причин и анализа трудностей, возникающих в обучении, с помощью вторых ведется постоянная оценка степени овладения соответствующими навыками (о критериально-ориентированном тестировании см. выше).

Наши рекомендации