Стандартизованные тесты развития в ранней детстве
Шкалы развития младенцев Бейли.Наиболее разработанным тестом для самых ранних возрастных уровней являются Шкалы развития младенцев Бейли (Bayley Scales of Infant Development), иллюстрации из руководства к которым приведены на рис. 9-1. Эти шкалы, включающие в себя ряд заданий из Таблиц Гезелла и других тестов для младенцев и дошкольников, явились результатом многолетних научных изысканий Н. Бейли и ее коллег по университету в Беркли, включая лонгитюдные исследования в рамках проекта Berkeley Growth Study. В настоящее время пользователям доступна вторая редакция шкал Бейли (Bayley-H — Bayley, 1993).
Шкалы Бейли- II предусматривают три дополняющих друг друга инструмента для оценки уровня развития ребенка в возрасте от 1 мес. до 3,5 лет: Умственную шкалу (Mental Scale), Моторную шкалу (Motor Scale) и Шкалу оценки поведения (Behavior Rating Scale). Умственная шкала позволяет проводить выборочные замеры таких функций, как острота зрения и слуха, сенсорное и перцептивное различение, память, научение, решение задач (problem solving), вокализация, зачатки вербального общения и элементарное абстрактное мышление. Моторная шкала служит для измерения грубых
' Что касается самого свежего руководства к пересмотренной версии оригинальных Таблиц Гезелла, см. Knobloch, Stevens, & Malone (1980). Есть несколько других тестов, в названии которых используется имя Гезелла, но ни один из них не охватывает период младенчества. (См. TIP-IS/, где помешен список всех этих тестов, имеющихся в наличии в настоящее время, и 9-й выпуск MMY с критическими обзорами некоторых из них).
2 Краткое, но информативное изложение истории психологического оценивания детей дошкольного возраста можно найти в работе М. F. Kelley, & Surbeck (1991). По поводу других важных сведений ° тестировании младенцев и дошкольников см. Aylward (1994), Bracken (1991 b), Culbertson, & Will'5 (1993), Kamphaus (1993), С R. Reynolds, & Kamphaus (1990a), Vazquez Nutall, Romero, & Kalesnik (1992).
Глава 9. Тесты для специфических популяций
Задание 8. Поднимает голову — Поддерживание в положении на спине.
Задание 14. Корректирует положение головы при поддерживании на весу животом вниз.
Задание 33. Подтягивается в сидячее положение.
Рис. 9-1. Тестирование младенца: иллюстрации из руководства к Шкалам развития младенцев
Бейли — Вторая редакция (С упрощениями из Bayley, 1993, р. 143, 145, 150. Copyright © 1993 by The Psychological Corporation. Воспроизведено с разрешения)
моторных навыков, таких как умение сидеть, стоять, ходить и подниматься по ступенькам, а также навыков манипуляторнои деятельности рук и пальцев; помимо этого, Шкала включает задания для оценки сенсорной и перцептивно-моторной интеграции. В младенческом возрасте локомоторное и манипуляторное развитие играет важную роль во взаимодействии ребенка с окружающей средой и, следовательно, в развитии его умственных процессов. Оценочная шкала поведения предназначена для оценки различных аспектов развития личности ребенка, таких как эмоциональное и социальное поведение, объем внимания, уровень возбуждения (arousal), настойчивость и целеустремленность. Она содержит 5-балльную систему оценок для каждого задания и Набор дескрипторов (или отличительных признаков) для каждого оцениваемого вида Поведения. Оценочную шкалу поведения тестирующий заполняет после проведения Двух других частей теста на основе сведений, полученных от ухаживающего за ребенком взрослого, и с учетом собственных впечатлений.
Часть 3. Тестирование способностей
Шкалы Бейли выделяются среди других тестов для младенцев техническим качеством процедур конструирования заданий. Нормы для этих шкал были установлены на выборке объемом 1700 детей, по 50 девочек и 50 мальчиков в каждой из 17 возрастных групп от 1 до 42 мес. Выборка стандартизации комплектовалась таким образом чтобы дать репрезентативный срез населения США с учетом таких характеристик, как раса / этническая группа, основные географические районы проживания и образование родителей. В нее включались только нормальные, родившиеся в срок (не раньше 36 и не позже 42 нед. беременности) дети, не имевшие сколько-нибудь серьезных медицинских осложнений и не подвергавшиеся специальному лечению по поводу психических, соматических или поведенческих проблем. Умственная и Моторная шкалы дают отдельные индексы возрастного развития, выраженные в виде нормализованных стандартных показателей со средним, равным 100, и SD = 15. Эти индексы вычисляются в рамках возрастной группы, в которую попадает ребенок. Возрастные группы образуются с месячным интервалом до возраста 36 мес. и с 3-месячным интервалом для более старших возрастов. Шкала оценки поведения дает процентильные показатели, которые, в свою очередь, распределяются по трем категориям: «Неоптимальный» (Non-Optimal), «Сомнительный» (Questionable) и «В границах нормы» (Within Normal Limits). По результатам недавно проведенного сравнительного анализа нескольких шкал для оценки детей дошкольного возраста шкала Бейли-П была признана одним из двух тестов, отвечающих стандартам технической пригодности по большинству критериев1 (D. P. Flanagan, & Alfonso, 1995).
Бейли отмечала, что ее шкалы, как и все тесты для младенцев, следует использовать преимущественно для оценки текущего уровня развития, а не для предсказания последующих уровней способностей. На развитие способностей в столь раннем возрасте оказывает влияние такое множество промежуточных факторов, что предсказание на длительный период времени оказывается малоценным, в чем можно убедиться на основании данных, приведенных в главе 12.2
Со времени издания оригинальных шкал Бейли центр интересов в области тестирования развития младенцев переместился от оценивания нормальных детей раннего возраста к оценке детей с потенциальными или актуальными задержками развития. Хотя полезность шкал Бейли-П для клинических исследований далеко не исчерпана, в своем нынешнем виде эти шкалы уже включают задания, отобранные по критерию максимальной различительной способности в отношении нормальных и клинических выборок, а в руководствах к ним приводятся данные о специфических клинических популяциях. Таким образом, они должны быть полезными в обнаружении сенсорных и неврологических дефектов, эмоциональных нарушений и обусловленного средой дефицитарного развития. Кроме того, Айлвордом (Aylward, 1995) был подготовлен Скрининг-тест Бейли психоневрологического развития младенцев (Bayley Infant Ne-urodevelopmental Screener [BINS]), предназначенный для быстрой оценки психоневрологического статуса младенцев в возрасте от 3 до 24 мес. на основе использования комбинаций из 11-13 заданий шкалы Бейли-И и других неврологических тестов.
1 Другим оказалась Пересмотренная психопедагогическая батарея Вудкока—Джонсона: Тесты познавательной способности (Woodcock, & Johnson, 1989, 1990).
2 Обсуждение областей использования и ограничений тестов интеллекта младенцев см. в Goodman (1990). Серия статей о психометрических свойствах оригинальных шкал Бейли публикуется в R°' vee-Collier, & Lipsitt (1992).
Глава 9. Тесты для специфических популяций
Шкалы способностей детей Маккарти.Что касается дошкольного уровня, хорошо сконструированным инструментом являются Шкалы способностей детей Маккарти (McCarthy Scales of Children's Abilities [MSCA] — McCarthy, 1972), рассчитанные на возраст от 2,5 до 8,5 лет. Они состоят из 18 тестов, предоставляющих тестирующему богатые возможности для наблюдения подхода ребенка к разнообразным задачам и стимулам. Эти тесты сгруппированы в шесть частично перекрывающихся шкал: Вербальную, Наглядно-действенную (Perceptual-Performance), Количественную, Общую когнитивную (General Cognitive), Памяти и Моторную. Показатель Общей когнитивной шкалы, основанный на результатах 15 из 18 тестов данной батареи, наиболее близок традиционной глобальной мере интеллектуального развития. Этот Общий Когнитивный Индекс (General Cognitive Index, или, сокращенно, GCP) представляет собой нормализованный стандартный показатель, выражаемый в тех же единицах, что и традиционный IQ (со средним, равным 100, и SD = 16), и вычисляется в каждой возрастной группе (с интервалом группировки 3 мес). При разработке MSCA сознательно отказались от использования термина IQ из-за его многочисленных дезориентирующих коннотаций. GCI характеризуется как показатель деятельности ребенка во время тестирования и не подразумевает ничего такого, что связано с неизменяемостью или этиологией. Показатели по пяти дополнительным шкалам основаны на тех же возрастных группах и имеют среднее, равное 50, и SD = 10.
За два с лишним десятилетия, прошедших со времени издания шкал Маккарти, которые оказались наиболее подходящими для когнитивной оценки маленьких детей, был накоплен обширный массив данных исследований с применением этого инструмента. Особую ценность представляют многочисленные исследования, проведенные с детьми этнических меньшинств и подробно изложенные Валенсия (Valencia, 1990), а также богатейшие данные о валидности, собранные воедино им и Брэкеном (Bracken, 1991а). Что касается клинического использования шкал Маккарти, руководство к ним, подготовленное Кауфманами (Kaufman, & Kaufman, 1977), и по сей день остается обязательным пособием. По мнению многих критиков эти шкалы, несмотря на ряд слабых сторон, являются эффективным и полезным инструментом. Психометрические характеристики шкал Маккарти отвечают, по большей части, предъявляемым к ним требованиям, особенно в середине возрастного диапазона измеряемой совокупности.
Шкалы Пиаже
Будучи пригодными для изучения детей гораздо старше дошкольного возраста, эти шкалы, сконструированные на основе теорий развития Жана Пиаже, до сих пор в основном применяли при изучении раннего детства. Все эти шкалы находятся еще в стадии экспериментирования, и лишь небольшое их число издается и доступно для приобретения. По большей части их разрабатывал Ж. Пиаже для собственных программ исследования, хотя некоторые из этих шкал пригодны и для других исследовательских целей. Главный вклад шкал Пиаже в психологическое тестирование детей состоит в обеспечении теоретической системы, обосновывающей последовательность стадий развития процессов мышления, и создании процедуры оценивания, характеризующейся гибкостью и качественной интерпретацией.
Некоторые особенности шкал Пиаже в связи с нормативной интерпретацией выполнения теста обсуждались в главе 3. По существу, шкалы Пиаже являются порядковыми в том смысле, что они предполагают единую последовательность развития через
Часть 3. Тестирование способностей
следующие друг за другом стадии. Эти стадии, охватывающие период от младенчества до юности, получили следующие названия: сенсомоторная, дооперациональная конкретных операций и формальных операций. К тому же шкалы Пиаже соответствуют «критериально-ориентированному» подходу, поскольку дают качественное описание того, что в действительности может делать ребенок. Задачи Пиаже нацелены на изучение длительного развития у ребенка специфических понятий или когнитивных схем,1 а не широких черт. Что же касается применения, то основная цель шкал Пиаже — «выпытать» у ребенка объяснение наблюдаемого события и выявить причины, лежащие в основе его объяснения. Подсчет баллов обычно производится исходя из качества реакций ребенка на относительно небольшое число предъявляемых ему проблемных ситуаций, а не из количества или трудности успешно выполненных заданий. По этой причине наибольший интерес представляют как раз ошибочные представления ребенка, обнаруживающие себя в его неправильных ответах. Проводящий обследование сосредоточивает основное внимание на процессе решения задачи, а не на его результате.
Из-за крайне индивидуализированных процедур проведения тесты Пиаже особенно подходят для клинической работы. Наряду с этим они привлекают внимание педагогов, поскольку позволяют объединять тестирование и обучение. И все же наиболее часто их используют в исследованиях по психологии развития. Сами тесты можно разбить на две категории: 1) порядковые шкалы для младенческого периода и 2) задачи для оценки достижения дооперационального, конкретно-операционального и формально-операционального уровней. Существует несколько образцов каждого из этих тестов, а не так давно был опубликован обзор их использования в разнообразных исследовательских контекстах (D. Sexton, Kelley, & Surbeck, 1990). Ниже мы описываем по одному тесту каждого типа, выбранных отчасти по причине их доступности.
Порядковые шкалы психологического развития {Ordinal Scales of Psychological Development) были подготовлены Узгирисом и Хантом (Uzgiris, & Hunt, 1975). Другое название этих шкал, предназначенных для оценки приобретения когнитивных компетенций {cognitive competencies) в период от 2 нед. до 2 лет, — Шкалы психологического развития младенцев. Этот возраст приблизительно соответствует периоду, который Пиаже характеризовал как сенсомоторный и внутри которого он различал шесть стадий, или уровней. Чтобы повысить чувствительность своих методик, Узгирис и Хант распределили все ответы по более чем шести уровням, число которых варьирует в разных шкалах от 7 до 14. Комплект их тестов включает шесть шкал, получивших следующие названия:
1. Постоянство объекта (Object Permanence): о возникающем у ребенка представлении о независимо существующих объектах судят по зрительному слежению за объектом и стремлению отыскать объект после того, как его все более тщательно прячут.
2. Развитие средств (Development of Means) для достижения желанных целей во внешней среде: ребенок использует свои руки и такие средства, как бечевки, палки, подставки и т. д., чтобы достать заинтересовавшие его предметы.
3. Подражание (Imitation), в том числе имитация жестов и голоса.
1 «Схемы» — термин, обычно встречающийся в работах Ж. Пиаже и обозначающий, в сущности, структуру, в которой индивид упорядочивает поступающую сенсорную информацию.
Глава 9. Тесты для специфических популяций 269
4. Операциональная причинность (Operational Causality): ребенок осознает объективные причинные связи и сообразовывает с ними свои действия, как показывают его реакции — от зрительного наблюдения за собственными руками до вызывания желаемого действия со стороны человека или приведения в движение механической игрушки.
5. Отношения объектов в пространстве (Object Relations in Space): ребенок координирует схемы смотрения и слушания, чтобы определять местоположение объектов в пространстве, и понимает такие отношения, как емкость, равновесие, тяжесть.
6. Развитие схем (Development of Schemata) реагирования на объекты: ребенок реагирует на объекты рассматриванием, ощупыванием, манипулированием, выпусканием из рук, бросанием и т. д., а также используя социально поощряемые схемы обращения с конкретными предметами (например, «вождение» игрушечного автомобиля, строительство из кубиков, нанизывание бусинок, называние объектов).
Норм для этих шкал нет, но авторами собраны данные об их психометрических характеристиках, полученные в результате применения шкал к 84 младенцам, которые были детьми студентов-выпускников или сотрудников университета штата Иллинойс. Приведенные сведения о согласованности результатов тестов с данными наблюдения и данными повторного тестирования, проведенного через 48 ч, говорят, в целом, об удовлетворительности обеих этих характеристик. Также сообщается, что индексы ординальности (indices ofordinality), подсчитанные для каждой шкалы на основе показателей той же группы из 84 детей, являются вполне удовлетворительными.1
Хотя и подразумевалось, что Порядковые шкалы Узгириса и Ханта носят только предварительный характер, их широко использовали с исследовательскими целями.2 Первоначально эти шкалы предназначались для измерения влияния специфических окружающих условий на степень и ход развития младенцев. Исследования младенцев, воспитывавшихся в разных условиях, и младенцев, участвовавших в программах вмешательства, показали, что от этих средовых условий в значительной степени зависит тот средний возраст, в котором ребенок достигает разных ступеней, определяемых по шкалам развития. Эти и другие исследования, в которых Порядковые шкалы применяют для картирования когнитивного развития нормальных и отклоняющихся от «нормы» в ту или другую сторону младенцев, разбираются в книге под редакцией авторов этих шкал (Uzgiris, & Hunt, 1987). Последовательность приобретений, прослеживаемых с помощью этих шкал, касается главным образом интеракций младенца с неодушевленными предметами, рассматриваемых, в свою очередь, в качестве предшественников развития коммуникативного поведения и других адаптивных навыков (Dunst, & Gallagher, 1983; Kahn, 1987).
Процедуры измерения ординальности и применение шкалограммного анализа к шкалам Пиаже Достаточно спорны, и это необходимо иметь в виду при интерпретации любых сообщаемых индексах Порядка, относящихся к таким шкалам (F. H. Hooper, 1973; А. С. Rosenthal, 1985).
Потенциальная ценность этих шкал при проведении клинической оценки также широко признается; Важным шагом в направлении признания этого потенциала стала публикация руководства и форм Подсчета баллов, специально предназначенных для применения шкал Узгириса и Ханта в клиниче-ском и педагогическом контекстах (Dunst, 1980).
Часть 3. Тестирование способностей
Другой рассматриваемый нами образец инструментария Пиаже — «Комплект для оценки понятий: Сохранение» (Concept Assessment Kit — Conservation [САК]) — тест официально распространяемый издателями на тех же условиях, что и другие психологические тесты. Рассчитанный на детей от 4 до 7 лет, этот тест измеряет овладение одним из наиболее известных понятий, используемых в системе Пиаже, — понятием «сохранение». Сохранение относится к пониманию ребенком, что такие свойства объектов, как вес, объем и количество, остаются неизменными, даже если объекты меняют форму, расположение, внешний вид или другие отличительные признаки. Авторы этого теста (Goldschmid, & Bentler, 1968b) выбрали понятие «сохранение» как показатель перехода ребенка от стадии дооперационального мышления к стадии конкретных операций, происходящего, по мнению Пиаже, в возрасте 7-8 лет.
Процедура проведения всего теста одинакова. Ребенку показывают два идентичных объекта, затем тестирующий производит в одном из них определенные преобразования и спрашивает ребенка, одинаковы объекты или различны. Ребенка просят пояснить свой ответ. В каждом задании 1 балл дается за правильное суждение об эквивалентности объектов и 1 балл — за приемлемое объяснение. Например, тестирующий берет два обычных стакана с равным количеством воды (континуальное количество) или с зернами кукурузы (дискретное количество) и выливает (или высыпает) содержимое либо в плоскую тарелку, либо в несколько других стаканов, меньших по величине. В другой задаче ребенку показывают два одинаковых пластилиновых шарика и затем расплющивают один, придав ему форму блина. Ребенка спрашивают, равны ли по тяжести «шар» и «блин».
Имеются три формы теста. Формы А и В параллельны и содержат по шесть задач на сохранение: Двумерное пространство, Число, Вещество, Континуальное количество, Дискретное количество и Вес. Корреляция между показателями по этим двум формам равна 0,95. Форма С включает две другие задачи: Площадь и Длина, — и дает корреляции с формами Л и В 0,76 и 0,74 соответственно.
Нормы были установлены на выборке стандартизации, включавшей 560 мальчиков и девочек в возрасте от 4 до 8 лет из школ, центров ухода за детьми в дневное время и центров Head Start в Лос-Анджелесе (Калифорния). Эти нормы следует рассматривать лишь как предварительные ввиду малого числа испытуемых в каждой возрастной группе и недостаточной репрезентативности выборки. Средние показатели для каждой возрастной группы обнаруживают систематическое повышение с возрастом, причем особенно резкий подъем отмечается между 6 и 8 годами, что и предсказывает теория Пиаже.
Авторами С А К проведен многоцелевой статистический анализов результате которого были определены различные типы надежности (ретестовая, параллельных форм, Кьюдера—Ричардсона, а также надежность оценщика); получены оценки шкалируемое™ (scalability), или ординальности, а также факторная структура (см. также Goldschmid, & Bentler, 1968a). Результаты, хотя они и получены на относительно малых выборках, в общем, свидетельствуют об удовлетворительной надежности, подтверждают ординальность шкалы и указывают на присутствие значительного общего фактора (common factor) сохранения во всех задачах.
Сравнительные исследования, проведенные в семи странах, подтвердили, что тест пригоден для применения в разных культурах, дает высокие коэффициенты надежности и выявляет приблизительно одни и те же тенденции возрастного развития (Goldschmid et al., 1973). Но в разных культурах и субкультурах были обнаружены различия
Глава 9. Тесты для специфических популяций 271
в среднем возрасте овладения понятиями, — т. е. возрастная кривые могут смещаться по горизонтали на один или два года (см. также Figurelli, & Keller, 1972; Wasik, & Wasik, 1971). Было обнаружено, что тренировка в решении задач на сохранение значительно улучшает показатели (см. также Goldschmid, 1968; B.J. Zimmerman, & Rosenthal, 1974a, 1974b). В руководстве к САК приводятся внушительные данные о конст-руктной валидности этого теста, которые, в целом, подтверждают в своем недавнем исследовании Ф. Кэмпбелл и Рэйми (F. A. Campbell, & Ramey, 1990).
Оценка пиажетианского подхода.Споры по поводу теоретических основ и эмпирической обоснованности подхода Пиаже к когнитивному развитию продолжаются до сих пор (см., например, Inhelder, de Caprona, & Cornu-Wells, 1987; Liben, 1983; Su-garman, 1987). По-прежнему нет окончательных ответов на вопросы о значении эффектов обучения и о влиянии кросс-культурных различий на интерпретацию пиаже-тианских стадий развития. Главное препятствие, с которым приходится сталкиваться при идентификации стадий с помощью порядковых шкал, заключается в том, что пиажетианцы называют декаляжем (decalage),x или нарушениями ожидаемого порядка следования. Непрерывно растет корпус данных, подвергающих сомнению последовательность и регулярность хода интеллектуального развития. Слишком часто стадия, соответствующая результатам конкретного ребенка, изменяется вместе с изменением задачи, причем не только в тех случаях, когда для ее решения необходимы другие способы, но и тогда, когда те же способы применяются к другому содержанию (Dasen, 1977; Goodnow, 1976; Horn, 1976; McV. Hunt, 1976).
Следует также отметить, что шкалы Пиаже коррелируют в значительной степени со стандартизованными тестами интеллекта (Gottfried, & Brody, 1975; Kaufman, 1971; М. Е. Sexton, 1987), и в той же мере коррелируют с учебными достижениями первоклассников, как и групповой тест интеллекта (Kaufman, & Kaufman, 1972). Такое перекрытие получило прочное подтверждение со стороны независимых исследователей, работавших с разными инструментами (Humphreys, Rich, & Davey, 1985). Эти результаты говорят о том, что несмотря на явные различия в методологии шкалы Пиаже, стандартизованные тесты интеллекта и меры учебных достижений имеют много общего. К тому же каждый из подходов вносит неповторимые и ценные элементы в общую оценку детей. Шкалами Пиаже труднее пользоваться, и они требуют существенно больше времени для обследования детей, но они дают гораздо более богатую картину того, что может делать ребенок и как он это делает, особенно когда эти шкалы используются в сочетании с критериально-ориентированными и нормативно-ориентированными мерами (D. Sexton et al, 1990).
Современные исследования умственной деятельности маленьких детей представляют собой быстро развивающуюся область. Получаемые в них эмпирические результаты способствуют пересмотру и расширению ранних концепций Пиаже (см., например, Butterworth, Harris, Leslie, & Wellman, 1991; Whiten, 1991). Фактически, в наше время существует ряд новых подходов, объединенных под названием «неопиа-Жетианского», которые занимаются изучением проблем когнитивного развития в Перспективе, определяемой различными комбинациями положений теории Пиаже и теории обработки информации (Beilin, & Pufall, 1992; Demetriou, 1988). В области
Буквально: «расклинивание» (unwedging), или расхождение теоретически ожидаемого паттерна Реакций.
Часть 3. Тестирование способностей
психологической оценки некоторые исследователи- «неопиажетианцы» объединяют разнообразные динамические подходы и, используя промежуточное обучение в формализованной манере, пытаются оценить чистую умственную способность (mental capacity) с минимальной опорой на предыдущие знания индивидуума (Pascual-Leone, & Ijaz, 1991). Эти методики, которые пока еще носят экспериментальный характер, по расчетам их создателей должны быть применимы как к маленьким детям (в возрасте 2-3 лет), так и к представителям разных культур, социальных слоев и языковых групп.