Дифференциальные шкалы способностей
Дифференциальные шкалы способностей (Differential Ability Scales [DAS] — С. D. Elliott, 1990a, 1990b) представляют собой пересмотренную и расширенную версию Британских шкал способностей (British Ability Scales [BAS]), разработанную в Великобритании в 1970-х гг. (Elliott, Murray, & Pearson, 1979). С современными версиями шкал Стэнфорд—Бине и Векслера DAS роднят общие цели классификации людей по общему уровню способностей и получение индивидуальных профилей сильных И слабых сторон их интеллектуальной деятельности. Однако в том, что касается проце-
Глава 8. Индивидуальные способности
дур и технических характеристик, DAS нетрадиционны, поскольку в них реализованы многие достижения психометрической теории и практики, не коснувшиеся других шкал. В этой связи заслуживает внимания утверждение автора в предисловии к руководству по DAS, что термины «интеллект» и «7Q» не входят в состав терминологии Дифференциальных шкал способностей (Elliott, 1990a, p. vi). В значительной степени структура шкалы, подсчет баллов и интерпретация результатов ориентированы на точно определяемые виды поведения (behaviors), которые фактически и оцениваются. Такое открытое заявление, впервые появляющееся в руководстве к шкале общих способностей, должно помочь рассеять стереотипы и ошибочные представления, связанные с широким употреблением этих терминов.
Описание.Батарея DAS создавалась, главным образом, для измерения специфических способностей {specific abilities) с приемлемой надежностью, чтобы оказывать помощь в достижении более сложных целей индивидуального оценивания, а именно дифференциальной диагностики и планирования вмешательства. Выбор задач, включенных в эту батарею, осуществлялся как по теоретическим соображениям, так и на эмпирической основе. Теоретическое обоснование DAS носит эклектический и гибкий характер. В основу батареи положен иерархический подход к умственным способностям, позволяющий выбирать различные уровни обобщенности и обеспечивающий широкую информационную базу для выведения гипотез об отдельных испытуемых. Эта структура прекрасно согласуется с эмпирическими данными о развитии когнитивных способностей. В отличие от более ранних шкал, втискивавших данные в теоретическую модель независимо от степени соответствия, батарея DAS сохранила только те составные части, для которых имеет место сходимость теоретического и эмпирического обоснований.
Как показано на рис. 8-5, DAS состоят из 20 субтестов, организованных в три главные компоненты: 1) основные субтесты, 2) диагностические субтесты и 3) тесты достижений. Названия этих тестов и субтестов описывают содержащиеся в них задачи и, в основном, не требуют пояснений. Двенадцать основных и пять диагностических субтестов составляют когнитивную батарею (cognitive battery), подразделяемую внутри себя на два уровня: дошкольный и школьного возраста. На дошкольном уровне в нее входят четыре основных субтеста для детей в возрасте от 2;6 до 3;5 и шесть основных субтестов для детей в возрасте от 3;6 до 5; 11.1 На уровне школьного возраста (от 6;0 до 17; 11) в батарею входят шесть основных субтестов. Для каждого возрастного уровня, путем суммирования показателей основных субтестов, находят показатель Общей Концептуальной Способности (General Conceptual Ability или, сокращенно, GCA), играющий роль общего суммарного показателя в этой батарее. Тесты, входящие в группу под названием «основные субтесты» (core subtests) батареи DAS, имеют высокие нагрузки по общему фактору (g) батареи. С другой стороны, диагностические субтесты имеют низкие корреляции с фактором g и не объединяются в групповые факторы; это означает, что они измеряют относительно независимые способности. Когда целесообразно использовать диагностические тесты, возможность их применения в возрасте от 2 до 5 лет зависит от возрастного уровня. Наконец, батарея
При указании возраста для отделения количества лет от количества месяцев часто используют т°чку с запятой: «2;6» означает «2 года 6 месяцев». В этой книге такая форма записи будет использована всякий раз, когда возникнет потребность в перечислении последовательности возрастов.
Глава 8. Индивидуальные способности
GCA = Общая Концептуальная Способность
Обычный возрастной диапазон
Расширенный возрастной диапазон
За пределами уровня:Только для тестирования детей со средним или высоким уровнем
способности Только для тестирования детей со средним или низким уровнем способности
Рис.8-5. Организация Дифференциальных шкал способностей (С упрощениями из Elliott, 1990b, p. 4. Copyright © 1990 by The Psychological Corporation.
Воспроизведено с разрешения издателя)
содержит три теста достижений, которые обычно проводятся начиная с шестилетнего возраста.
Как можно увидеть на рис. 8-5, некоторые субтесты в каждой их трех составных частей DAS могут предъявляться — и должным образом интерпретироваться — за пределами возрастного уровня, на который они обычно рассчитаны. Результаты выполнения субтестов, предназначенных для «расширенного возрастного диапазона» (extended age range) и использования «за пределами уровня» (out of level), могут сравниваться с нормами, основанными на выборках соответствующего возраста, собранными в процессе стандартизации DAS. Субтесты, входящие в категорию «длярасширенного возрастною диапазона», могут использоваться как дополнительные диагностические меры, когда их содержание релевантно цели обследования данного индивидуума. Например, субтест «Складывание кубиков» (Block Building) можно давать детям в возрасте от 3;6 до 4; 11 с целью получения более полной информации о перцептивных и тонких моторных навыках, чем та, которую позволяет получить основная батарея в этом возрастном диапазоне. С другой стороны, субтесты, нормированные для тестирования «за пределами уровня» (на рис. 8-5 помечены буквами Н или L), предназначены только для обследуемых с уровнями способности «от среднего до вы -сокого» или «от среднего до низкого». Преимущество этой конструктивной особенности DAS заключается в том, что батарея позволяет проводящему тестирование с беспрецедентной точностью оценивать способности тех, кто действует на необычайно высоком или низком для своего возраста уровне.
Шкалирование и нормирование.Главная причина концептуальных и технических достоинств DAS состоит в том, что эта батарея вобрала в себя совокупные результаты исследовательской и теоретической работы, проделанной во время разработки ее предшественника, батареи BAS. Проектирование, составление и стандартизация BAS велись на протяжении примерно двух десятилетий, отмеченных важными достижениями в психометрической теории и практике. Таким образом DAS является новым инструментом, многие характеристики которого отвечают самым современным требованиям, хотя он и отражает знания и опыт, приобретенные в период с1960-х по 1980-е гг.
Стандартизацию DAS можно считать образцовой с точки зрения как объема выборки, так и тщательности ее комплектования. Выборка включала 3475 испытуемых, т- е. гораздо больше, чем это обычно бывает в случае стандартизации индивидуально Проводимого теста. Предполагалось обеспечить ее репрезентативность относительно
Часть 3. Тестирование способностей
изучаемой совокупности всех владеющих английским языком лиц в возрасте от 2;6 до 17; 11, проживавших в США в период сбора данных (1987-1989) в домашних условиях (noninstitutionalized). Стратификация выборки проводилась, главным образом по возрасту, полу, расе/этнической принадлежности, образованию родителей и географическому району проживания. Цифры, характеризующие изучаемую совокупность, основывались не на одной, отдельно взятой демографической переменной, как это бывает в типичном случае, а на составных переменных. Например, выборочное распределение белых семей с северо-востока США по образованию родителей приближалось к соответствующему распределению таких семей в совокупности населения северо-восточных штатов. Контрольные цифры рассчитывали по «сырым» данным, полученным от Бюро переписи населения США за самый последний период на момент проведения стандартизации DAS. Хотя выборка стандартизации и была репрезентативной относительно расового и этнического состава изучаемой совокупности (использовалось четыре категории: черные, испаноязычные, белые и прочие), дополнительно было собрано примерно 300 и 600 протоколов тестирования черных и испаноязычных детей исключительно для анализа систематической ошибки, обусловленной культурными факторами. Ученики из специальных классов, таких как классы для детей со слабыми дефектами или для особо одаренных детей, не исключались из нормативной группы, которая по замыслу исследователей должна включать полную совокупность школьников, а не только «нормальную» группу.
В ZM5 использована однопараметрическая модель теории «задание—ответ» (IRT),1 что делает возможной градуировку каждого задания по уровню трудности. В результате можно использовать стратегию адаптивного тестирования, т. е. обследовать испытуемых с помощью заданий, наиболее подходящих для их уровня способности. Индивидуальный показатель основан на учете количества и уровня трудности выполненных испытуемым заданий. Эти данные наносили на общую, ненормативную шкалу, которую использовали для преобразования первичных показателей по каждому субтесту в показатели способности. Для выявления и исключения заданий, противоречащих данной модели, применялся статистический критерий согласия, основанный на соответствии между предсказанными и наблюдаемыми ответами на задания. Все это позволило создать более однородные наборы заданий.
При применении DAS в реальной работе стратегия адаптивного тестирования реализуется при помощи выделенных начальных точек (основанных на возрасте), точек принятия решения (основанных на результатах выполнения заданий от начальной точки до точки принятия решения) и альтернативных правил остановки (для каждого субтеста своих). Наборы заданий, заключенных между этими точками, определялись эмпирически, путем достижения наиболее выгодного баланса между надежностью и длиной теста. Главное достоинство стратегии адаптивного тестирования с помощью DAS заключено в гибкости, позволяющей тестирующему подбирать задания субтестов, подходящие для каждого тестируемого. А то, что при этом можно получить оценки способности исходя из общей шкалы трудности заданий, даже когда проводились субтесты с различными заданиями, дает пользователям дополнительное преимущество в виде допустимости сравнений показателей измеряемой данным субтестом способности у разных лиц или у одного и того человека при разных обстоятельствах. Эта характерная особенность делает DAS, как и другие инструменты, построенные ана-
1 Пояснение см. в главе 7.
Глава 8. Индивидуальные способности
логичным образом, особенно подходящими для генетических исследований, использующих лонгитюдные стратегии или метод поперечных срезов.
После того как получены показатели способностей, измеряемых субтестами когнитивной батареи, их можно преобразовать в нормализованные стандартные показатели со средним 50 и SD = 10 (Т-показатели) или в процентильные эквиваленты. Оба типа показателей доступны для каждой возрастной группы. В тестах достижений вместо Г-показателей используют стандартные показатели со средним 100 и SD - 15, а вместо процентилей распределения по возрасту — процентили распределения по школьным классам. Для всех субтестов DAS можно также получить показатели в форме эквивалентных возрастов, а для тестов достижений — в форме эквивалентных классов. Эти эквиваленты указывают возраст (или класс), в котором показатель способности тестируемого соответствует медианному показателю. Поскольку используемые в DAS меры когнитивных способностей и меры достижений разрабатывали и нормировали одновременно, нормативные сравнения, возможные благодаря всем этим преобразованиям показателей, позволяют пользователям обращаться к широкому множеству вопросов, уместных при скрупулезном исследовании индивидуальных проблем.
Показатели основных субтестов DAS складываются для получения соответствующего комбинированного показателя (или показателей) на любом из возрастных уровней. Все комбинированные показатели выражаются в виде стандартных показателей со средним, равным 100, и SD =15. Как показано на рис. 8-6, для самых маленьких детей (от 2;6 до 3;5) можно получить только один комбинированный показатель — показатель GCA; в возрастном диапазоне от 3;6 до 5; 11 батарея DAS, в дополнение
Рис. 8-6. Комбинированные показатели когнитивной батареи DAS
(Из Elliott, 1990b, p. 21. Copyright © 1990 by The Psychological Corporation.
Воспроизведено с разрешения издателя)
Часть 3. Тестирование способностей
к показателю GCA, дает еще два групповых показателя {cluster scores): показатели Вербальной и Невербальной способности (Verbal and Nonverbal Ability). Для всех испытуемых школьного возраста (от 6;0 до 17; 11) можно получить три групповых показателя-Вербальной способности (Verbal Ability), Способности невербального рассуждения (Nonverbal Reasoning Ability) и Пространственной способности (Spatial Ability). Кроме того, посредством экстраполяции отношений между «сырыми» результатами и показателями GCA в разных возрастах можно расширить использование норм GCA до уровней выполнения существенно ниже обычных норм. Это было предусмотрено с целью облегчить оценку лиц с сильной задержкой развития, которые по всей вероятности не были представлены в нормативной выборке.
Надежность и валидность.Показатели надежности DAS при сравнении с таковыми у других тестов интеллекта выглядят в благоприятном свете. Коэффициенты рете-стовой надежности GCA и групповых показателей, при интервалах между тестированиями от 2 до 7 недель, колеблются от 0,79 до 0,94. Что касается субтестов, то сопоставимые оценки ретестовой надежности варьируют здесь от 0,38 до 0,94, с подавляющим большинством, попадающим в интервал от 0,60 до 0,90. Индексы надежности как внешней согласованности оценок (Intenater reliabilities) для субтестов со свободными ответами, подсчет баллов в которых в значительной степени опирается на субъективные суждения,1 группируются около 0,95.
Надежность DAS в плане внутренней согласованности оценивалась посредством применения теории «задание—ответ» (IRT). Эта процедура позволяет вычислять точные значения надежности и ошибок измерения, соответствующие каждому возможному показателю по субтесту. Полученные результаты, широко варьирующие от края к краю спектра каждой способности, подтверждают хорошо знакомую тенденцию коэффициентов надежности быть ниже для лиц на краях распределения показателя, чем для лиц, группирующихся в центре. Что касается DAS, оценки надежности как внутренней согласованности, вычисленные по всем предусмотренным возрастным уровням, колеблются для субтестов от 0,66 до 0,95, для групповых показателей — от 0,86 до 0,94, и для показателей GCA — от 0,89 до 0,96. В руководстве по DAS, кроме того, проводятся некоторые сравнения коэффициентов внутренней согласованности, полученных на основе IRTn традиционным способом. В этих случаях имеет место близкое соответствие значений коэффициентов, найденных обоими методами.
Валидность DAS исследовались и с внутренней, и с внешней точек зрения. Что касается внутренней валидности, для установления структуры показателей D AS (см. рис. 8-6) применялся разведочный и подтверждающий факторный анализ. Оба типа анализа дали весьма близкие результаты, которые, в целом, могут служить еще одним подтверждением ранее установленного факта прогрессирующей дифференциации способностей с возрастом (Anastasi, 1970). Однофакторная модель, включающая четыре основных субтеста, используемых для получения показателя GCA в возрастном диапазоне от 2;6 до 3;5, лучше всего согласуется с данными детей этой возрастной группы. Для детей в возрасте от 3;6 до 5;11 лучшим оказалось двухфакторное решение. В этом возрастном диапазоне фактор невербальной способности определялся, в основном, высокими нагрузками по таким субтестам, как «Составление фигур» й
' Речь идет о таких субтестах, как «Определения слов», «Аналогии», «Копирование» и «Воспроизве дение образцов по памяти».
Глава 8. Индивидуальные способности
«Копирование», а фактор вербальной способности — главным образом высокими нагрузками по субтестам «Вербальное понимание» и «Называние». На уровне школьного возраста (6;0-17; 11) интеркорреляции между показателями основных тестов лучше всего объясняла трехфакторная модель, охватывающая три способности: вербальную, невербального рассуждения и пространственную. Показатели пяти диагностических субтестов DAS не включались в комбинированный показатель GCA или в групповые показатели. Эти субтесты состоят в основном из задач, требующих памяти и скорости обработки информации. То, что диагностические субтесты имеют незначительные нагрузки по общему фактору (g) и значительную величину специфической дисперсии, делает их идеально подходящими для выявления сильных и слабых сторон индивидуума.
Обширные данные по внешней валидности DAS описаны в руководстве к этой батарее. К главным источникам таких данных относятся: 1) корреляции между разными показателями DAS (включая показатели субтестов) и показателями комплексных батарей способностей, таких как шкалы Стэнфорд—Бине и Векслера; 2) корреляции показателей субтестов DAS с показателями других тестов специфических когнитивных способностей и академических достижений, наподобие Словарного теста в картинках Пибоди (Пересмотренная версия — PPVT-R) и Тестов овладения чтением Вуд-кока (Пересмотренная версия — WRMT-R), а также со школьными оценками; 3) исследования профилей показателей /_Х45для специфических популяций: одаренных, испытывающих трудности в обучении и умственно отсталых. Все эти источники данных, в общем, подтверждают иерархическую структуру DAS, а также сравнимость комбинированных и частных (по субтестам и тестам достижений) показателей с аналогичными мерами. Валидность диагностических субтестов в отношении выявления подгрупп детей с трудностями в обучении хотя и выглядит достаточно убедительно, требует дополнительного исследования.
Общая оценка.Как было отмечено другими авторами (Aylward, 1992; Reinehr, 1992), сложность процедур проведения и подсчета показателей £>Л5может затормозить распространение и использование этой батареи для решения прикладных задач. Кроме того, поскольку DAS является относительно новым и не прошедшим клинические испытания инструментом, ему еще нужно будет на деле доказать свою ценность. Дополнительное ограничение связано с предельным возрастом обследуемых (т. е. 2;6 и 17;11), для которых минимальный и максимальный уровень трудности заданий соответственно может оказаться недостаточным. Несмотря на все это, DAS — измерительный инструмент, отвечающий в своей группе «современному состоянию психометрии» и до сих пор непревзойденный в отношении тех возможностей и преимуществ, которые он предоставляет своим пользователям. Иерархическая структура этой батареи, многообразие охватываемых ей способностей и та надежность, с кото-Рой она позволяет их оценивать, дают пользователю беспрецедентную гибкость в работе. В частности, проводящий тестирование может выбрать из широкого ассорти-Мента задач те, которые лучше всего подходят для целей обследования и максимально отвечают потребностям тестируемого. Еще одной отличительной особенностью DAS является превосходное качество методического сопровождения этой батареи в виде ^вУх обширных руководств: Differential Ability Scales: Administration and scoring manu-?» (Elliott, 1990a) и Differential Ability Scales: Introductory and technical handbook (El-l0tt, 1990b). Последнее, в особенности, освещает практически все вопросы, какие
Часть 3. Тестирование способностей
только могут возникнуть у пользователей, и с предельной точностью, ясностью и лаконичностью сообщает множество полезных сведений. Оно должно быть исключительно полезным для будущих пользователей батареи, особенно тех, кто хочет ближе познакомиться с теоретическими и практическими достижениями в области изучения интеллекта и его измерения, которые так хорошо представлены в итоговом продукте — Дифференциальных шкалах способностей.