Измерение множественных способностей
Традиционные тесты интеллекта, независимо от того, проводились ли они индивидуально или с группами, разрабатывались для получения одной-единственной, глобальной меры общего уровня когнитивного развития индивидуума, такой как IQ. Вскоре, однако, и практические, и теоретические результаты работы с ними привлекли внимание к ряду дифференцируемых способностей внутри того рыхлого конгломерата, который характеризовался с помощью первых тестов интеллекта. Это привело, с одной стороны, к конструированию отдельных тестов для измерения нескольких широко применимых способностей, а с другой — к уточнению определения и более полному пониманию того, что измеряли сами тесты интеллекта.
Росту интереса к измерению различных способностей способствовал ряд событий. Во-первых, происходило все большее осознание интраиндивидуальной вариации результатов выполнения тестов интеллекта. Грубые попытки сопоставить относительное положение индивидуума по разным субтестам или группам заданий многие годы предшествовали созданию батарей для оценки комплекса способностей или, короче, комплексных батарей способностей. Сами тесты интеллекта, однако, не предназначались для этой цели. Их субтесты или группы заданий часто были слишком ненадежны для того, чтобы можно было обоснованно проводить интраиндивидуальные сравнения. Кроме того, при конструировании тестов интеллекта задания или субтесты выбирались обычно таким образом, чтобы давать унитарную и внутренне согласованную меру. Поэтому при таком отборе все усилия прилагались к минимизации, а вовсе не к максимизации интраиндивидуальной вариации. Субтесты или задания, слишком слабо коррелирующие с остальной шкалой, как правило, исключались из теста. Хотя, вероятно, именно такие субтесты и задания как раз и следовало сохранить, если бы акцент ставился на дифференциации способностей. Вследствие такого способа конструирования большинства тестов интеллекта маловероятно, чтобы деятельность по выполнению этих тестов можно было значимо разделить более чем на две категории, таких как вербальная и невербальная или лингвистическая и количественная.
Дополнительным стимулом разработки комплексных батарей способностей послужило постепенное осознание того, что так называемые тесты общего интеллекта в действительности являются менее общими, чем первоначально предполагалось. Вскоре стало очевидным, что многие из этих тестов на самом деле служили средствами измерения вербального понимания. Определенные области, такие как область механических способностей, обычно в них не затрагивались, за исключением некоторых Шкал действия и неязыковых шкал. По мере того как эти ограничения тестов интеллекта становились все очевиднее, психологи начали уточнять сам термин «интеллект». Одни из них предложили разграничивать «академический» и «практический» интеллект. Другие стали говорить об «абстрактном», «техническом» и «социальном» интеллекте. В дополнение к тестам интеллекта начали также конструировать тесты Специальных способностей» (special aptitude). Однако более тщательный анализ показал, что, вообще говоря, тесты интеллекта сами измеряют определенную комбинацию специальных способностей, таких как вербальные и числовые способности.
Мощный импульс развитию дифференциального тестирования способностей был
"Ридан также ростом активности психологов, работающих в сфере профконсультиро-
6ания и планирования карьеры, а также занятых отбором и распределением персонала
Промышленности и вооруженных силах. Самые ранние разработки специализиро-
Часть 3- Тестирование способностей
ванных тестов для отбора конторских служащих, инженерно-технических работников и представителей ряда других профессиональных областей как раз и служат отражением таких интересов. Составление тестовых батарей для отбора абитуриентов поступающих на медицинский, юридический, инженерно-технический, зубоврачебный и другие факультеты университетов, представляет собой аналогичную линию развития тестирования, сохранявшуюся в течение многих лет. Более того, ряд дифференциальных батарей способностей, таких как батареи, подготовленные военными и Управлением размещения и регулирования рабочей силы США ( U. S. Employment Service), были прямым результатом деятельности специалистов, занимавшихся профотбором или распределением персонала.
Наконец, исследования структуры черт с помощью методов факторного анализа1 обеспечили теоретическую основу для конструирования комплексных батарей способностей. Благодаря таким исследованиям появилась возможность систематически выявлять, классифицировать и определять разнообразные способности, связанные между собой весьма слабо, единственно за счет применения к ним общего термина «интеллект». Теперь тесты можно было отбирать таким образом, чтобы они являлись наилучшими из имеющихся средств измерения одного из факторов или одной из черт, выявляемых путем факторного анализа. ,
Дифференциальные тесты способностей.Одной из наиболее широко используемых комплексных батарей способностей являются Дифференциальные тесты способностей (Differential Aptitude Tests [DAT]). Впервые эта батарея тестов была издана в 1947 г. и в последующем периодически пересматривалась (5ch ed., Form С, 1992). DAT предназначались главным образом для использования в профессиональном и образовательном консультировании учащихся 8-12-х классов. Пятая редакция ЙЛГдоступ-на пользователям в форме тестов двух уровней. Тесты 1-го уровня предназначены в основном для учащихся 7-9-х классов и взрослых с 7-9-летним образованием; тесты 2-го уровня предназначены для учащихся 10-12-х классов и взрослых с незаконченным средним (т. е. не менее чем 9-летним) образованием.
ДАГвключают в себя следующие восемь тестов: Вербальное рассуждение, Числовое рассуждение, Абстрактное рассуждение, Перцептивная скорость и точность, Пространственные отношения, Механическое рассуждение, Орфография и Словоупотребление. Образцы заданий из четырех тестов DAT показаны на рис. 10-6. Для предварительного ознакомления тестируемых с этой батарей имеется Тренировочный тест, охватывающий все восемь проверяемых областей. Существует также специальная форма DAT — Дифференциальные тесты способностей для оценки персонала и карьеры (Differential Aptitude Tests for Personnel and Career Assessment), — в которой каждый из восьми тестов сокращен и отпечатан в виде отдельной брошюры. Такая форма позволяет подбирать конкретные тесты для конкретных профессий и проводить их порознь.2
Подобно большинству основных современных тестов, DAГможно полностью пр0' водить в компьютеризованной версии. В настоящее время опробуется более совре'
' Эта тема будет обсуждаться в главе 11.
2 Инвентарь профессиональных интересов (Career Interest Inventory) был стандартизован вместе 5-й редакцией DAT. Поэтому для решения задач профессионального и образовательного консуль*1 рования его можно проводить, подсчитывать и интерпретировать его показатели в сочетании с "л
Глава 10. Групповое тестирование
Вербальное рассуждение
Выберите правильную пару слов и заполните пробелы в предложении. Первое слово пары вставляется в пробел в начале предложение, а второе — в пробел в конце предложения.
......нужен плавник, как птице......
Авода — перо С рыба — крыло
В акула — гнездо D дельфин — полет
Е рыба— небоПравильный ответ: С
Числовое рассуждение
Какое число нужно подставить вместо R в этом примере на сложение?
7R | F | G | Н | J | К |
+R | |||||
Ш | Ни одно из них |
Правильный ответ: 9
Механическое рассуждение
Какой груз будет легче везти по мягкому грунту?
Правильный ответ: t.
Пространственные отношения
Какая из следующих фигур могла бы дать изображенную слева развертку?
Правильный ответ: Н
Рис. 10-6. Образцы заданий из Дифференциальных тестов способностей (5-я ред.)
(Copyright © 1990 by The Psychological Corporation. All rights reserved.
Вооспроизводится с разрешения)
Часть 3. Тестирование способностей
менная разработка этой батареи в форме компьютеризованного адаптивного тестирования (CAT) — DAT Adaptive, доступная пользователям с 1987 г. Как при всяком адаптивном тестировании, каждый испытуемый получает здесь только те задания, которые соответствуют его уровню выполнения теста. В этой С А Т версии использованы задания из более ранней версии DAT (Form V), которые были проанализированы на основе модели Раша — упрощенной, однопараметрической модели теории «задание — ответ» (см. главу 7).
За годы использования батареи DA T накоплена обширная коллекция данных о ее валидности, собранная как издателями, так и независимыми исследователями, применявшими DAT в различных сферах профконсультирования и профотбора или включавшими эту батарею в исследовательские проекты. Большинство этих данных касаются прогностической валидности относительно достижений в учебных и профессиональных программах средней школы. Большинство коэффициентов валидности высоки, даже если вычислялись с интервалом в три года между тестированием и сбором данных о критериальной деятельности. В отношении дифференциального предсказания результаты оказались несколько менее ободряющими. Хотя, в общем, вербальные тесты имеют более высокие корреляции с курсами английского языка, а числовые тесты — с курсами математики, собранные данные свидетельствуют о существовании сильно выраженного общего фактора, лежащего в основе всякой успешной учебной деятельности. Тест «Вербальное рассуждение», например, имеет высокие корреляции с большинством учебных курсов. Главным образом по этой причине и был введен комплексный показатель VR + NR в качестве индекса академической способности.
Являясь суммой показателей по тестам «Вербальное рассуждение» ( VR) и «Числовое рассуждение» (NR), этот индекс имеет корреляции в районе 0,70 — 0,80 с комплексным критерием учебных достижений. К индексу VR + NR, который является одним из показателей, регулярно включаемых в профиль DAT (си. рис. 4-6), имеются нормы. Существует также неполный вариант DAT— Парциальная батарея (Partial Battery), содержащая только субтесты вербального (VR) и числового (NR) рассуждения, которую можно использовать в тех случаях, когда требуется лишь общий индекс академической способности.
С другой стороны, появляется все больше данных о том, что традиционные тесты «общего интеллекта» либо «академических способностей» — независимо от того, предназначены ли они для индивидуального или группового проведения, — дают существенные коэффициенты валидности относительно широкого множества образовательных и профессиональных критериев (L. S. Gottfredson, 1986a; Guion & Gibson, 1988; Pearlman et al., 1980; Schmidt, Hunter, Pearlman, & Shane, 1979). Такие тесты включают по существу тот же кластер когнитивных навыков и знаний, которые оцениваются показателем VR + NR из DAT. А это, как нетрудно заметить, свидетельствует ° преодолении существовавшего ранее разрыва между тестами интеллекта и комплексными батареями с двух сторон. Тесты, подобные DAT, с самого начала придают повышенное значение использованию и интерпретации широких показателей, таких ка VR + NR. В то же время в тестах первоначально общего характера все больше значени придается использованию и интерпретации показателей отдельных субтестов и аН лизу профиля. Что касается критических обзоров, посвященных DAT, см. работы Иа trup (1995) и N. Schmitt (1995).
Глава 10. Групповое тестирование 321
Многоаспектная батарея способностей. В качестве примера инструмента, при создании которого достигнуто еще большее приближение к новой модели тестирования способностей, можно рассмотреть Многоаспектную батарею способностей (Multidimensional Aptitude Battery [MAB]). Впервые опубликованная в 1984 г., она затем была существенно обновлена в том, что касается процедур проведения, норм и руководства к тесту (Jackson, 1994b). MAB — это групповой тест, предназначенный для оценки тех же способностей, что и Пересмотренная шкала интеллекта взрослых Векслера (WAIS-R, см. главу 8). Он включает пять субтестов, составляющих Вербальную шкалу,1 пять субтестов, организованных в Шкалу действия, и дает показатели — в единицах стандартного IQ — по Вербальной шкале (V), Шкале действия (Р) и Полной шале (Full Scale). MAB пригодна для работы с подростками и взрослыми, однако эту батарею не рекомендуется применять для обследования лиц с задержкой психического развития или иными нарушениями умственной сферы, состояние которых могло бы помешать пониманию или соблюдению инструкций к тестам.
Десять субтестов МАВ, имеющие за одним исключением те же названия, что и соответствующие субтесты WAIS-R, перечислены ниже:
ВЕРБАЛЬНЫЕ СУБТЕСТЫ
Осведомленность
Понимание
Арифметический
Сходства
Словарь
СУБТЕСТЫ ДЕЙСТВИЯ Цифровые символы Недостающие детали Пространственный Расположение картинок Складывание объекта
Субтест «Складывание кубиков» из WAIS-R был заменен в МАВ субтестом «Пространственный» (Spatial). Создателям МАВ пришлось проявить незаурядную изобретательность при разработке бланковых заданий, чтобы обеспечить измерение тех же функций, которые охватываются индивидуально проводимым тестом Векслера. Решить эту задачу было особенно трудно в отношении субтестов Шкалы действия. На рис. 10-7 приведены примеры простых, демонстрационных заданий из субтестов «Недостающие детали» и «Пространственного». Задача респондента во всех заданиях, входящих в каждый их этих субтестов, остается той же самой, как и в приведенных для иллюстрации заданиях. В субтесте «Недостающие детали» респондент должен решить, как называется недостающий элемент картинки, и затем выбрать первую букву этого названия среди предложенных вариантов. В субтесте «Пространственный» лишь одна из расположенных справа фигур могла бы быть получена простым поворотом на плоскости страницы фигуры, расположенной слева; все остальные варианты фигур, предлагаемых респонденту для выбора, требуют не только поворота, но и переворота исходной фигуры.
Пять Вербальных субтестов представлены в одном буклете, пять невербальных субтестов Действия — в другом. Каждый буклет начинается с задач для упражнения, иллюстрирующих типы заданий трех из пяти субтестов, а каждый субтест начинается с одного, двух или трех добавочных демонстрационных заданий. Общие и частные
Субтест «Повторение цифр» (Digit Span) из WIAS-R не имеет соответствия в МАВ. Этот субтест было бы трудно воплотить в бланковой форме и к тому же он имеет самую низкую корреляцию с показателями Полной шкалы Векслера.
Часть 3. Тестирование способностей
Недостающие детали. Выберите букву, с которой начинается слово, обозначающее пропущенную деталь картинки.
Правильный ответ — Light (Фара), поэтому в вариантах ответов следует зачеркнуть букву А.
Пространственный. Выберите одну фигуру справа от вертикальной линии, которая является той же самой, что и фигура слева от вертикальной линии. Искомую фигуру можно повернуть на плоскости, чтобы она выглядела как фигура слева; другие для этого пришлось бы еще и перевернуть.
Правильный ответ — А, поэтому в вариантах с ответом следует пометить букву А.
Рис. 10-7. Демонстрационные задания из двух тестов действия Многоаспектной батареи способностей (МАБ)
(Copyright © 1983 by Douglas N. Jackson. Воспроизводится с разрешения)
инструкции для каждого субтеста приведены в руководстве, они могут даваться устно, в аудиозаписи или в виде текста на мониторе компьютера. Ответы фиксируются на отдельных бланках или, с помощью соответствующих устройств, на компьютере. Одна из последних версий МАВ обеспечивает полностью компьютеризованное проведение и вычисление показателей батареи местным пользователем теста.
С помощью нормативной таблицы первичные показатели по каждому из 10 субтестов можно преобразовать в эквивалентные показатели единой равномерной шкалы (стандартные показатели с М= 50 и SD = 10). Суммы таких показателей по трем шкалам — V, Р и Full Scale — рассматривают обычно как стандартные IQ (М - 100, SD - 15) в границах каждой из девяти возрастных групп, покрывающих возрастной диапазон от 16 до 74 лет. Кроме того, есть отдельные таблицы для нахождения в границах каждой из тех же девяти возрастных групп эквивалентных шкальных показателей, которые можно использовать при построении соответствующих возрасту профилей. ПреимУ' щество использования показателей из одной батареи по сравнению с показателями набора различных тестов заключается в том, что все тесты батареи были нормированы на одной и той же выборке стандартизации и, следовательно, допускают прямое сраВ' нение результатов.
Глава 10. Групповое тестирование
В целом, при разработке МАВ были использованы психометрические методы, характеризующиеся высоким техническим качеством, и каждая стадия проекта поддерживалась интенсивными исследованиями, продолжавшимися более десяти лет.1 Достойной упоминания особенностью МАВ является ее эмпирическая состыковка с WAIS-R. Впервые было показано, что каждый субтест МАВ, как и ее суммарные показатели по трем шкалам ( V,P и Full Scale), имеют очень высокие корреляции с соответствующими показателями WAIS-R, полученные на неоднородной выборке 145 подростков и взрослых. Фактически, эти корреляции были столь же высоки, как и корреляции между показателями WAIS и WAIS-R, или даже выше, за двумя исключениями (субтесты «Цифровые символы» и «Пространственный»/«Складывание кубиков»). Следует отметить, что эти корреляции были получены несмотря на полную новизну заданий МАВ, — в этих двух шкалах нет ни одного общего задания. На этом основании было выполнено линейное приравнивание показателей МАВ и WAIS-R, проведенное на неоднородной выборке приравнивания, состоящей из 160 испытуемых в возрасте от 16 до 35 лет, которым предъявляли оба теста. Предварительное проведение приравнивания показателей этих двух тестовых батарей на выборках учащихся и пациентов психиатрических клиник показало, что такое градуирование распространимо на другие выборки тестируемых. Эти процедуры градуирования предлагают многообещающий способ выражения показателей впервые создаваемых тестов в единицах унифицированной шкалы, основанной на данных из большой, репрезентативной выборки стандартизации. Они представляют еще один шаг на пути к достижению такой важной цели, как построение национальных анкерных норм, обсуждавшихся в главе 3.
Если посмотреть с другой точки зрения, в этой батарее отчетливо выражена современная тенденция к иерархическим показателям. МЛ В дает полностью интерпретируемые показатели на уровне 10 субтестов, на более широком уровне Вербальной шкалы и Шкалы действия, и, наконец, обеспечивает получение общего суммарного показателя по полной батарее. Тем самым пользователь теста может проявить большую гибкость при выборе подходящего уровня показателей для своей специфической цели тестирования — условие, которое, как нам кажется, будет характеризовать тестирование способностей в XXI столетии.
'См. обзоры S. В. Reynolds (1989) и Silverstein (1989).
ПРИРОДА ИНТЕЛЛЕКТА
Все психологические тесты предназначены для измерения поведения. Поэтому подбор подходящих тестов и интерпретация результатов тестирования требуют знаний о человеческом поведении. Знание релевантных поведенческих исследований необходимо не только разработчику теста, но и его пользователю. В этой и следующей главах мы рассмотрим накопленные к настоящему времени знания о поведении, для оценки которого и предназначены тесты интеллектуальных умений и навыков. Нам предстоит разобраться в том, как психологические исследования способствуют пониманию 1) поведения, измеряемого тестами когнитивных способностей или «интеллекта», 2) источников индивидуальных различий в таком поведении и 3) предсказуемости такого поведения в последующем времени и в других условиях.
Прежде всего, следует отметить, что не имеющий строгого определения термин «интеллект» употребляется в огромном количестве значений, причем не только широкой публикой, но и представителями различных дисциплин, таких как биология, философия или педагогика (см. Sternberg, 1990), да и психологами, специализирующимися в разных областях или придерживающихся различных теоретических ориентации (например, Н. Gardner, 1983, 1993; Sternberg, 1985a, 1989 - см. также Brody, 1992; Lubinski & Benbow, 1995; Messick, 1992; H. Rowe, 1991). Самая первая демонстрация этого многообразия значений произошла в 1921 г, когда редактор «Журнала педагогической психологии» (Journal of Educational Psychology) предложил 17 ведущим исследователям сформулировать свои определения и понятия интеллекта («Intelligence...», 1921). Аналогичный опрос был проведен 65 лет спустя (Sternberg, & Det-terman, 1986). Изучение этих публикаций, должно быть, представляет существенный теоретический интерес и могло бы обеспечить основу для глубокого обсуждения и, возможно, некоторого сближения конфликтующих позиций. В данном случае, однако, мы преследуем более ограниченную цель — выяснить, что нам следует знать о той специфической части человеческого интеллекта, которая оценивается посредством традиционных тестов интеллекта и обозначается символом IQ. IQ явно имеет более ограниченный смысл, чем тот, в котором термин «интеллект» употребляется при современном обсуждении этого конструкта (см. Anastasi, 1983c).
Глава 11. Природа интеллекта 325
Значение IQ
В сознании широкой публики IQ не отождествляется с определенным типом показателя по конкретному тесту, а часто служит просто сокращенным обозначением интеллекта.1 Такое употребление аббревиатуры IQ стало настолько преобладающим, что его нельзя больше игнорировать или осуждать как распространенное заблуждение. Несомненно, рассматривая количественное значение данного IQ, следует всегда точно указывать тест, при проведении которого этот показатель получен. Те или иные тесты интеллекта, дающие показатели в виде IQ, различаются и своим содержанием, и иными параметрами, влияющими на интерпретацию этого показателя. Некоторые из этих различий в тестах, объединяемых названием «тесты интеллекта», обсуждались в примерах, рассмотренных в предыдущих главах. Тем не менее не будет лишним еще раз рассмотреть превалирующие коннотации конструкта «интеллект» в том виде, как он символизируется Щ.
Во-первых, тестируемый интеллект следует рассматривать скорее как описательное, чем как объяснительное понятие. IQ — это форма выражения уровня способностей индивидуума в данный момент времени по отношению к имеющимся возрастным нормам. Ни один тест интеллекта не может указать на причины его результатов у конкретного человека. Отнесение неадекватного выполнения теста или обычной деятельности на счет «недостаточного интеллекта» есть тавтология, которая не только не продвигает нас в понимании умственного недостатка индивидуума, но фактически может замедлить исследование действительных причин такого недостатка в прошлом этого человека.
Тесты интеллекта, как и любые другие виды тестов, следует использовать не для навешивания ярлыков на людей, а для их лучшего понимания. Этот момент подчеркивался на протяжении многих лет во многих источниках — от работ психологов, специализирующихся в области индивидуальных различий, до официальных отчетов государственных комиссий (Hobbs, 1975a, 1975b; National Commission..., 1990). Широко разрекламированная книга (Herrnstein, & Murray, 1994) под названием «Гауссова кривая» (The Bell Curve) послужила еще большему укреплению разнообразных стереотипов и заблуждений, касающихся этнических и тендерных различий в выполнении тестов интеллекта, и только добавила путаницы и разногласий в отношении этой и без того сложной проблемы. Объективная и опирающаяся на факты трактовка относящихся к данной проблеме вопросов дана в отчете Специальной комиссии по интеллекту Американской психологической ассоциации (American Psychological Association Task Force on Intelligence, см. Neisser et al., 1996). Один из симпозиумов на съезде Американской психологической ассоциации в 1995 г. также был посвящен прояснению этих сложных вопросов (Steele, Chair, August, 1995). Чтобы повысить уровень функционирования конкретного человека до максимума, нужно исходить из того уровня, на котором он в данное время находится, а для этого необходимо оценить его сильные и слабые стороны и выработать соответствующий способ действий. Если тест на чтение показывает, что ребенок отстает в этом виде деятельности, мы ведь не останавливаемся на том, что навешиваем ему ярлык «плохо читает», и не даем ему невербальный
Когда термин IQ (Коэффициент интеллекта) впервые вводился в обращение, он действительно Имел отношение к типу показателя, а именно представлял собой отношение умственного возраста к Хронологическому (см. главу 3).
Часть 3. Тестирование способностей
тест, с тем чтобы спрятать этот недостаток за другим возможным достоинством. Вместо этого мы стараемся научить его нормально читать. Важной целью современного тестирования является к тому же содействие самопознанию и развитию личности Данные тестирования все больше используются для того, чтобы помочь конкретным людям в планировании своего образования и профессиональной карьеры, а также в принятии оптимальных решений, непосредственно касающихся их жизни. Внимание уделяемое эффективным способам сообщения тестовых результатов испытуемому, свидетельствует о растущем признании такого применения тестов.
Во-вторых, не следует забывать, что интеллект — это не единая, однородная способность, а композиция нескольких функций. Этим термином обычно обозначается сочетание способностей, необходимых для выживания и преуспевания в определенной культуре (Anastasi, 1986c). Следовательно, специфические способности, образующие эту композицию, а также их относительная значимость будут меняться в зависимости от времени и места. Для разных культур и в разные исторические периоды одной культуры понимание успешности в деятельности меняется. Изменение состава функций интеллекта можно видеть и на протяжении жизни одного человека от младенчества до взрослого состояния. Способность индивидуума будет с годами возрастать относительно тех функций, которым окружающая его культура или субкультура придают особое значение, и уменьшаться относительно тех функций, которым такого значения не придается.
Типичные тесты интеллекта, предназначенные для школьников или взрослых, измеряют в основном вербальные способности и, в меньшей степени, способности оперирования числами и другими абстрактными символами. Именно эти способности преобладают в школьном обучении. Большинство интеллектуальных тестов можно поэтому рассматривать как средство измерения способности к обучению или академического интеллекта. IQ является отражением предшествующих достижений в обучении и предиктором последующих. Поскольку функции, которыми овладевают в процессе получения образования, имеют первостепенное значение в современных культурах с передовыми технологиями, показатель по тесту академического интеллекта служит также эффективным предиктором успешной профессиональной и иной деятельности в таких культурах.
Вместе с тем множество других важных функций, таких как технические, двигательные, музыкальные и артистические способности, мотивационные, эмоциональные и диспозиционные (attitudinat) переменные, для измерения которых интеллектуальные тесты никогда не применялись, являются важными составляющими достижений во всех областях. В действительности же, некоторые психологи включают компоненты личности в свои определения интеллекта (например, Н. Gardner, 1983). Аналогично этому, в исследованиях креативности выявляются когнитивные и личностные переменные, которые связаны с продуктивностью творческой деятельности. Все это, естественно, означает, что как индивидуальные решения, так и решения, принимаемые учреждениями, должны основываться на сопоставлении такого количества релевантных данных, которое только можно собрать. Принимать решения, основываясь исключительно на результатах тестов, особенно одного или двух, значит неправильно их использовать. Решения должны принимать люди, а тесты — всего лишь один из источников сведений, необходимых для принятия решений. Сами тесты не относятся к инструментам принятия решений.
Глава 11. Природа интеллекта
Большинство наших знаний о том, что измеряют тесты интеллекта, мы получаем из практических исследований валидности тестов при предсказании образовательных и профессиональных достижений. На теоретическом уровне, в конце 1970-х гг. был отмечен сильный всплеск интереса к анализу конструкта «интеллект» в том виде как он измеряется тестами интеллекта (Humphreys, 1979; Resnick, 1976; Sternberg, & Detterman, 1979). Этот интерес оказался чрезвычайно устойчивым, захватывая разные области психологии и проникая через барьеры различных методологических подходов и теоретических ориентации, что нашло свое отражение в продолжающейся серии публикаций (Detterman, 1985-1993; Sternberg, 1982-1989) и издании полной энциклопедии на эту тему (Encyclopedia of Human Intelligence, 1994).
Стремление понять, что же измеряют тесты интеллекта, связывалось не только с использованием стандартных статистических процедур, наподобие факторного анализа, но и с применением методов обработки информации к задачам, предъявляемым в интеллектуальных тестах (см. главу 5). Информационный подход сосредоточен на элементарных процессах, посредством которых тестируемый находит ответ на вопрос теста, а не на рассмотрении одной только правильности ответа. Этот тип анализа должен существенно помочь диагностическому использованию тестов и разработке обучающих программ, отвечающих специфическим индивидуальным потребностям.
Наследуемость и изменчивость1
Много недоразумений и споров возникло вследствие применения оценок наследуемости к показателям интеллектуальных тестов. В качестве примера можно привести известную статью А. Дженсена (Jensen, 1969), которая вызвала большой фурор и горячие споры, продолжающиеся и по сей день, то несколько утихая, то вспыхивая с новой силой. Хотя ее обсуждение шло по нескольким направлениям, а поднимавшиеся при этом вопросы были достаточно сложны, камнем преткновения для всех участников дискуссии оказалась интерпретация оценок наследуемости. Конкретно, коэффициент наследуемости показывает пропорциональный вклад генетических, или наследственных, факторов в общую изменчивость конкретного свойства или черты в данной популяции при существующих условиях. Например, утверждение, что наследуемость IQ по Стэнфорд—Бине среди учащихся американских городских средних школ составляет 0,70, означало бы, что 70 % дисперсии этого показателя может быть приписано наследственным различиям, а 30 % — влиянию среды.
Коэффициенты наследуемости вычислялись по разным формулам (см., например, Jensen, 1969; Loehlin, Lindzey, & Spuhler, 1975), но используемые для их расчета основные данные — это меры семейного сходства изучаемого признака. Наиболее распространенный метод состоит в использовании корреляций результатов интеллектуальных тестов у монозиготных и дизиготных близнецов. Также использовались корреля-
Обсуждаемый в этом разделе вопрос касается лишь малой части обширной области исследований воздействия наследственности и среды на развитие поведения. Всестороннее рассмотрение генетических вопросов, включая критические оценки коэффициентов наследуемости, можно найти в работах Brauth, Hall, & Dooling (1991), Bronfenbrenner, & Ceci (1994), Horowitz (1994), Plomin, & McCle-arn (1993) и Plomin, & Reade (1991).
Часть 3. Тестирование способностей
ции между монозиготными близнецами, воспитанными вместе, и между монозиготными близнецами, воспитанными порознь, в приемных семьях.
В интерпретации оценок наследуемости следует обратить внимание на ряд моментов. Во-первых, эмпирические данные относительно семейного сходства недостаточно точны, поскольку в них не учтен вклад средовых факторов. Например, имеются данные о том, что монозиготные близнецы живут в более сходной среде, чем дизигот-ные (Anastasi, 1958, р. 287-288; Koch, 1966), а среды растущих вместе сиблингов могут быть в психологическом плане совершенно различными (Daniels, & Plomin, 1985). Во-вторых, распределение пар близнецов по разным приемным семьям происходит отнюдь не случайным образом, как нужно было бы для проведения идеального эксперимента. Хорошо известно, что взятие ребенка на воспитание зависит и от особенностей малыша, и от характеристик приемной семьи. Следовательно, условия жизни близнецов в приемных семьях внутри каждой пары, по-видимому, будут иметь достаточно сходства, чтобы этим можно было объяснить хотя бы какую-то часть корреляции между их тестовыми показателями. Помимо того, есть некоторые основания утверждать, что данные о наследуемости, полученные близнецовым методом, нельзя обобщать на популяцию в целом, поскольку близнецы чаще подвергаются пренатальным травмам, приводящим ic серьезным задержкам психического развития. Включение в выборку пар с сильной задержкой психического развития может заметно увеличить корреляцию результатов тестирования интеллекта близнецов (Nichols, & Broman, 1974).
Помимо сомнительности данных, используемых при вычислении коэффициентов наследуемости, последним присущи и другие серьезные ограничения (см. Anastasi, 1971; Hebb, 1970). Примечательно, что в первой части упомянутой статьи Дженсена (Jensen, 1969, р. 33-46) среди прочих назывались и они. Во-первых, понятие наследуемости применимо к популяциям, но не к отдельным индивидам. Например, при установлении этиологии психической задержки у конкретного ребенка коэффициент наследственности вряд ли окажет какую-либо помощь. Независимо от величины коэффициента наследуемости в данной популяции задержка психического развития у этого ребенка могла стать следствием дефектного гена (как при фенилкетонурии), прена-тального повреждения головного мозга или крайней ограниченности опыта.
Во-вторых, коэффициенты наследуемости применимы только к той популяции, на которой в данное время они были получены, и любое изменение в наследственности или окружающих условиях может изменить этот коэффициент. Так, увеличение браков между кровными родственниками, например на изолированном острове, уменьшило бы дисперсию признаков, приписываемую наследственным факторам, и тем самым снизило бы коэффициент наследуемости; увеличение однородности среды, с другой стороны, уменьшило бы дисперсию признаков, относимую на счет средовых факторов, что привело бы к повышению коэффициента наследуемости. Кроме того, коэффициент наследуемости, рассчитанный на одной популяции, неприменим к анализу различий в выполнении теста двумя популяциями, такими как разные этнические группы.
В-третьих, наследуемость ничего не говорит о степени изменчивости признака. Даже если коэффициент наследуемости изучаемого признака в данной популяции равен 100 %, отсюда не следует, что влияние среды на формирование этого признака незначительно. Поясним этот момент следующим контрастным примером. Предположим, что в гипотетическом сообществе взрослых людей все питаются одинаково, т.е-каждый получает одну и ту же еду и в одинаковом количестве. В такой популяции
Глава 11. Природа интеллекта
влияние особенностей питания на общую дисперсию здоровья и физического состояния будет нулевым, поскольку разницей в пище нельзя объяснить индивидуальные различия в здоровье и физическом развитии. Тем не менее если бы запасы продовольствия внезапно иссякли, все соо