Документ 9.3. Следует ли отказаться от тестов на умственное развитие?
Интеллектуальные тесты, столь популярные в первой половине XXвека, в настоящее время все меньше и меньше применяются в целях отбора, хотя первоначально они были созданы именно для этого. Все более ограниченное применение тестов может быть объяснено многими причинами. Но как бы то ни было, именно благодаря их использованию, критике по поводу злоупотребления тестами и мерам, предпринятым для их улучшения, психологи стали лучше понимать сущность и функционирование интеллекта.
Уже при разработке самых первых тестов были выдвинуты два требования, которым должны удовлетворять «хорошие» тесты: валидность и надежность.
Валидность теста заключается в том, что он оценивает именно то качество, для которого предназначен. Например, если какой-то тест на музыкальные способности позволяет оценить лишь умение ученика читать ноты, то по результатам такого теста ни в коей мере нельзя будет судить о том, насколько успешно он сможет обучаться игре на фортепиано.
Создатель первого интеллектуального теста Бине однажды пошутил, сказав: «Интеллект? ... Да это же просто то, что оценивает мой тест!» К сожалению, в этой шутке оказалось слишком много правды. Тест Бине был разработан с целью определять шансы ребенка на успешное обучение в школе и валидность его была оценена путем установления корреляции между результатами тестирования, с одной стороны, и школьными оценками и отзывами преподавателей – с другой. Иными словами, валидность теста была ограничена именно этими рамками. И долгое время вопрос об интеллекте и методах его оценки рассматривался только в таком аспекте.
Мы уже убедились в том, что дать ясное, единое и прежде всего объективное (операциональное) определение интеллекту практически невозможно. В связи с этим маловероятно, чтобы кто-нибудь смог разработать метод исследования, не зависящий от той или иной концепции интеллекта.
Известно, что западная культура отдает приоритет рациональному мышлению, скорости решения задач и словесному рассуждению, для которого необходим определенный словарный запас. Значит, еще очень долго подобные критерии, вероятно, будут лежать в основе оценки интеллекта учеными, принадлежащими к этой преобладающей в глобальном масштабе культуре.
Надежность теста заключается в том, что его результаты воспроизводятся с хорошим постоянством у одного и того же человека. Это возможно, однако, лишь в том случае, если при каждом тестировании все условия одинаковы. Между тем многие факторы могут нарушить это постоянство. Различные жизненные перемены, связанные с чисто физическими (например, заболевания) или эмоциональными (развод, смерть близких) причинами, а также мотивация или состояние испытуемого в момент тестирования смогут повлиять на его результаты.
Следует также учитывать, что интеллектуальные тесты оценивают интеллект В (по Хеббу), т. е. образ действий индивидуума в конкретный момент времени, зависящий не только от наследственных факторов, но также от степени его зрелости и накопленного к этому моменту опыта. Поэтому оцениваемый таким способом интеллект находится в процессе непрерывного развития. Оказалось, что у одного и того же человека при подобной оценке разница в IQ в детстве и в юности может превышать 15 баллов. Это позволяет даже высказать мысль, что слишком большая надежность теста может быть не столько достоинством, сколько недостатком.
Кроме того, само тестирование должно быть стандартным, т.е. одинаковым для всех. Для этого надо, чтобы правила и материалы, используемые при тестировании, всегда были строго однотипными. Специалисты, проводящие тестирование, должны быть хорошо обучены и при объяснении заданий им нельзя поддаваться каким – то субъективным чувствам, связанным, например, с внешним видом тестируемых*, будь то цвет их кожи или одежда.
* Даже в том случае, если тестирование и расшифровка результатов осуществляются строго объективно, на прогноз социального успеха и на советы по профориентации существенно влияет социальное происхождение испытуемого. Например, лишь очень немногим умным и умелым детям из «низших» слоев дается совет стать хирургами.
Наконец – и это чрезвычайно важно, – тест должен быть нормализован. Это означает, что для него по данным испытания эталонной группы должны быть установлены нормы. Такая нормализация позволяет не только четко определить группы лиц, к которым может быть применен данный тест, но также расположить результаты, получаемые при тестировании испытуемых, на кривой нормального распределения эталонной группы.
Было бы, например, нелепо использовать нормы, полученные на студентах университета, для оценки с помощью тех же тестов интеллекта у детей начальной школы. Точно так же недопустимо, учитывая различия в культуре и ценностях, применять нормы для детей из западных стран при оценке умственных способностей молодых африканцев или азиатов.
Однако если эти вещи кажутся вполне естественными, когда речь идет о популяциях, удаленных друг от друга во времени или пространстве, то они не всегда учитываются при оценке интеллекта у представителей разных классов или этнических групп, проживающих одновременно на одной территории.
Что касается, например, Соединенных Штатов, то совершенно ясно, что в этой стране тесты были разработаны для оценки интеллекта молодых англоязычных представителей белой расы и средних слоев. Неудивительно поэтому, что многие задания, входящие в такие тесты, отличаются культурной спецификой.
Например, если ребенок на вопрос теста WISC «Кто открыл Америку?» вполне резонно ответит «Американские индейцы», то он получит штрафные очки: всем должно быть известно, что Америка обязана своим существованием Христофору Колумбу и европейской культуре. Поэтому только такой ответ считается в данном тесте приемлемым*. Точно так же есть множество вопросов, на которые вполне могут ответить городские дети из привилегированных слоев; однако совсем не очевидно, что ребенок из низших слоев должен знать, кто написал «Фауста» (особенно если этот ребенок живет в негритянском гетто), что такое «честь» или почему «лучше дать деньги обществу милосердия, чем нищему на улице»...
* Можно также ответить, что Америку открыли викинги, если только при этом будет названо имя их предводителя Лейфа Эйриксона.
С другой стороны, можно себе представить, как будут отвечать городские дети на вопросы типа «В какое время года лучше всего перепахивать землю?», «Что такое борона?» или «Сколько поросят в среднем бывает у свиноматки?». По результатам ответов на подобные вопросы можно будет убедиться в том, что очень многие дети из сельских местностей обладают познаниями, не менее важными для выживания, чем знание того, кто является автором «Сида». К сожалению, однако, эти познания не служат критериями интеллекта с точки зрения разработчиков тестов. Точно так же в этих тестах не учитывается специфика ценностей или словарный запас национальных меньшинств – например, черного населения Соединенных Штатов или определенных этнических групп Франции.
Итак, хочется еще раз подчеркнуть, что критерии интеллекта в такого рода тестах диктуются преобладающей культурой, т. е теми ценностями, которые первоначально сложились в западноевропейских странах. При этом не учитывается, что у кого – то может быть совершенно иное семейное воспитание, иной жизненный опыт, иные представления (в частности, о значении теста), а в некоторых случаях и худшее знание того языка, на котором говорит большинство населения.
Однако последствия такого культурного неравенства были бы еще терпимыми, если бы тесты использовались только для того, чтобы помочь человеку оценить его шансы на успех в социальной жизни*. Гораздо серьезнее то, что из различий между результатами каких – то групп или социальных слоев делается вывод о наследственных особенностях, позволяющих расположить различные группы людей на некой абсолютной шкале интеллекта, тогда как эта шкала относительна и зависит от конкретной культуры и от представления о функционировании общества. К этому вопросу мы еще вернемся в досье 9.1.
* Была предложена идея разработать тесты, не зависящие (culture free test) или мало зависящие (culture – fair test) от каких – либо культурных влияний (рис. 9.11). Однако и эта идея утопична, так как само представление о тесте неотделимо от той или иной культуры. С другой стороны, английские ученые пытались разработать тест, в котором не учитывается время выполнения задания. Такого рода тесты оценивают главным образом дивергентное мышление и качества, необходимые в повседневной жизни (в некоторых тестах даже проверяется, умеет ли ребенок «хорошо» врать...). Даже если подобные тесты и представляют собой некоторый шаг вперед, исследователи предпочитают все же использовать такие традиционные тесты, как тест Стэнфорд – Бине или шкалы интеллекта Векслера.
Рис. 9.11. Пример теста, «независимого от культуры» (culture – free test; автор R. В. Cattell).
1. Какой из этих рисунков отличается от четырех остальных?
2. Какой из пяти рисунков, расположенных справа, следует расположить после трех левых рисунков (в пустом квадрате)?
3. Каким из рисунков, расположенных справа, следует дополнить левый квадрат?
4. В левом рисунке точка расположена внутри круга, но снаружи от квадрата. В каком из пяти правых рисунков точку тоже можно было бы расположить вне квадрата и внутри круга?
Решения: № 1: 3; № 2: 5; № 3: 2; № 4: 3.