Изменение показателей тестов интеллекта на уровне популяции

Повышение показателей.Что происходит с результатами тестов интеллекта на уровне популяции в течение продолжительных периодов времени? С этим вопросом мы уже сталкивались в связи с рассмотрением нескольких проблем. В предыдущем

1 См., например, Bengtson, & Schaie (1989), Birren, &" Bengtson (1988), Birren, & Schaie (1991), Craik. & Salthouse (1992), Fiske, & Chiriboga (1990), Haplin, & Panek (1993), Kausler (1994), Nadien (1989). Sonderegger (1992), Schulz, & Ewen (1993), Willis, & Schaie (1986).

Глава 12. Психологические проблемы тестирования способностей 369

разделе было показано, что вместе с ростом образовательного уровня населения на протяжении нескольких десятилетий соответственно повышался и средний уровень выполнения интеллектуальных тестов. В результате, более старшие, но и менее образованные, в среднем, члены нормативной выборки, получали по тесту интеллекта показатели ниже, чем более молодые, но, в среднем, лучше образованные члены этой выборки. Аналогичный феномен обнаруживается при изучении выборки стандартизации тестов для детей. При рестандартизации шкал Стэнфорд—Бине и WISCрезультаты выполнения тестов в более поздних выборках стандартизации существенно лучше, чем в более ранних выборках. Как следствие, любой конкретный ребенок получил бы более низкий IQ при его тестировании с помощью пересмотренной шкалы, чем в случае применения старой шкалы, причем просто потому, что его результат оценивался бы относительно более высоких норм. К тому же более высокий уровень образования родителей тех детей, которые вошли в более позднюю выборку стандартизации, был одним из условий, упомянутых в связи с повышением оцениваемого тестами уровня интеллекта.

Этот тип сравнения можно определить как лонгитюдное изучение популяций. Обычное применение лонгитюдного метода в психологических исследованиях связано с повторным тестированием одних и тех же лиц на протяжении какого-то периода времени. Однако при лонгитюдном изучении популяций определенная популяция выборочно обследуется в различные периоды времени. В этом случае сравнение производится между когортами лиц, родившихся в разное время, но протестированных в одном возрасте.1 Несколько крупномасштабных исследований, поведенных в течение первых пяти десятилетий XX столетия, показали повышение интеллекта популяции в том виде, как он измеряется стандартизованными тестами интеллекта (Anastasi, 1985d, p. 126-130). При росте грамотности, повышении образовательного уровня и других культурных переменах не столь уж неожиданно было обнаружить, что средний уровень тестируемого интеллекта всего населения устойчиво повышался на протяжении нескольких десятилетий

В этих сравнительных исследованиях использовались разнообразные методы их организации. В одном случае один и тот же тест проводился через какой-то промежуток времени, как при обследовании 11-летних шотландских детей в 1932 и 1947 гг. (Scottish Council, 1949). В другом — репрезентативной выборке лиц давалось два теста с целью установить соответствие между двумя множествами показателей и таким образом обеспечить «перевод» результатов одного теста в результаты другого. Это было сделано при сравнении результатов тестирования солдат американской армии в период Первой и Второй мировых войн, которых обследовали с помощью Армейского альфа и Армейского общего классификационного тестов (Army General Classification Test) соответственно (Tuddenhaim, 1948). Третий, технически более совершенный, подход основан на создании абсолютной, независимой от выборки шкалы показателей посредством использования анкерных заданий, как было сделано при разработке тестов Совета колледжей. Применение теории «задание — ответ» (глава 7) представляет собой дальнейшее усовершенствование этого подхода.

1 Специальное приложение этого общего метода можно распознать в «сравнении с временной задержкой», включенном К. У. Шайи (К. W. Schaie, 1965) в его упоминавшийся выше когортно-последова-тельный план исследования.

Часть 3. Тестирование способностей

Понижение показателей.Будут ли показатели определенной популяции по тестам интеллекта со временем повышаться, понижаться или оставаться стабильными, зависит от многих условий. Охватываемый период времени, с сопутствующими ему культурными переменами, безусловно является главным фактором. Возраст обследуемых также имеет значение. Например, повышение образовательного уровня населения будет прямо сказываться на выполнении тестов взрослыми людьми и только косвенно — на показателях детей, так как дети в сравниваемых выборках получили на момент тестирования одинаковый объем образования. Еще одно важное условие, которое нужно учитывать, особенно при изучении специально отобранных субпопуляций, — это коэффициент отбора (degree of selection^ в разные периоды времени. К примеру, если в 1960 г. среднюю школу посещала большая доля населения, чем в 1910, как это и было в действительности, то ученики средней школы 1910 г. представляют собой выборку из генеральной совокупности, извлеченную на основе более высокого критерия, чем выборка учеников средней школы 1960 г. Видимые противоречия между повышением и понижением показателей могут быть обусловлены характером используемых тестов, спецификой тестируемых субпопуляций (например, ориентированные на поступление в колледж старшеклассники, все взрослое население, ученики начальной школы) или специфическими периодами времени, охватываемыми исследованием (например, Flynn, 1984,1987).

Количество и сложность условий, которые могут вызывать повышение или снижение интеллектуального уровня популяции, определяемого с помощью тестов, иллюстрируется анализом широко известного снижения показателей по Тесту академических способностей (SAT) Совета колледжей (Donlon, 1984, р. 188-191; Wirtz, 1977). В период между 1963 и 1977 гг. средний Вербальный показатель SAГ упал с 478 до 429, а средний Математический показатель SAГснизился с 502 до 470. Чтобы понять причины этого неуклонно продолжавшегося 14 лет спада, специально назначенная комиссия заказала 38 исследований специалистам в разных областях и рассмотрела внушительное множество причинных гипотез.

Главный вывод, к которому пришла комиссия, заключался в том, что характер причин изучаемого явления существенно различался в первой и второй половинах 14-летнего периода. На протяжении первых 7 лет снижение показателей происходило преимущественно в результате изменения состава сдающих SAT. Из-за непрерывного роста доли выпускников средней школы, намеревающихся поступить в колледж в течение этого периода, данная выборка становилась все менее отсортированной по когнитивным навыкам, измеряемым данным тестом. Однако во втором 7-летнем периоде популяция поступающих в колледж практически стабилизировалась, и теперь особенностями выборки объяснялась гораздо меньшая часть снижения показателей. Для этого периода объяснение пришлось искать главным образом в условиях, связанных с семьей, школой и обществом в целом. Комиссия отметила, что имеющиеся данные не позволяют определить относительный вклад различных культурных изменений в снижение показателей теста. Тем не менее среди многих факторов, называвшихся в числе возможных значимых условий такого снижения, были и такие, как недооценка значения учебных стандартов, инфляция школьных отметок и автоматический (без экзаменов) перевод в следующий класс, сведение к минимуму домашних заданий, рост числа прогулов школьных занятий, все меньшее уделение внимания овладению навыками и знаниями, чрезмерное увлечение просмотром телепередач, а

Глава 12. Психологические проблемы тестирования способностей

также социальные потрясения конкретного исторического периода, препятствующие должному вниманию к жизни школьников.1

Последующий анализ (Turnbull, 1985) дал возможность предположить, что снижение показателей SAT в течение второго 7-летнего периода было, отчасти, отсроченным и косвенным следствием изменений в составе поступавших в колледжи на протяжении первых 7 лет. Поскольку большая доля плохо подготовленных учеников оставалась в средней школе (и подавала заявления о приеме в колледж), многие изменения условий школьного обучения можно рассматривать как приспособительную реакцию школ на возросшую разнородность своих учащихся. Подобные реакции, ведущие к снижению уровня требований школьной программы, иллюстрируются инфляцией отметок, быстрым увеличением числа факультативных курсов по профессиональным и даже по общеобразовательным дисциплинам, упрощением учебников и сокращением домашних заданий. Таким образом изменения в популяции учащихся привели к изменениям учебных программ, что, в свою очередь, повлекло за собой снижение тестовых показателей. Эта гипотеза согласуется с данными о том, что высоких показателей стало меньше в 1970-х гг. Показатели учеников, занимающих высокое место в своем классе, продолжали снижаться, тогда как показатели учеников, занимающих последние места в списке класса, стабилизировались или даже повысились. Более того, в конце 1970-х и в течение 1980-х гг. произошел перелом в уровне требований школ к обучению, который отразился в росте показателей SAT.

Общий обзор.О методологических проблемах, встречающихся на пути тех, кто пытается оценить изменения популяции, ясно свидетельствует неудавшийся обзор публикаций, посвященных улучшению результатов интеллектуальных тестов у населения 14 стран (Flynn, 1987). Опубликованные данные оказались настолько противоречивыми, а их объяснения такими расплывчатыми, что склонили автора обзора не делать никаких выводов, за исключением того, что тесты интеллекта на самом деле измеряют все что угодно, только не интеллект! Попытки измерить изменения популяции пока носят поисковый характер, и оптимальный способ проведения таких измерений еще предстоит разработать. Прекрасное рассмотрение методических вопросов, связанных с измерением изменений популяции, можно найти в материалах конференции по этой теме (Collins, & Horn, 1991).

Пока же для правильного понимания результатов исследований повышения и снижения показателей тестов в популяциях требуется дополнительная информация нескольких видов. Во-первых, должны быть точно описаны проводимые тесты, с уделе-нием особого внимания тому, какие специфические процессы и какое содержание они охватывают (например, перцептивную скорость, память, вербальное понимание, пространственную ориентацию), и указаны источники получения их норм. Во-вторых, необходимо сообщать даты проведения первичного и всех последующих сеансов тестирования. В-третьих, должна приводиться релевантная информация о выборочно обследуемых популяциях, а также о любых изменениях отбора при повторном тестировании, таких, например, как потеря лиц с первоначально лучшими и худшими результатами в последующих выборках. В-четвертых, следует иметь доступ к информа-

Хотя наиболее полно исследовались причины снижения показателей SAT, аналогичный спад показателей был отмечен и в других тестах для абитуриентов, таких как тесты из программы ACT (American College Testing), а также на уровнях средней и начальной школы.

Часть 3. Тестирование способностей

ции о любых культурных изменениях, затрагивающих изучаемую популяцию; к ним можно отнести объем и характер образования, достижения в области средств связи и транспортных средств, могущие повлиять на межкультурные контакты, или любые другие события, затрагивающие течение жизни конкретных людей и могущие изменить степень или направление их интеллектуального прогресса.

Дополнительную путаницу, затрудняющую сравнительный обзор изменений в различных популяциях, может также вносить ошибочное, но, к сожалению, распространенное употребление термина «интеллект» (и особенно IQ), как если бы он означал единое, идентифицируемое свойство организма (см., например, Flynn, 1987). Если же вместо этого под интеллектом понимать объединение способностей, необходимое для эффективной деятельности и продвижения вперед в определенной среде (см. главу 11), тогда правильная интерпретация как индивидуальных показателей теста интеллекта, так и средних результатов популяций, обследованных в разное время и в разных местах, безусловно, требует знания важнейших условий, упоминавшихся выше. В настоящее время отмечается растущее признание технических проблем, встречающихся при измерении изменения популяции, а также многообразия методов оценки таких изменений в различных контекстах и с разными целями (см. особенно Gottman, 1995).

Культурное разнообразие

Применение тестов к представителям различных культур рассматривается под разными углами зрения в разных частях этой книги. В главе 18 затрагиваются социальные и этические аспекты такого тестирования, особенно в отношении групп меньшинств в составе более широкой национальной культуры. Технические проблемы, связанные с систематической ошибкой теста и систематической ошибкой задания, проанализированы соответственно в главах 6 и 7. А в главе 9 рассмотрены типичные тесты, первоначально предназначавшиеся для применения в самых разных культурах (так называемые «культурно-свободные тесты»). В этом разделе мы познакомим читателя с основными теоретическими вопросами о роли культуры в поведении, делая особый акцент на интерпретации и использовании показателей тестов интеллекта.

Область культурной психологии.В последние три десятилетия XX века наблюдался заметный рост исследований и публикаций по культурной психологии (Berman, 1990; Irvine, & Berry, 1988). Было даже проведено несколько международных конференций, посвященных почти целиком этой теме (см., например, Brislin, 1993; Cronbach, & Drenth, 1972; Manoleas, 1995). Эта область психологии рассматривает по существу поведенческие различия между группами, выросшими и функционирующими в объективно различимых культурных средах. Такие среды могут быть и узкими, как, например, квартал или деревня, и широкими, как страна или континент. Кроме того, некоторые широко определяемые культуры, такие как латиноамериканская, состоят из субкультур — мексиканской, кубинской, пуэрто-риканской, центрально- и южноамериканской, которые достаточно различаются для того, чтобы выделять их как таковые при необходимости понять индивидуальное поведение (см., например, Geisinger, 199Л Marin & Marin, 1991).

Роль культуры в поведении человека можно представить себе как форму предмету ной специфичности (domain specificity), аналогичную признаваемой в когнитивной

Глава 12. Психологические проблемы тестирования способностей

3/3

психологии (см. главу 11). Приступив к анализу основных психологических процессов, таких как научение, запоминание, решение задач {problem solving) и эмоции, когнитивные психологи вскоре обнаружили, что данные процессы проявляются в поведении, зависящем от предметной области. Например, память, решение задач и рассуждение могут очень существенно различаться в тех случаях, когда человек играет в шахматы, раздумывает над математической задачей или пишет реферат.

Культурная психология началась с изучения поведения в далеко отстоящих друг от друга и малоизвестных культурах, которые заметно отличались от собственной культуры исследователя, и быстро развилась в область систематического исследования непохожих историй жизни людей, воспитанных в разных культурах. По существу, область современной культурной психологии символизирует признание культурной специфичности всего человеческого поведения, в силу чего основные психологические процессы могут приводить к сильно различающимся действиям, аттитюдам, представлениям о себе и о мире у представителей разных культур (L. L. Adler, & Gielen, 1994; Berry, Poortinga, Segall, & Dasen, 1992; Diaz-Guerrero, 1990; Shweder, & Sullivan, 1993). Вклад культуры в поведение человека все больше осознается и интегрируется во все области психологии, от исследований и теории развитии человека на протяжении всей его жизни, социального поведения, эмоций или мышления,1 с одной стороны, до практики индустриально-организационной, клинической и консультирующей психологии с другой.2

Растущее осознание роли культурных факторов во всех областях психологии нашло отражение в программе одного из ежегодных съездов Американской психологической ассоциации (АРА, 1994). В добавление к однодневному семинару (в рамках программы непрерывного образования) по теме «Восприимчивость к культурным различиям при оценивании и вмешательстве», ежегодные лекции ведущих специалистов (Master Lectures) были посвящены общей теме: «Международные перспективы кросс-культурной психологии». Сами эти лекции были частью тематического минисъезда (TopicalMiniconvention), посвященного теме «Культурное разнообразие: Будущее Америки» и продолжавшегося все пять дней работы съезда АПА. Дополнительным свидетельством быстро растущей кросс-культурной ориентации психологии служит основание нового журнала — Culture and Psychology (1995).

Культурные различия против культурной отсталости.Когда психологи в первой четверти XX столетия начали разрабатывать инструменты для кросс-культурного тестирования, они надеялись на то, что есть хотя бы теоретическая возможность измерить «наследственный интеллектуальный потенциал» независимо от влияния культуры. Поведение индивидуума представлялось покрытым своего рода культурной облицовкой, проникнуть под которую предполагалось с помощью того, что в то время называли «культурно-свободными» (culture-free) тестами. Последующее развитие генетики и психологии показало ошибочность этой концепции. Теперь мы понимаем, что факторы наследственности и среды взаимодействуют на всех стадиях развития организ-

1 См., например, Gorraly, & Brodzinsky (1993), Kitayama, & Marcus (1994), Mistry, & Rogoff (1985), Nugent, Lester, & Brazelton (1991), Rogoff (1990), Rogoff, & Chavajay (1995), Smith, & Bond (1993), Topping, Crowell, & Kobayashi (1989).

2 См., например, Freilich, Raybeck, & Savishinsky (1991), Pedersen (1987), Pedersen, & Ivey (1993), Triandis, Dunnette, & Hough (1994).

Часть 3- Тестирование способностей

ма и что их совместное влияние сложно переплетено в фактическом поведении индивида. Культурой пропитаны почти все контакты человека со средой. И поскольку всякое поведение подвержено влиянию культурной среды, в которой индивидуум воспитывается, а психологические тесты есть не больше чем выборочная проверка поведения, культурные влияния будут и должны сказываться на выполнении теста. Тщетно поэтому пытаться изобрести тест, свободный от влияния культуры. Позднее эта цель была изменена на другую — создать тесты, основанные исключительно на общем для разных культур опыте. Вот почему такие термины, как «общекультурные» {culture-common), «культурно-беспристрастные» {culture-fair) и «кросс-культурные» {cross-cultural) тесты, заменили собой более старый термин «культурно-свободные» тесты.

И все же ни один тест не может быть одинаково применимым или равно «справедливым» для всех культур. Множество параметров, по которым различаются культуры, столь же велико, как и множество разнообразных культурно-беспристрастных тестов. Тест, не предполагающий умения читать, может оказаться культурно-беспристрастным в одной ситуации, неязыковый тест — в другой, тест действия — в третьей, а адаптация переведенного на другой язык вербального теста — в четвертой. Многочисленные варианты имеющихся в наличии кросс-культурных тестов не являются взаимозаменяемыми, однако они полезны при проведении разных типов межкультурных сравнений. Более того, маловероятно, что какой-либо тест может быть одинаково «справедливым» более чем для одной культурной группы, особенно если культуры совершенно несхожи. Сокращая проявление культурных различий в выполнении теста, кросс-культурные тесты не могут устранить их полностью. Каждый тест ставит в более благоприятные условия представителей той культуры, в которой он создавался. Простое использование бумаги и карандаша или предъявление абстрактных задач, не имеющих непосредственного практического значения, будут благоприятствовать одним культурным группам и мешать другим. Эмоциональные и мотивационные факторы также влияют на выполнение теста. Среди множества релевантных условий, различающихся при переходе от одной культуре к другой, можно упомянуть естественный интерес к содержанию теста, раппорт с тестирующим, стремление хорошо выполнить тест, желание превзойти других и сложившиеся традиции индивидуального или совместного решении задач {problem solving).

Культурные различия становятся культурными барьерами, когда человек покидает ту культуру или субкультуру, в которой он воспитывался, и пытается действовать, конкурировать и добиваться успеха в другой культуре. С более широкой точки зрения, однако, именно эти контакты и взаимообмены между культурами стимулируют развитие цивилизаций. Культурная изоляция, хотя, возможно, в чем-то более комфортна для отдельных людей, ведет к застою в развитии общества.

Близкое понятие — культурная депривация. Хотя этот термин использовался в самых разных смыслах, Фейерстейн (Feuerstein, 1980,1991; Feuerstein, & Feuerstein, 1991) наделил термин «культурная депривация» особым значением и сделал центральным в своей программе когнитивного тренинга. Он рассматривал культурную депривацию как состояние пониженной когнитивной модифицируемости, вызванное недостатком опыта опосредствованного обучения (mediated learning experience). Передача накопленных в культуре знаний от одного поколения к другому — это чисто человеческое явление. В этом процессе родитель или другое лицо, выполняющее фуН" кции воспитателя, действует как посредник (mediating agent) в том, что касается отбора и организации стимулов, с которыми сталкивается ребенок. Фейерстейн считает

Глава 12. Психологические проблемы тестирования способностей 375

такое опосредствованное обучение существенным для когнитивного развития ребенка, поскольку оно благоприятствует формированию и закреплению учебных установок, ориентации и других моделей поведения, облегчающих последующее обучение. У детей, которые по какой-то причине не смогли приобрести опыта такого опосредствованного обучения, отсутствуют предпосылки для высшей познавательной деятельности. В противоположность этому, те, кто получил опыт опосредствованного обучения в рамках своей культуры, развили определенные навыки и привычки, составляющие необходимое условие непрерывной модифицируемости, и могут приспособиться к требованиям новой культуры после относительно короткого переходного периода. Кроме того, вполне вероятно, что в развивающихся странах психологи из числа коренного населения со временем разработают и будут использовать тесты, соответствующие родной культуре.

Согласно другой точке зрения, культурные стереотипы просто в силу своего существования могут прямо влиять на выполнение теста конкретным человеком (Steele, Spencer, & Aronson, 1995). В одном долгосрочном исследовании было установлено, что знание о существующих стереотипах может влиять на мотивацию и отношение к тесту некоторых испытуемых, проявляясь их в отвлекаемости, снижении самооценки и усилий, а также в слабой надежде на успешный результат. Такая реакция получила название незащищенности от стереотипов (stereotype vulnerability), и было обнаружено ее влияние на тестовые показатели как в тендерных, так и в этнических сравнениях. Для того чтобы программы работы с особо защищаемыми группами населения были эффективными, требуется больше, чем одно только специальное коррективное обучение. По крайней мере, в отдельных случаях ожидание определенного результата в конкретных областях тестирования, таких как вербальная, математическая или пространственная, может потребовать особого внимания, чтобы предотвратить неудачу тех, кто при других обстоятельствах мог бы выполнить соответствующие задания на среднем или даже самом высоком уровне.

Язык в транскультуральном тестировании. Большинство традиционных кросс-культурных тестов построены на невербальном содержании в надежде получить по возможности более беспристрастную к культуре мерку для тех же интеллектуальных функций, которые измеряются вербальными тестами интеллекта (см. главу 9). Оба допущения, лежащие в основе этого подхода, вызывают сомнения. Во-первых, невозможно согласиться с тем, что невербальные тесты измеряют те же функции, что и вербальные, даже если эти тесты кажутся очень похожими. Тест пространственных аналогий — это не просто невербальный вариант теста словесных аналогий. Некоторые из первых неязыковых тестов, таких как Армейский бета, были сильно нагружены перцептивными способностями и способностью оперировать пространственными представлениями, совершенно не связанными с вербальными и числовыми способностями. Даже в тестах типа Прогрессивных матриц Равена и в других неязыковых тестах, специально предназначенных для выявления «чистой» способности к логическому выводу и абстрактной концептуализации, факторный анализ обнаружил сильный вклад невербальных факторов в дисперсию тестовых показателей (например, R. S. Das, 1963). Такие результаты подтверждаются более современными исследованиями в когнитивной психологии, неоднократно демонстрировавшими зависмость процессов мышде-ния от содержания (content specificity). Стратегии и навыки решения задач (problem solving) развиваются в процессе реагирования на содержание специфической предметной области и в специфических контекстах (см. главу 11).

Часть 3. Тестирование способностей

Если посмотреть с другой точки зрения, все большее количество фактов говорит о том, что неязыковые тесты могут быть больше нагружены культурными факторами чем языковые. Исследования разнообразных культурных групп во многих странах мира выявили большие групповые различия в выполнении целого ряда невербальных тестов по сравнению с вербальными (Irvine, 1969a, 1969b; Jensen, 1968; Ortar, 1963 1972; Trimble, Lonner, & Boucher, 1983; Vernon, 1969). Есть и данные о том, что рисуночные (figural) тесты, возможно, больше подвержены эффектам обучения, чем вербальные и числовые (Irvine, 1983). Использование графической формы представления заданий само по себе может оказаться непригодным в культурах, представители которых не привыкли пользоваться символическими рисунками. Двумерное воспроизведение предмета не является его точной копией, в нем даны лишь некоторые признаки которые, вследствие прошлого опыта, приводят к восприятию этого предмета. Если такие признаки сильно редуцированы, как в рисунке головы, служащей символическим изображением человека, то при отсутствии необходимого прошлого опыта правильное восприятие может и не последовать. Накопленные к настоящему времени эмпирические данные указывают на заметные различия в восприятии рисунков представителями разных культур (R. J. Miller, 1973; Segall, Campbell, & Herskovits, 1966).

Согласно еще одной точке зрения, невербальные, пространственно-перцептивные (spatial-perceptual) тесты часто требуют сравнительно абстрактных мыслительных процессов и аналитических когнитивных стилей, характерных для представителей среднего класса западных культур (J. W. Berry, 1972; R. A. Kohen, 1969). Людям, воспитанным в иной культурной среде, такие подходы к решению задач могут быть менее привычны. Культуры различаются по тому значению, какое они придают обобщению и поиску общих признаков непохожих впечатлений. В некоторых культурах поведение типично связывается с конкретными контекстами и ситуациями. Ответ на вопрос может зависеть от того, кто его задает, и от типа затрагиваемого им содержания (Cole, & Bruner, 1971; Goodnow, 1976;Neisser, 1976,1979).

Конечно, методические трудности в проведении вербального теста в культурах, говорящих на одном языке, отсутствуют, но когда языки различны, тест нуждается в переводе, и здесь возникают проблемы сопоставимости норм и эквивалентности показателей. Следует также отметить, что простого перевода редко бывает достаточно. Обычно требуется некоторая адаптация и пересмотр содержания заданий, поскольку оно может быть более знакомым представителям одной культуры, чем другой. На выполение теста могут существенно влиять даже более тонкие различия. Например, относительная длина слова или звуковое сходство между разными словами в одном из языков может изменить трудность чтения заданий теста при переводе его с одного языка на другой (Valencia, & Rankin, 1985). Вследствие множества аспектов, в которых переводные версии теста могут отличаться от оригинала, вряд ли разумно предполагать их сравнимость (Duran, 1989; Marin & Marin, 1991). Стандарты тестирования (AERA, АРА, NCME, 1985, chap. 13) предписывают, что надежность, валидность и нормы переводных версий теста должны независимо устанавливаться для любой популяции, в которой предполагается их использование.

Следует иметь в виду, что культурные факторы, влияющие на ответы тестируем»' го, вероятно, сказываются и на более широкой области поведения, для выборочной проверки которого создается данный тест. В англоязычной культуре, например, неД"' статочное владение английским языком может мешать ребенку не только при выпол нении теста интеллекта, но также быть помехой в учебе, общении с одноклассникам

Глава 12. Психологические проблемы тестирования способностей

И игровой деятельности, препятствуя тем самым нормальному ходу интеллектуального и эмоционального развития. У взрослого слабое знание языка культуры, в которой он живет, могло бы серьезно ограничить уровень выполнения работы, межличностные отношения и другие виды жизненно важной активности. Можно привести множество других примеров таких культурных различий. Одни относятся к когнитивным различиям, таким как трудности чтения или неэффективные стратегии решения абстрактных задач; другие — к различиям в аттитюдах и мотивации, таким как отсутствие интереса к интеллектуальным занятиям, враждебность к представителям власти, низкая потребность в достижениях или низкая самооценка. Все подобные состояния поддаются исправлению и улучшению с помощью целого ряда средств, от обучения языку и повышения уровня грамотности до личного консультирования и психотерапии. И все они, по всей вероятности, влияют как на выполнение тестов, так и на повседневную деятельность ребенка и взрослого.

Важная роль языка в выполнении тестов и в повседневной деятельности стимулировала разработку тестов владения языком (language proficiency tests), причем как языка страны рождения, так и языка страны проживания. Большинство ныне доступных в США тестов такого рода проверяют владение английским и испанским языками. Перечень тестов владения языком, а также ссылки на литературу, освещающую исследования, разработку и оценку таких тестов, можно найти в работе Duran (1989, р. 574-577). Что касается более широкой трактовки билингвизма, см. de Groot & Barry (1993).

Ситуация тестирования.Быстрое расширение транскультуральных контактов в современном мире повышает вероятность предъявления тестов выходцам из различных культур. Каждый, кто проводит тестирование, может ожидать, что ему придется столкнуться хотя бы с одним тестируемым из культуры, отличающейся от его собственной. Следовательно, подготовка специалистов в этой области должна включать основные сведения об одной или большем числе разнородных культур, с уделением особого внимания вероятным культурным влияниям на развитие индивидуального поведения. Еще более важными являются возможные влияния таких различий на отношение тестируемого к тестированию. Примерами некоторых общих источников различного поведения в ситуации тестирования могут служить вариации в представлении испытуемых о себе, их мировоззрении, степени самораскрытия и привычки решать задачи в одиночку или в группе.

Как уже было показано ранее в этой главе, простое удаление из теста тех частей, которые расцениваются как особенно трудные вследствие иного культурного происхождения индивидуума, привело бы только к снижению его прогностической валид-ности и лишило бы возможности привлечь внимание тестируемого к тем областям, которые необходимо усилить для эффективной деятельности в ожидаемой обстановке. В соответствии с этим, традиционный подход заменяется решением проблемы путем перемещения фокуса на поведение тестирующего в ситуации тестирования.

Восьмидесятые и девяностые годы принесли множество публикаций (руководств, Инструкций, журнальных статей и т. д.), посвященных подготовке и должному поведению специалистов, проводящих тестирование представителей других культур (Atkinson, Morten, & Sue, 1993; Myers, Wohlford, Guzman, & Echemendia, 1991; Strieker etal, 1990). Часть публикаций была посвящены конкретным проблемам тестирования студентов (Samuda, Kong, Cummins, Lewis, & Pascual-Leone, 1991), другая их часть основ-

Часть 3. Тестирование способностей

ное внимание уделяла работе с детьми (Miller-Jones, 1989; Rogoff, & Morelli, 1989) третья касалась вопросов тестирования конкретных культурных совокупностей или их более мелких образований (Dana, 1984; Diaz-Guerrero, & Szalay, 1991), однако в подавляющем большинстве этих публикаций рассматривалось кросс-культурное тестирование как общая проблема. Их диапазон был весьма широк — от самых общих и кратко сформулированных руководящих принципов, опубликованных Американской психологической ассоциацией в виде небольшой брошюры в 1991 г. и перепечатанных в журнале American Psychologist в 1993 г. («Guidelines», 1993), до всестороннего и подробного рассмотрения вопросов тестирования представителей других культур в книге Роберта Даны (Dana, 1993). Два последних источника следует проштудировать каждому, кто планирует проводить тестирование. Здесь также уместно отметить что всестороннее обсуждение разновидностей, проблем и преимуществ билингвизма можно найти в статье Де Гроота и Бэрри (de Groot, & Barry, 1993).

По существу, особая роль тестирующего в кросс-культурном тестировании включает, во-первых, получение полных сведений (в предварительной встрече с тестируемым), касающихся культурной идентичности, степени и типа аккультурации, а также особенностей исходной культуры, могущих, предположительно, повлиять на выполнение теста данным человеком. Во-вторых, тестирующему необходимо приспособить свое поведение к потребностям конкретного тестируемого. В этой связи тестирующий должен обдумать ряд вопросов: с чего начать тестирование? как объяснить цель теста? как мотивировать тестируемого выполнить тест надлежащим образом? Кроме того, поведение самого тестирующего должно способствовать установлению доброжелательных отношений с тестируемым. При интерпретации и дальнейшем использовании результатов тестирования безусловно следует учитывать культурные факторы, равно как и характер обратной связи, т. е. в какой форме и кому предполагается сообщить эти результаты.

Ричард Дана (Dana, 1993) разработал набор вопросников, помогающих тестирующему в получении необходимой информации от тестируемых. Некоторые из этих вопросников предназначены для общего употребления. Другие же были составлены для специфических культур (североамериканских индейцев, американцев азиатского происхождения) или для отдельных субкультур внутри них. В качестве заключительного замечания следует добавить, что акцент на важности получения хоть каких-то релевантных сведений о жизненной истории тестируемого для правильного понимания и использования тестовых показателей привлекает внимание к желательности подобной практики в тестировании любого индивидуума, независимо от культурных различий.

Часть 4

ТЕСТИРОВАНИЕ

ЛИЧНОСТИ

Наши рекомендации