Стандартная методологическая парадигма в кросс-культурной психологии 9 страница
Экспериментальные исследования в психологии популярны. «Матерью» всех планов исследования по-прежнему остается эксперимент, при котором испытуемые распределяются случайным образом для проведения экспериментальных процедур (Campbell & Stanley, 1966; Cook & Campbell, 1979; Poortinga & Malpass, 1986). Можно обнаружить некоторые разновидности общего плана, такие как условия двойного слепого эксперимента, контроль при помощи плацебо и/или проведение эксперимента с рассмотрением противоположных гипотез (Christensen, 1997). Основным преимуществом экспериментов такого плана является строгий контроль внешних переменных. Различие между экспериментальной и контрольной группами состоит только в экспериментальной процедуре, в отношении прочих факторов они равноценны и соответствуют конечным целям эксперимента. Когда экспериментальная и контрольная группа обнаруживают статистически значимое различие в показателях, мы можем с уверенностью утверждать, что экспериментальная процедура оказывает воздействие на зависимую переменную, которая представляет для нас интерес.
Надлежащим образом спланированные эксперименты, несмотря на то что они были разработаны для проведения лабораторных исследований на Западе, обладают панкультурной валидностью. Пример проведения одного из таких экспериментов вне западного контекста дают Шреста, Вест, Блейчродт, ван де Вивьер и Хаутваст (Shrestha, West, Bleichrodt, van de Vijver & Hautvast, в печати), которых интересовало влияние недостатка йода и железа на умственное развитие. Группа детей из начальной школы в районе Ntckeu в Малави, где разрастание щитовидной железы и дефицит железа носят эндемический характер, была распределена случайным образом для проведения одной из четырех экспериментальных процедур: одна часть группы получала препарат йода, вторая — препарат железа, третья — комбинацию этих препаратов, а четвертая — плацебо. Дети были поделены на четыре группы случайным образом, и те, кто руководил проведением теста, не знали, к какой группе принадлежит каждый из детей. При проведении различных когнитивных тестов,'таких как проверка беглости речи и словарного запаса, оценки группы, которая получала йод, были в среднем выше, чем у группы, получавшей плацебо; группа, получавшая железо, дала менее высокие результаты, однако и в ней тем не менее обнаружился заметный эффект. Неукоснительно придерживаясь жестких правил эксперимента (таких, как случайное отнесение испытуемых к группам, находившимся в разных экспериментальных условиях, наличие плацебо-группы и полное отсутствие информации у проводивших тестирование о препаратах, которые принимали дети), авторы могли быть уверены в том, что наблюдаемое воздействие принимаемых препаратов действительно имело место и проявилось не в связи со случайными различиями в экспериментальных группах.
Хотя данный пример может проиллюстрировать общую адекватность для кросс-культурной психологии надлежащим образом выстроенного эксперимента (true experiment}, надо признать и его недостатки: все четыре экспериментальные группы принадлежали к одной культуре, а следовательно, исследование не носило культурно-сравнительного характера. Можно задать вопрос, применим ли подобный план эксперимента к кросс-культурным сравнениям. Ответ на него отрицательный; экспериментатор не может случайным образом отнести испытуемых к различным культурам. Подобно другим внутренне присущим испытуемому особенностям, принадлежность к культуре не может быть задана в рамках эксперимента.
Проблема, связанная с применением культурно-сравнительной методологии, достаточно сложна; предполагается, что культурные группы, в отличие от экспериментальных групп при надлежащем образом выстроенном эксперименте, могут отличаться и действительно отличаются друг от друга по множеству параметров. Различия в оценках в разных культурных группах в принципе могут порождаться всеми факторами, отличающими выборки друг от друга, такими как возраст, пол, уровень образования, опыт работы с психологическими тестами, мотивация и заинтересованность в исследовании. Если в центре внимания кросс-культурного исследования стоит простое документирование кросс-культурных различий, возможно, не стоит беспокоиться о различиях, которые сбивают с толку. Если производитель безалкогольных напитков, который хочет продавать свой напиток в еще одной стране, интересуется, нужно ли внести какие-то изменения в его вкус, он может не волноваться по поводу различий, которые приводят в замешательство. Скорее всего, он не слишком озабочен причиной, по которой вкусовые предпочтения в разных странах различаются, поскольку куда больше его интересует конкретная и достоверная информация, касающаяся оптимального уровня сладости и других вкусовых особенностей его напитка в данной стране. В кросс-культурной психологии диапазон наших интересов шире, и полученные путем наблюдения данные о различиях часто означают лишь начало поисков их объяснения.
Житейское объяснение кросс-культурных различий часто основано на простой схеме рассуждений: если японские и американские женщины ведут себя по-разному, причина этого в различиях культурного происхождения. G-научной точки зрения, такой ход мысли не открывает ровным счетом ничего (Lonner & Adamopoulos, 1997; Poortinga & van de Vijver, 1987). Сказать, что японки и американки ведут себя по-разному, поскольку они принадлежат к разным культурам, означает всего лишь парафраз констатации существования поведенческих и кросс-культурных различий; таким образом, мы уклоняемся от вопроса об истоках этих различий. Это напоминает высказывание: моя машина не ездит, потому что она сломалась. Как не естественно звучит это высказывание, автомеханик не сможет помочь мне, пока проблема не будет определена более конкретно. Подобным образом, действительное объяснение не ссылается на культурную принадлежность в целом, но анализирует факторы более специфического характера, которые могут быть причиной данных различий.
Пытаясь объяснить кросс-культурные различия, мы часто вынуждены выбирать одно объяснение из множества. При этом определять наш выбор могут теоретические и методологические соображения. Примером первых может быть использование индивидуализма—коллективизма для объяснения паттернов культурных различий; выявленные в процессе наблюдения различия в оценках затем рассматриваются в рамках более широкой теоретической схемы. Методологическое обоснование может базироваться на всесторонней оценке параметров конструктов, которые дают конкурирующие объяснения (например, желательность в социальном плане).
Проблематичная с методологической точки зрения сущность культуры как переменной в кросс-культурном исследовании имеет различные аспекты, рассмотренные в следующих разделах. Поскольку понятие культуры является чрезвычайно широким общим обозначением огромного множества различий, центральной проблемой кросс-культурного исследования является точное определение источника кросс-культурных различий; с методологической точки зрения важным аспектом проведения кросс-культурного исследования является вопрос об альтернативных вариантах объяснения.
История методов исследования в сфере кросс-культурной психологии
Методологические корни кросс-культурных исследований в большей степени находятся в психологии, чем в культурной антропологии с ее вниманием к наблюдению ситуативного поведения (включенное наблюдение), использованию носителей языка и культуры в качестве экспертов и опорой на качественные методы. Последние чаще используются в культурной психологии (Cole, 1996; Greenfield, 1997а; Miller, 1997).
Крупным событием в методологии психологии была публикация Кэмпбелла и Стэнли (Campbell & Stanley, 1966) «Экспериментальное и квазиэкспериментальное планирование исследований». В ней была дана характеристика методологических концепций того времени. Надлежащим образом спланированный эксперимент, описанный в предыдущем разделе, рассматривался как самый простой способ получения достоверных, воспроизводимых сведений в психологии. Данная монография имела большое влияние и определила эталон исследования для психологии и кросс-культурной психологии. Акцент ставится на внутреннюю валидность и на опасности при установлении внутренней валидности и внесении в нее поправок (например, эффект переноса на этапах, предшествующих тестированию и после него).
Заимствование распространенных психологических методов послужило стимулом для появления сферы кросс-культурных исследований. Можно было опираться на устоявшиеся средства исследования, анализа и представления данных. К сожалению, опора на психологические методы также имеет свои проблемы. Многократно подтверждалось, что, в определенной мере, классическая экспериментальная схема является прокрустовым ложем для тех отраслей психологии, которые при проведении исследований работают с интактными группами (группами, которые были сформированы не путем случайного назначения) и включают, в частности кросс-культурную, педагогическую, клиническую психологию и психологию организации производства.
Схема эксперимента может работать подобающим образом, если экспериментатор хочет провести эксперимент в рамках разных культур; однако схема может оказаться ограниченной при необходимости работать с культурой как с экспериментальной переменной. Хороший пример можно найти в классической схеме Неймана—Пирсона, которая составляет основу современной практики проверки гипотез. Если мы сравниваем два средних значения в t-тесте, в качестве исходного уровня мы часто выбираем значение 0,05 или 0,01. Низкий уровень значения выбирается для того, чтобы выявленные в ходе наблюдения различия, имеющие статистическую значимость, не зависели от случайных флуктуации, но отражали подлинные различия в средних показателях населения. Теперь представьте, что набор когнитивных тестов дан городским детям англо-американского происхождения и неграмотным деревенским детям из Бангладеш. Различия в оценках когнитивных тестов для этих групп, разумеется, будут весьма существенными, поскольку обучение в школе оказывает значительное влияние на показатели таких тестов (например, Rogoff, 1981; van de Vijver, 1997). Тест с нулевой гипотезой об отсутствии культурных различий — не слишком разумный подход к исследованию данных групп. Можно утверждать даже, что в данном случае культурная дистанция столь велика, что если бы в процессе наблюдения не было выявлено существенных различий ни по одному из тестов, входящих в комплект, результат можно было бы считать более содержательным, чем обнаружение существенных различий. В общем, рабочая схема тестирования с нулевой гипотезой об отсутствии культурных различий может быть полезна для сравнения тесно связанных между собой культурных групп, таких, например, как бельгийцы, говорящие на фламандском языке, и бельгийцы, говорящие по-французски. При этом та же самая схема может быть, прежде всего, препятствием, а не подспорьем при сравнении групп, резко отличающихся в культурном отношении. Установка на избегание ошибок, отнесенных к типу I (отклонение нулевой гипотезы, которая является верной), неявным образом присутствующая в схеме Неймана-Пирсона, представляет собой весьма сомнительную базу для проверки гипотез в кросс-культурной психологии. Сказанное можно подытожить выводом о том, что классическая экспериментальная парадигма нуждается в корректировке для обеспечения потребностей кросс-культурных исследований.
Многие публикации, касающиеся методов кросс-культурных исследований, поясняют необходимость такого «корректирующего подхода». Вопрос о том, как мы можем применять или адаптировать методы традиционной психологии, чтобы сделать их пригодными для использования при проведении кросс-культурных исследований, красной нитью проходит через множество работ, связанных с методологией кросс-культурных исследований, в их числе «Методы кросс-культурного исследования» Брислина, Лоннера и Торндайка (Brislin, Lonner & Thorndike, Cross-Cultural Research Methods, 1973); главы по методологии в первом издании «Руководства по кросс-культурной психологии» Триандиса и Берри (Triandis & Berry, Handbook of Cross-Cultural Psychology, 1980); работа Лоннера и Берри «Методы полевых кросс-культурных исследований» (Lonner & Berry, Field Methods in Cross-Cultural Research, 1986); глава и книга ван де Вивьера и Лейнга (van de Vijver & Leung, 1997a, 1997b).
В течение последних десятилетий наблюдался значительный прогресс в области «корректирующего подхода». Прежде всего, специалисты по кросс-культурной психологии могут продолжать участие в работе над ограниченной применимостью надлежащим образом выстроенного эксперимента и повсеместным применением квазиэкспериментального планирования в психологии. Работа Кука и Кэмпбелла «Квазиэкспериментирование» (Cook & Campbell, Quasi-Experimentation, 1979) продолжает оригинальную работу Кэмпбелла и Стэнли (Campbell & Stanley, 1966) в актуальном для кросс-культурной психологии направлении. Она содержит обсуждение вопросов о причинной обусловленности при неэкспериментальных исследованиях и о повышении уровня валидности и факторах, угрожающих ей, при квазиэкспериментальных исследованиях. Во-вторых, достижения статистики делают возможным анализ проблем, которые ранее не поддавались решению в процессе кросс-культурного исследования.
Современные стандарты при проведении кросс-культурного исследования
Отклонения и эквивалентность: определения и классификации
Представим, что в двух странах раздается опросник по определению уровня депрессии и что в него включены и соматические (например, потеря аппетита, сонливость), и психологические (например, уныние, отсутствие интереса к другим людям) симптомы. Далее, предположим, что проявление данных проблем на соматическом уровне встречается в одной из культур повсеместно, однако психологические симптомы в той же культуре не считаются проявлениями депрессии. Кросс-культурное сравнение средних показателей в соответствии с опросником имеет низкий уровень валидности. Из-за различий в проявлениях депрессии в данных культурах трудно ответить на вопрос о том, какая группа обнаружила больше симптомов депрессии; безусловно, этот вопрос не решается проведением теста t, который определяет средние показатели двух культурных групп.
Два наиболее существенных для кросс-культурной методологии понятия, отклонения и эквивалентность (Poortinga, 1989), можно проиллюстрировать примером. Под отклонениями понимается наличие мешающих факторов, которые ставят под сомнение сравнимость оценок, полученных в разных культурных группах. Если полученные оценки подвергается влиянию отклонений, их психологическое значение зависит от группы, и различия между группами в итоговых оценках должны, по крайней мере, до некоторой степени объясняться дополнительными психологическими конструктами или измерительными артефактами.
Наличие отклонений делает сравнимость оценок, полученных в разных культурах, еще более проблематичной. Наличие отклонений, влияющих на сравнимость, при оценке различных параметров заставляет обратиться к понятию эквивалентности. Под эквивалентностью понимается сравнимость оценок, полученных при тестировании в различных культурных группах. Безусловно, отклонения и эквивалентность связаны между собой, Можно доказать, что эти понятия являются зеркальным отражением друг друга: отклонения являются синонимом неэквивалентности; и наоборот, эквивалентность предполагает отсутствие отклонений. Однако здесь мы не будем обращаться с ними таким образом, поскольку для представления методологии кросс-культурных исследований будет полезнее выявить источники отклонений и их влияние на сравнимость оценок.
Согласно ван де Вивьеру и ЛеЙнгу (van de Vijver & Leung, 1997a, 1997b), при кросс-культурном исследовании можно выделить три источника отклонений. Первая разновидность отклонений определена как отклонения, связанные с конструктом; они имеют место, когда оцениваемый конструкт не является идентичным в разных группах или когда поведение, определяющее сферу интересов, с котором связаны тестовые задания, в различных культурах не является тождественным, как было проиллюстрировано в примере, связанном с исследованием депрессии. Эмпирический пример можно найти в работе Хо (Но, 1996), касающейся сыновней благодарности (психологической характеристики, которая определяет хорошего сына или хорошую дочь). Западные представления на этот счет более ограничены чем китайские, в соответствии с которыми дети должны взять на себя уход и заботу о престарелых родителях, когда те будут нуждаться в помощи. Отклонения, связанные с конструктом, препятствуют кросс-культурной оценке конструкта при помощи одних и тех же показателей. Опросник, касающийся сыновней благодарности, опирающийся на китайские представления, будет включать в себя аспекты, которые не имеют отношения к испытуемым западного происхождения, в то время как опросник, базирующийся на западных представлениях, упустит аспекты, важные для китайцев. Эмбретсон (Embretson, 1983) предложил родственный термин неполное представление конструкта, обозначающий неполноту отбора всех релевантных областей при создании инструментария исследования. Между отклонениями, связанными с конструктом, и термином, предложенным Эмбретсоном, есть существенные различия; в то время как неполное представление конструкта представляет собой проблему слишком узко определенного инструментария для оценки широкого понятия, то есть проблему, которую можно преодолеть, добавляя тестовые задания, относящиеся к той же области генерализации, отклонения, связанные с конструктом, могут быть исправлены лишь добавлением тестовых заданий, относящихся к другим областям генерализации.
Важную разновидность отклонений представляют собой отклонения, связанные с методом, причиной которых может быть несравнимость выборок, особенности инструментария, влияние экспериментатора или интервьюера и метод применения тестов. В целом, отклонения, связанные с методом, — определение, под которое подпадают все источники отклонений, возникающих в связи с моментами, описанными в разделе, посвященном методике конкретного исследования. Примером может служить дифференцированный уровень знакомства со стимулами (при проверке умственных способностей) и различия в желательном в социальном плане (при исследовании личности и исследованиях общественного мнения). В примере с депрессией отклонения, связанные с методом, могли быть вызваны, среди прочего, возрастными особенностями, половой принадлежностью, степенью открытости испытуемых или социальной желательностью сообщения о проблемах душевного здоровья.
И, наконец, последняя разновидность отклонений встречается на уровне тестовых заданий; она определена как отклонения, связанные с тестовыми заданиями, или различная функциональная значимость тестовых заданий. В соответствии с определением, широко используемым в психологии, тестовое задание провоцирует отклонения, если люди с одинаковым отношением к лежащему в основе конструкту (например, с одинаковым уровнем умственных способностей и образования), но принадлежащие к разным культурным группам, показывают разный уровень средних оценок при выполнении данного тестового задания. Оценка по конструкту обычно выводится из полной оценки за выполнение тестового задания. Если ученикам из Польши и Японии дается тест по географии, который содержит вопрос: «Назовите столицу Польши», то естественно ожидать, что ученики из Польши получат более высокие оценки за ответ на этот вопрос, чем японцы, даже если сравнивать учеников, у которых оценки за выполнения теста в целом одинаковы. Данный вопрос задает отклонения, поскольку он является предпочтительным для одной культурной группы. Если в нашем примере с депрессией симптомы соматического характера являются общими для всех культурных групп, в то время как психологические проблемы воспринимаются как составная часть депрессии лишь в рамках одной из культур, анализ, выявляющий отклонения, связанные с тестовыми заданиями, определит вопросы, связанные с психологическими проблемами как вызывающие отклонения. Из всех типов отклонений отклонения, связанные с тестовыми заданиями, изучены наиболее широко; существуют различные психометрические приемы, которые дают возможность выявить такие отклонения (например, Camilli & Shepard, 1994; Holland & Wainer, 1993).
Здесь предлагаются четыре типа эквивалентности (сравни van de Vijver & Leung, 1997a, 1997b). Первый тип определен как неэквивалентность конструкта. Он означает сравнение «яблок и апельсинов» (например, сравнение китайской и западной сыновней благодарности, о котором говорилось выше). Поскольку общие
признаки здесь отсутствуют, сравнение проводиться не может. Второй тип называется структурная (или функциональная) эквивалентность. Инструмент, который применяется в различных культурных группах, обладает структурной эквивалентностью, если в этих группах при помощи него оценивается один и тот же конструкт. Многие когнитивные тесты проверялись в отношении структурной эквивалентности (Jensen, 1980), например личностный опросник Айзенка (Barret, Petrides, Eysenck & Eysenck, 1998) и так называемая пятифакторная модель личности (МсСгае & Costa, 1997). Структурная эквивалентность не требует обязательного использования идентичных инструментов для исследования разных культур. Оценка депрессии может опираться на разные показатели в различных культурных группах и при этом обладать структурной эквивалентностью.
Третий тип эквивалентности называется эквивалентностью единиц измерения. Инструменты соответствуют требованиям данного типа эквивалентности, если их шкала измерений включает единицы измерения одних и тех же параметров, имеющие различное происхождение (например, шкала Кельвина и шкала Цельсия для измерения температуры). Такой тип эквивалентности предполагает оценку коэффициента соответствия (одними и теми же единицами измерения в каждой культуре). На первый взгляд, может показаться, что в использовании при определении уровня эквивалентности единиц измерения различного происхождения не только нет никакой необходимости, но это может еще и ухудшить положение. И все же, если мы применяем в разных группах шкалу с разными интервалами, оценки могут быть как вполне сравнимыми, так и абсолютно несравнимыми (в случае неэквивалентности).
Необходимость понятия эквивалентности единиц измерения может стать яснее при более подробном рассмотрении воздействия различного уровня желательности в социальном плане или знакомства со стимулами на различие в кросс-культурных оценках. Предположим, что тест Равена предложили грамотной и неграмотной группе. Вполне естественно предположить, что кросс-культурные различия, касающиеся знакомства со стимулами, повлияют на результаты. Грамотные испытуемые предположительно покажут более высокие результаты и лучшие показатели знакомства со стимулами. По крайней мере отчасти, наблюдаемые различия в результатах можно отнести на счет различной степени знакомства со стимулами, которая скроет действительные кросс-культурные различия. Когда нельзя определить, в какой степени оказал влияние каждый из двух источников, интерпретация сравнения групп по средним значениям результатов носит весьма сомнительный характер. Для того чтобы результаты были сравнимы, необходима поправка на разный уровень знакомства. Можно отметить, что базовая идея внесения поправок в полученные результаты, для того чтобы сделать их сравнимыми в полной мере, применятся также в ковариационном анализе, в котором сравнение оценок производится после того, как нарушающее воздействие сопутствующих факторов (отклонения в контексте данной главы) определено статистически.
Лишь в случае скалярной (или полной) эквивалентности можно проводить прямые сравнения; это единственный тип эквивалентности, который допускает статистические тесты, сравнивающие средние значения (такие, как t-тесты и дисперсионный анализ). Этот тип эквивалентности предполагает один и тот же интервал или шкалу отношений в разных группах и дает возможность без риска пренебречь воздействием отклонений. Определить, какой из двух последних типов эквивалентности имеет отношение к делу, достаточно трудно, и необходимость сделать однозначный вывод часто вызывает расхождение во мнениях. Например, расовые различия при определении результатов тестирования умственных способностей интерпретировались как имеющие место благодаря действительно существующим различиям (скалярная эквивалентность) и как отражающие измерительные артефакты (эквивалентность единиц измерения).
Структурная эквивалентность, эквивалентность единиц измерения и скалярная эквивалентность связаны иерархически. Третья предполагает в качестве предварительного условия вторую, необходимым условием которой является наличие первой. Вытекающее отсюда следствие состоит в том, что эквивалентность более высокого уровня труднее поддается выявлению. Проще доказать, что при помощи определенных средств в разных культурных группах оценивается один и тот же конструкт (структурная эквивалентность), чем доказать численную сравнимость в разных культурах (скалярная эквивалентность). С другой стороны, более высокие уровни эквивалентности допускают более точные сравнения оценок, полученных в разных культурах. В то время как в случае структурной эквивалентности могут сравниваться только факторные структуры или помологические схемы (Cronbach & Meehl, 1955), эквивалентность единиц измерения и полная скалярная эквивалентность позволяют осуществить анализ черт кросс-культурного сходства и различия на уровне мелких структурных единиц. И лишь в случае полной эквивалентности могут сравниваться средние значения показателей, полученные в разных культурах при помощи t-тестов и ковариационного (дисперсионного) анализа.
Источники отклонений
Отклонения и эквивалентность не являются неотъемлемыми характеристиками инструмента, но возникают в процессе применения инструмента в рамках не менее чем двух культурных групп; они являются свойствами кросс-культурного сравнения. Решения об уровне эквивалентности и наличии или отсутствии отклонений должны быть обоснованы эмпирически. Требование такого обоснования не должно пониматься как надежда на слепой эмпиризм и невозможность осуществления предшествующих исследованию мероприятий, которые способствовали бы минимизации отклонений и максимизации эквивалентности. Напротив, далеко не все инструменты в равной мере восприимчивы к отклонениям. Например, более структурированные тесты в меньшей степени чувствительны к отклонениям, чем вопросы открытого типа. Подобным образом, сравнение с родственной группой дает меньшее количество отклонений, чем сравнение с группами, значительно отличающимися по культурному происхождению. Чтобы предотвратить отклонения, необходимо выявить их потенциальные источники. В табл. 5.1 дан их краткий обзор, основанный на классификации ван де Вивьера и Танцера (van de Vijver & Tanzer, 1997; ср. van de Vijver & Poortinga, 1997). Предложенный перечень носит предварительный характер, поскольку источники отклонений весьма многочисленны.