Эффекты привлекательности
Рамки теории «стимул—реакция* оказались тесными для толменовского представления о бихевиоризме, который на первый план в объяснении поведения выдвигает мслярность ицеленаправленность. Действительно ли можно представить себе научение как выработку прочных связей «стимула—реакциир? Не состоит ли оно в ооразовании когнитивных карт, которые по мере надобности актуализируют ожидания ближайших будущих событий? Можно ли представить себе поведение осу-
ществляющимся шаг за шагом по жестко выработанной программе? Может быть^ оно приводится в движение целями и на пути к ним непосредственно (т. е. без проб и ошибок) управляется ожиданиями по типу «средства—цель»? Начиная с 1920-х гг. в первую очередь сторонники Толмена стали проводить исследования, в которых варьировалась степень привлекательности цели. При этом наблюдались внезапные изменения поведения, которые вряд ли можно было объяснить только постепенным совершенствованием в процессе научения. Таким образом, поведение и научение были разведены. Экспериментальный анализ поведения мог освободиться и отделиться от анализа научения. Результаты этих работ Толмен обобщил в вышедшей в 1932 г. книге «Целенаправленное поведение у животных и человека» в виде теории мотивации с позиции привлекательности и ожидания. Прежде чем переходить к обсуждению исследований, рассмотрим использовавшееся в них экспериментальное устройство — Т-образный лабиринт. Как видно из рис. 5.7, такой лабиринт состоит из соединенных друг с другом Т-образных секций, причем одно из ответвлений образует тупик, а в другом имеется дверь, ведущая в соседнюю секцию лабиринта.
Рис. 5.7. Т-образный 14-секционный лабиринт
Одна из исходных серий исследований касалась влияния на поведение побуждений различной силы. Первый эксперимент был проведен в 1924 г. В то время при изучении влияния силы потребности на активность широко использовался колумбийский проблемный ящик. Недостатком этих исследований был слабый контроль привлекательности используемого целевого объекта. Симмонс (Simmons, 1924) первой сделала фактор привлекательности центральным пунктом своего исследования. Она обнаружила, что крысы быстрее обучаются проходить лабиринт, если в целевой камере находят предпочитаемую ими пищу. Животные к началу эксперимента были одинаково голодны, поскольку свой дневной рацион получали толь-
ко через 2-3 ч после эксперимента в своих обычных клетках. Перед каждой попыткой им давалась возможность попробовать находящийся в целевой камере корм. После этого крысы помещались в стартовую камеру. Если кормом был вымоченный в молоке хлеб, скорость бега резко возрастала и количество ошибочных пробежек уменьшалось быстрее, чем при подкреплении семечками. Этот различный эффект побуждения можно интерпретировать двояко: либо большая привлекательность ускоряет научение, либо оно происходит независимо от привлекательности, но ограниченная привлекательность цели меньше мотивирует животное к ее более быстрому достижению. Первое объяснение соответствовало бы более позднему варианту теории подкрепления Халла, второе — постулату Толмена о «нужности целевого объекта», которая наряду с соответствующим уровнем обучепно-сти непосредственно детерминирует поведение в лабиринте.
Данные исследований Эллиота (Elliott, 1928) подтвердили правильность последней интерпретации. Во время обучения группы экспериментальных животных прохождению лабиринта он изменял силу привлекательности объекта. Крысы этой группы после десятой попытки прохождения лабиринта находили в целевой камере вместо смеси из отрубей менее привлекательные семечки. Уже в следующих попытках прохождения лабиринта число ошибок возрастало и даже превосходило уровень контрольной группы, подкреплявшейся только семечками. На рис. 5.8 изображены «1ф1 шые научения» обеих групп животных. Внезапное увеличение числа ошибок при переходе к i и пце с ограниченной привлекательностью нельзя объяснить молниеносным забыванием, оно может быть лишь следствием независимого от научения эффекта мотивации. Поскольку достигнутый к тому моменту уровень обученное™ в этом случае больше не наблюдался, следует различать научение и поведение, учитывая независимое влияние привлекательности целевого объекта.
Рис. 5.8. Влияние уровня привлекательности на достижения (переход от более к менее предпочитаемому корму) (Elliott, 1928, S. 26)
В другом своем исследовании Эллиот (Elliott, 1929) по прошествии девяти дней изменял вид подкрепления (корм на воду). У менее голодных, но ощущавших сильную жажду животных сразу после введения адекватного потребности целевого объек-
та (воды) наблюдался рост достижений, проявлявшихся в увеличении скорости бега и уменьшении числа ошибок. Иными словами, определяющая уровень достижения привлекательность целевого объекта зависит от сиюминутного состояния потребности. То же соотношение Левин установил для квазипотребности и валентности. Однако эффект привлекательности целевого объекта определяется помимо адекватности потребности еще одной, независимой от потребности переменной, которая соответствует фактору G в формуле валентности Левина. Согласно Сим-монс и более позднему систематическому исследованию Янга (Young, 1947), эта переменная содержит качественные характеристики целевого объекта. Креспи (Crespi, 1942,1944) также доказал значимость его количественных показателей. Увеличение количества пищи мгновенно улучшает уровень достижения при экспериментальном научении голодного животного. Этот так называемый эффект Креспи опровергает постулат теории подкрепления Халла о большом количестве подкреплений как решающем факторе образования привычки; но к этому мы еще вернемся.
Латентное научение: разделение научения и мотивации
Крайним случаем варьирования привлекательности является полное ее отсутствие; при этом не происходит подкрепления и, следовательно, не приходится ожидать целенаправленного поведения. А что же в подобной ситуации происходит с научением? То, что научение имеет место, первым доказал Блоджетт (Blodgett, 1929) в экспериментах по так называемому латентному научению. Три группы в равной степени голодных крыс в течение девяти дней по одному разу в день помещались в лабиринт. Первая группа находила корм в целевой камере начиная с первого же дня, вторая — с третьего, а третья — с седьмого. После того как животное попадало в целевую камеру, оно при наличии там еды могло есть только в течение 3 мин, а при отсутствии еды извлекалось оттуда через 2 мин. Как видно из рис. 5.9, после введения целевого объекта во второй и третьей группах число ошибок быстро сокращается. Каждая группа почти сразу же достигает уровня научения первой группы, которая подкреплялась с первого дня. Более поздние исследования Толмена и Хонзика (Tolman, Honzik, 1930) подтвердили эти данные.
Рис. 5.9. Зависимость достижений от латентного научения и последующего подкрепления.
Первая группа получала корм после каждой попытки, две другие -соответственно после третьей и седьмой (отмечено х} (Blodgett, 1929, S. 120)
Полученные результаты многое проясняют. Прежде всего это касается того факта, что научение происходит и без подкрепления, а значит, последнее не является необходимым условием научения. Научение может оставаться латентным, т. е., состоявшись, не проявляться в поведении. В таком случае научение должно заключаться в образовании знаний о структуре путей в лабиринте, а не в образовании жесткой последовательности объединений «раздражитель—реакция», поскольку целенаправленный, с уменьшающимся количеством ошибок поиск целевой камеры не происходил, когда там не было корма. Успехи научения можно наблюдать в поведении при достижении цели, только когда имеет место мотивация. Поэтому закон эффекта Торндайка есть не принцип научения, а принцип поведения. Научение и мотивация представляют собой две самостоятельные группы факторов, совместное проявление которых определяет поведение. Реализация вызванной привлекательностью пищи мотивации к достижению целевой камеры зависит от достигнутых на данный момент результатов научения, что сказывается на различиях в усовершенствовании достижений второй и третьей групп. После семикратно предоставленной возможности ознакомиться с лабиринтом количество ошибок сокращается быстрее, чем после трехкратной.
Итак, поведение объясняется взаимодействием двух промежуточных переменных: научения имотивации. Фактор научения, по Толмену, состоит из знаний о том, какая из секций лабиринта куда ведет. Этот результат научения становится ожиданием цели в форме отношений между действием и его последствиями. Мо-тивационным фактором в данном случае является нужность цели. Она зависит от физиологического состояния потребности, или влечения, и от привлекательности целевого объекта (у Левина — соответственно от tu G; Толмен рассматривает оба фактора, влечение и привлекательность, как явления более или менее одного порядка; различия в степени их влияния и их взаимоотношений им не рассматриваются). Постулированные Толменом нужность цели и ее ожидание стали теми промежуточными переменными, которые не только имеют когнитивную природу, но и выступают посредниками между поддающимися наблюдению особенностями исходных условий и последующим поведением, благодаря чему оказывается возможным объяснение наблюдаемой целенаправленности поведения. На рис. 5.10 схематично представлены эти теории мотивации. Исходные условия, которые помимо стимулов окружения и влечения (состояние потребности) включают также прошлое научение, предрасположенность и степень развития, при некоторых, еще подлежащих уточнению, обстоятельствах могут детерминировать как нужность цели, так иее ожидание. Последующие молярные действия определяются тремя доступными наблюдению аспектами целенаправленности.
Приводимая ниже цитата из книги «Целенаправленное поведение у животных и человека» содержит ответ на вопрос, чему же научаются животные в экспериментах по научению, а также раскрывает новый взгляд на взаимовлияние научения и мотивации поведения.
«Окончательная критика доктрины научения методом проб и ошибок направлена на ее основополагающее понятие стимульно-реактивных связей. Стимулы, как таковые, реакции не вызывают. Правильные стимулы ю-реактивные связи не "запечатлеваются", а неправильные не "стираются". Скорее, научение состоит в "открытии", или "вы-
членении", организмом того, к чему ведут любые из всех соответствующих альтернативных реакций.Позднее, если при возбуждающе-аверсивных условиях момента одна из этих альтернативоказывается нужнее других (или одна "требуется", а другие "не требуются"), то организм будет стремиться (в результате такого научения) выбирать или осуществлять реакцию, ведущую к более "нужным" последствиям. Но если различия в нужности отсутствуют, то никакоговыбора и осуществления данной реакции не произойдет, хотя научение будет иметь место» (Tolman, 1932, р. 364).
Рис. 5.10. Толменовская теоретико-мотивационная схема с двумя промежуточными переменными -
нужностью и ожиданием цели, объясняющими отношение между наблюдаемыми особенностями ситуации
(исходные условия) и последующим молярным поведением
Матрица «ожидаемой ценности»
Позднее Толмен (Tolman, 1951, 1959) несколько переработал свою теорию мотивации (по сравнению с теорией Халла она была менеесистематичной). Наряду с состояниями потребности (его классификацию мотивов см. в главе 3) актуальное поведение мотивируют еще две промежуточные переменные — ожидание и ценность. Ценность — это то же, что привлекательность целевого объекта: наряду с потребностью (или влечением) она определяет нужность цели. Обе переменные обычно не поддаются свободному комбинированию, их зависимость друг от другаустанавливается так называемой матрицей «ожидаемой ценности». Как правило, для достижения соответствующего целевого состояния удовлетворения существуют многочисленные возможности в форме ожиданий действий и их последствий (R—S*): с одной стороны, предвосхищения возможных действий, а с другой — связанных с ними целевых состояний (£*), обладающих различной ценностью.
Это особенно ярко проявляется в ситуациях выбора, например когда человек испытывает голод, а поблизости находятся несколько хороших и дорогих ресторанов с разным ассортиментом блюд и с соответствующими требованиями к кошельку. Выбор ресторана определяется не только предлагаемой там едой, т. е. предвосхищением возможных действий, но и соображениями возможной стоимости обеда. На рис. 5.11 приведена матрица «ожидаемой ценности» для человека, находящегося в подобной ситуации (задачей психологии личности помимо прочего является установление расхождения между матрицей «ожидаемой ценности» конкретного индивида и соответствующими социокультурными нормами). Составленная Толменом матрица дает годологическую картину последовательности действий в проме-
жутке междусостоянием голода (слева) и его удовлетворением (справа). Заканчивающиеся стрелками лассообразные линии представляют учтенные этапы действия, размер знаков «+» соответствует оценке конкретного ресторана (средства) и пищи(целевого объекта). Во всех четырех ресторанах можно получить предпочитаемые данным человеком блюда а и Ь; блюда с, due также могли бы его насытить; по не блюдо/.
Рис. 5.11. Пример матрицы «ожидаемой ценности»: когнитивного предвосхищения при выборе в состоянии голода между хорошими (и дорогими) ресторанами и различными блюдами (Tolman, 1952, р. 392)
Еще заметнее влияние Левина проявилось в попытке Толмеиа (Tolman, 1952) психологически полно представить описанную ситуацию выбора. Как видно из рис. 5.12, Толмен нашел свой способ объединения левиновских моделей личности (система потребно<*гей) и окружения (поведенческое пространство), причем уже отмечавшаяся несовместимость этих моделей была преодолена благодаря включению (см. заканчивающиеся стрелками пунктирные линии) когнитивных процессов системы «ожидаемой ценности». Независимыми переменными при этом выступают физиологическое состояние потребности (Т, влечение) и стимулы окружения (51), промежуточными —система потребностей, система «ожидаемой ценности» ипространство поведения, зависимой переменной — результирующее поведение (V). Пространство поведения представляет собой когнитивно-феноменальную репрезентацию данной ситуации. Ее структура решающим образом зависит от системы «ожидаемой ценности». Привлекательности аг,, х2, а также av a2 являются производными от соответствующих оценок в системе «ожидаемой ценности» (в данном случае два ресторана и наличие в каждом из них предпочитаемых блюд). В этой же системе учитываются ожидаемое насыщение и переживаемый импульс голода {needpush), в конечном счете также непосредственно зависящий от потребности и стимулов окружения.
Не вдаваясь в подробности (и не принимая во внимание трудности), из рис. 5.12 можно видеть, что Толмен в своей попытке установить генетическую связь данного пространства поведения с состоянием когнитивных переменных пошел далыие Левина. В работе, посвященной этому вопросу, он, кроме того, рассмотрел возможности операциональной диагностики индивидуальной выраженности когнитивных переменных системы «ожидаемой ценности». В отличие от Левина Толмен подчеркивал значимость индивидуальных различий ив результате своих исследо-
ваний сформулировал проблему, которая заняла центральное место в новых работах по мотивации, в первую очередь выполненных в рамках теории «ожидаемой ценности» (см.: Feather, 1982; Heckhausen, 1982b; Kuhl, 1982).
Рис. 5.12. Влияние на ситуацию выбора актуальной потребности представлено тремя различными блоками
модели: системой потребностей, системой «ожидаемой ценности* и пространством поведения. Система
«ожидаемой ценности» служит посредником между системой потребностей и пространством поведения,
последние два блока соответствуют левиновским моделям личности и окружения. Независимыми
переменными являются состояние потребности, голод (Г) и стимулы окружающего мира (S),
промежуточными - системы потребностей, «ожидаемой ценности" и пространство поведения,
зависимой переменной - результирующее поведение {V) (Tolman, 1952, р. 395)
Ожидание и привлекательность в рамках теории S—R
Анализ целенаправленного поведения, проведенный Толменом, и экспериментальное подтверждение этого анализа в конце 20-х гг. были восприняты приверженцами объяснения поведения с позиций теории ассоциаций как вызов. Они считали сочетание «стимул-реакция» основной схемой причинно-следственной связи. Каким образом можно было при таком подходе объяснить влияние на поведение ожидания, т. е. знания о будущем целевом состоянии, о средствах и путях его достижения? Халл принял этот вызов. Поскольку строгость бихевиористского анализа целенаправленного поведения, проведенного Толменом, не подлежала сомнению, пришлось признать существование процесса мотивации как стремления к цели, отличающегося от научения как простого подкрепления связей S—R.