Средний и поздний этапы исследований Халла
В 1943 г. Халл сформулировал свою теорию подкрепления (при этом он временно отказался от рассмотрения вопросов стимульно-реактивного объяснения когнитивных процессов стремления к цели). Единственное, что следует отметить в этой теории, — отнесение Халлом количественных и качественных характеристик подкрепляющего целевого объекта к условиям, ответственным за силу подкрепления связи S—R. Креспи (Crespi, 1942,1944), опираясь на новые данные, показал невозможность решения на основе теории 5—R проблемы привлекательности, поскольку последняя, скорее, указывает на своеобразие мотивации. Креспи изменял количество корма, которое находила голодная крыса в целевой камере при успешном прохождении лабиринта. При большем количестве корма скорость бега возрастала в первых 19 попытках быстрее, чем при меньшем его количестве. Как видно из рис. 5.14, максимальная скорость бега была разной при разных условиях привлекательности, но она была достигнута обеими группами животных после одинакового числа попыток, так что обе группы должны были выработать одинаковую силу привычки. Эти данные полностью согласуются с теорией подкрепления Халла. Но когда Креспи изменил для одной из групп количество получаемого корма (на рис. 5.14 показано изменение скорости бега при переходе от большего к меньшему количеству корма), скорость бега у группы, получавшей много корма, упала ниже уровня группы, до сих пор получавшей мало корма. Столь внезапное изменение поведения необъяснимо с теоретико-ассоциативной точки зрения. Данные Креспи подтвердил затем Зиман (Zeaman, 1949): увеличение количества пиши с 0,05 до 2,4 г привело к полной инверсии латентного времени по отношению к достигнутому на тот момент плато другой группы, с самого начала получавшей такое количество корма.
Рис. 5.14.Зависимость скорости бега от количилва корма, До 19-й попытки одна группа получала 16 единиц корма, а другая - 256. , С 20-й попытки обе группы получали 16 единиц (Crespi, 1942, Fig. 2, p. 488, Rg. 8, p. 508)
На заключительном этапе разработки своей теории Халл (Hull, 1951) попытался объяснить эти данные. Он уже не считал, что размер и вид подкрепления, зависящие от силы и вида привлекательности целевого объекта, влияют на образование привычки. Эта функция сохранялась теперь только за частотой и степенью отсроченности подкрепления. Размер и вид подкрепления Халл объединил в новом мотивационном факторе К. Интенсивность К зависит от силы консумматор-ной реакции, которая, в свою очередь, зависит от привлекательности целевого объекта. Наряду с D переменная К ответственна за силу инструментальной реакции, но не за образование привычки, т. е. не за то, какая последует реакция. D и К мультипликативно связаны друг с другом, так что формула потенциала реакции (sЕr) приняла следующий вид: sЕr = D x K x sHr,
Дальнейшее развитие теории Спенсом
Модифицируя свою теорию, Халл отчасти следовал положениям, которые выдвинул Спенс, чтобы объяснить такой феномен привлекательности, как латентное научение. Спенс обратился к ранней концепции Халла о rG - sG-механизме. Если фрагментарная антиципирующая целевая реакция, как полагал Спенс, связывается не только с раздражителем влечения SD, как это первоначально считал Халл, но и с внешними S и внутренними проприоцептивными s раздражителями, то антиципирующая целевая реакция может вызываться ими и в свою очередь оказывать мотивирующее действие, т. е. усиливать вызванные ситуацией инструментальные реакции. Антиципирующая целевая реакция тем самым получила функцию энер-гетизирующей побудительной мотивации. Спенс считал, что эта реакция вызывает состояние напряжения и конфликт, которые оказывают общее стимулирующее воздействие. Подлинная природа антиципирующих целевых реакций до сих пор не выяснена. Попытки их наблюдения и оисания остались более или менее бесплодными (Bolles, 1967, S. 352 и далее). Поскольку Спенс отнес эти реакции к промежуточным переменным, принципиальная доступность антиципирующих целевых реакций непосредственному наблюдению остается недоказанной.
В отличие от Халла Спенс связал оба мотивационных фактораDu Кие мультипликативно, а аддитивно, так что потенциал возбуждения Е, эквивалент потенциала реакции SER у Халла, определялся следующей формулой:
E=(D+K)xH.
Поводом для таких изменений послужили новые научные данные (напр.: Reynolds, Anderson, 1961). Однако более значительным было другое отступление от взглядов Халла. Спенс (Spence, 1956) полностью отказался от теории подкрепления как объяснения образования привычки. Прочность связи S—R, по Спенсу, является функцией одной только частоты совпадения событий. Напротив, феномены подкрепления, их частота, сила, вид, непосредственность или отсроченность прямо влияют на выраженность мотивации привлекательностью К, которая выступает в форме частичной антиципирующей целевой реакции (rG—sG).
Эта концепция лучше объясняет данные о роли привлекательности в латентном научении, чем модифицированная теория Халла. Подкрепление теперь вообще не связывалось с выработкой и исчезновением привычек. Из-за градуального, постепенного характера процесса научения невозможно было объяснить внезапность эффектов привлекательности. Согласно теории Спенса, изменение привлекательности, сказываясь на подкреплении, передается через мотивирующую функцию механизма rG—sc непосредственно всемдействующим в данной ситуации реакциям. Сам rG—sG -механизм действует по типу классического обусловливания различного рода стимулами (раздражители внешнего мира, проприоцепция и раздражители влечения), в той или иной степени схожими с собственно целевым раздражителем SG. При этом с возрастанием временной и пространственной удаленности целевого события приходится учитывать градиент генерализации раздражителя, т. е. уменьшение сходства ситуационных стимулов с целевым раздражителем, и соответственно уменьшения мотивационного влияния антиципирующих целевых реакций. (Эта установленная в рамках теории S—R зависимость соответствует в концепции Левина уменьшению силы валентности с увеличением психологического расстояния до цели.)
В результате преобразования теории S—R в теорию мотивации привлекательностью Спенс приблизился к представлениям Левина и Толмена. Рассматриваемые в терминах S—R rG—sG -механизмы (Спенс) и связи SR—S или R—S* (Толмен) действительно близки. Конечно, открытым остается вопрос о том, достаточно ли постулата Спенса для объяснения мгновенного изменения поведения, определяющегося привлекательностью целевого объекта. Поскольку rG~sG -механизм сам есть результат классического обусловливания, то возможность его столь внезапного изменения после однократной смены подкрепления кажется сомнительной.
Последующая разработка теорий
Появившиеся со временем новые многочисленные данные все более побуждали исследователей мотивации предпочесть теории привлекательности теориям влечения и подкрепления. Рассматривая в предыдущей главе постулаты теории влечения, мы видели, что объяснения большей части данных с точки зрения теории привлекательности постоянно выступали в качестве конкурирующих или более
перспективных альтернатив. Примером служат результаты экспериментов по дифференциации влечения. Если животные в соответствии с определенным состоянием влечения предпочитают тот или иной путь поведения, то это различие может основываться не на специфических раздражителях влечения, а на действии привлекательности, т. е. на антиципирующих целевых реакциях. Другим примером может служить постулирование энергетизирующей функции влечения. С пересмотром Халлом и Спенсом теории S—R встал следующий вопрос: насколько энергетиза-ция сводится к привлекательности (К)? Еще наблюдения Рихтера за периодическими изменениями активности и более поздние эксперименты с колумбийским проблемным ящиком, в которых изучалась связь между состоянием потребности и активностью, поставили вопрос о неучитываемых эффектах привлекательности.
В этой связи мы уже рассмотрели в главе 4 данные исследований Шеффилда и Кемпбелла (Sheffield, Campbell, 1954) о достаточности для повышения активности голодных крыс изменений, связанных с ежедневным кормлением. Очевидно, что изменение раздражителя для частичных антиципирующих целевых (корм) реакций играет роль павловского сигнального раздражителя. Это касается и уже обсуждавшегося (см. рис. 4.8) эксперимента Амсела и Руссела, посвященного изучению фрустрации (Amsel, Roussel, 1952). Если крысы не находили, как прежде, корма в первой целевой камере, то скорость бега ко второй камере возрастала. Многочисленные данные Амсела (Amsel, 1962) продемонстрировали, что фрустрация повышает интенсивность текущего поведения. Сам Амсел объяснял это тем, что подготовленные консумматорные реакции из-за фрустрации не наступают, т. е. не переходят в направленное на целевой объект консумматорноё поведение, т. е. из гс не получается RG.
Новые данные хорошо согласуются с предположением Спенса о повышающем активацию влиянии привлекательности. Сила консумматорной реакции RG и сила ведущих к ней инструментальных реакций должны соответствовать друг другу, поскольку последние активируются предвосхищающей реакцией RG. Убедительное доказательство этого представили Шеффилд, Роби и Кемпбелл (Sheffield, Roby, Campbell, 1954). В их экспериментах подкреплением служило разная по степени сладости и питательности жидкость (растворы сахарина или декстрозы). В ходе эксперимента наблюдалась удивительно точная корреляция между количеством выпитой жидкости и скоростью бега. Сюда же можно отнести решающие для теории редукции влечения данные Шеффилда, Булфа и Бейкера (Sheffield, Wulff.Backer, 1951) о копуляции без извержения семени (см. рис. 4.6). Мотивация привлекательностью играет особенно большую роль в случае сексуального поведения. Если учесть результаты Янга (Young, 1959,1961), то это не в меньшей степени справедливо и по отношению к пищевому поведению. Янг предлагал сытым крысам систематически варьировавшиеся по своим компонентам виды корма и фиксировал скорость бега, предпочтения и количество съеденного. Например, в случае использования сахарного раствора крысы мчались к цели без малейшего промедления, когда же в целевой камере находился раствор казеина, они двигались медленно, тратя время на ориентировочно-исследовательскую активность. Янг полагает даже, что перед каждой попыткой у животных можно наблюдать некую проприоцептивную напряженность, соответствующую интенсивности последующего пищевого поведения.
Под влиянием приведенных и других данных Шеффилд отказался от центрального для теории влечения постулата о зависимости силы подкрепления от величины редукции влечения. Он считал, что подкрепление зависит от силы консумма-торного поведения, от состояния «возбуждения». Подкрепление, таким образом, связано, скорее, с индукцией, а не с редукцией влечения. Шеффилд в своей теории мотивации привлекательностью сделал вслед за Спенсом еще один шаг к постулатам Левина и Толмена. В отличие от Спенса он придал мотивации привлекательностью не общую, а специфическую, т. е. направленную, побудительную, функцию, осуществляемую, разумеется, опосредованно. Представления Шеффилда (Sheffield, Roby, Campbell, 1954) состояли в следующем. Состояние потребности в нецелевой ситуации может привести к различным по направленности тенденциям реагирования. Через проприоцептивные стимулы эти тенденции в разной мере возбуждают частичные целевые реакции rG. Чем сильнее выражено такое возбуждение при одной из этих тенденций, тем сильнее будет активироваться, т. е. реализовываться в действии, эта тенденция, пока, наконец, не создастся ситуация, в которой может быть осуществлена целевая реакция RG.
Рассуждения подобного рода в рамках любой теории мотивации привлекательностью по двум основным вопросам противоречат постулатам классической теории S—R: 1) является ли необходимым постулирование двух мотивационных факторов влечения и привлекательности или достаточно одного из них, ведь привлекательность может включать и влечение? 2) нельзя ли обойтись без постулата об образовании привычки благодаря действию подкрепления? Теории привлекательности различаются тем, в какой степени они отказываются от понятий «влечение» и «подкрепление». В последнее время все чаще ставится под сомнение полезность понятия «подкрепление». Иными словами, хотя подкреплению отводится решающая роль в формировании привлекательности, частичных антиципирующих целевых реакций rG, но само формирование мыслится в соответствии с классической схемой образования условно-рефлекторных связей по Павлову, а не с инструментальным научением через подкрепление по То'рндайку. Мы вернемся к этому вопросу в следующем разделе. Что касается первого вопроса, то влечение сохраняет свое значение как переменная состояния потребности, но становится одним из детерминирующих условий для силы самой мотивации привлекательностью. В системе понятий Левина это означает, что в данной ситуации валентность целевого состояния образует в психологическом поле мотивирующую силу, и одна из определяющих ее величин есть сила потребности t.
Сьюард (Seward, 1942) был первым из приверженцев теории S—R, кто сделал шаг в этом направлении. Он прямо говорил об «экстернализации влечения» в ^-механизмах мотивации привлекательностью. Одной привлекательности достаточно, чтобы в ответ на раздражители, ассоциативно связанные с подкрепляющей целевой реакцией, выбрать и активировать соответствующие реакции. Сьюард изложил свои взгляды в работе 1951 г., причем он обозначил собственно процесс мотивирования как «третичную мотивацию».
«... Животное в состоянии потребности мотивируется не только первичным влечением D и стимулом влечения 5„, но также вторичным влечением, складывающимся из установки rf; на осуществление характерной консумматорной, или целевой, реакции R(;.
Когда за некоторой реакцией R следует подкрепление, RGассоциативно связывается с конкурентными стимулами. Через актуализацию этих связей стимулы, сопровождающие R, начинают усиливать гс... эта названная третичной мотивацией интенсификация обладает свойством облегчать осуществление R, повышая успешность активности» (Seward, 1951, р. 130).
Ученики Халла — Мак-Клелланд и Маурер — приняли выделенное Шеффилдом и Янгом мотивирующее состояние «возбуждения» в качестве исходного понятия своей теории, но приписали ему эмоционально-содержательный элемент, что позволило им вывести предположение о существовании эмоций ожидания. Позицию обоих авторов мы уже рассматривали в главе 2. Напомним, что мотивация, по МакКлелланду, состоит в ожидании некоторого ранее пережитого изменения в аффективно значимой ситуации. Такое мотивирующее ожидание вызывается сигнальными раздражителями, которые частично реактивируют прежнюю аффективно значимую ситуацию, вновь придавая ей действенность (McClelland, Atkinson-Clark, Lowell, 1953).
Маурер (Mowrer, 1960) выделял четыре вида эмоций ожидания (надежда, страх, разочарование и облегчение), которые в духе теории мотивации привлекательностью не только активируют, но и направляют поведение. Ни для подкрепления, ни для энергетизации инструментальных реакций влечение больше не было необходимым условием. Оно, впрочем, сохранило одну значимую функцию: его редукция и индукция также обусловливают эмоции ожидания. Внешние и внутренние указательные раздражители могут вызывать эмоции ожидания, которые интенсифицируют ведущие к цели инструментальные реакции по принципу: увеличить надежду и уменьшить страх. Через проприоцептивную обратную связь начинающаяся реакция сразу же находит подкрепление (усиление) или торможение в вызванных позитивных или негативных эмоциях ожидания. Правда, Маурер оставил без внимания вопрос, какими иными способами, помимо описанных, стимул-реактивной теорией может приводиться в движение инструментальная реакция еще до того, как она начинает усиливаться или тормозиться эмоциями ожидания.
Положения этой и других концепций привлекательности и ожидания, а также представления об их регуляции попытался синтезировать автор этой книги (Heckhausen, 1963b) в своей «базовой теории мотивации». Эта теория сформулирована без использования понятий S—R. Центральным для нее является представление об эмоционально окрашенных «перепадах ожидания», которые мотивируютк поиску или избеганию.
Избыточность понятия «подкрепление реакции»
Мы уже затрагивали вопрос об избыточности постулата об определяющем привычку подкреплении. С тех пор как в конце 1920-х гг. против этого понятия выступил Толмен, а в связи с результатами экспериментов по латентному научению и изменению привлекательности теория оперантного научения Халла столкнулась с неразрешимыми проблемами, теоретические подходы, как мы видели, все больше и оольше сводились к объяснению инструментального целенаправленного поведения с помощью ситуационных побуждений, в особенности связанной с ожиданиями мотивации привлекательностью (см.: Bolles, Moot, 1972). Эти теории отличались от подходов Левина и Толмена только одним. Если Левин и Толмен считали,
что мотивирующие ожидания имеют лишь когнитивную репрезентацию, то такие теоретики, как Сьюард, Шеффилд, Маурер, а также Логан (Logan, 1960), описывали промежуточные переменные в терминах S—R (на что, несомненно, провоцировал детальный анализ экспериментальных данных). Классическое обусловливание в павловском смысле оказалось незаменимым при объяснении действий1, связанных с ожиданием.
Инструментальное (оперантное) обусловливание, понимаемое Торнддйком и Хал-лом как образование с помощью подкрепления связи «раздражитель-реакция», подвергалось все большему сомнению. Закон эффекта из принципа научения превратился в принцип поведения. Теоретико-ассоциативный rG — Sp-механизм превратился в теоретико-когнитивный эквивалент мотивирующей ожидание привлекательности.
Более значимым по сравнению с постулированием в теоретических системах «механических» (теоретико-ассоциативных) или «когнитивных» связей оказалось нечто другое, а именно перелом в понимании явлений мотивации. Он может быть описан следующим образом: от единичного толчка к непрерывному движению. Ученые отказались от представления о том, что целенаправленное поведение инициируется откуда-то извне общим по своей природе влечением, а само управление им полностью перепоручено фиксированным в результате редукции влечения связям S—R, которые в случае непригодности должны аннулироваться и постепенно вырабатываться вновь.
Теперь движущей силой целенаправленного поведения выступили ожидаемые целевые состояния, быстро и гибко запускающие инструментальные реакции, поскольку наступление определяется уже не сочетанием S—R, а ожидаемыми последствиями действия. Таким образом, ведущие исследователи научения и мотивации отказались от теории подкрепления инструментального поведения.