Управление (control) оперантным поведением
Б.Ф. Скиннер
Оперантное поведение
Рефлексы, как условные, так и всякие другие, главным образом связаны с внутренними физиологическими процессами в организме. Однако чаще всего нас интересует такое поведение, которое имеет определенное воздействие на окружающий мир. Оно возникает в результате столкновения человека с необходимостью решать задачи, выдвигаемые жизнью. Кроме того, его специфические характеристики также представляют интерес для теории. Последствия поведения могут играть роль обратной связи для организма. В этом случае они изменяют вероятность осуществления поведения, породившего их. В английском языке много слов, имеющих отношение к данному эффекту, например «поощрение» и «наказание», но ясное представление о нем мы можем получить только в результате проведения эксперимента.
КРИВЫЕ НАУЧЕНИЯ
В 1898 г. Э. Л. Торндайком была предпринята одна из первых серьезных попыток изучить изменения, обусловливаемые последствиями поведения. Его эксперименты возникли на основе дискуссии, которая впоследствии заинтересовала многих ученых. Ч. Дарвин, настаивавший на преемственности видов, подверг сомнению уникальность человека и его способность думать. В печати распространилось большое количество анекдотов, в которых говорилось о проявлении животными «силы разума». Но распространение особенностей, ранее характеризующих только поведение человека на поведение животных, привело к постановке новых вопросов. Указывали ли наблюдаемые факты на психические процессы или эти очевидные проявления мышления могут быть объяснены иначе? В конце концов отпала необходимость в представлении о внутренних мыслительных процессах. Должно было пройти много лет, прежде чем тот самый вопрос о специфичности поведения человека не возник вновь, но эксперименты Торндайка и его» объяснение мышления (reasoning) животных явились важным шагом в этом направлении.
Если кошка помещается в ящик, из которого она может выбраться, открыв задвижку, она может проявить много видов поведения, некоторые из которых могут оказаться эффективными. Торндайк установил,. что при многоразовом помещении кошки в ящик успешное поведение наступало все быстрее и быстрее, и это продолжалось до тех пор, пока оно не стало предельно простым и быстрым. Кошка решала свою задачу, как разумное человеческое существо, хотя, возможно, и не так быстро. Однако Торндайк не видел за этим «мыслительных процессов» и утверждал, что они ненужны для объяснения. Он описал свои результаты, указав на то, что поведение кошки было «запечатлено» (stamped in), поскольку оно сопровождалось открытием двери.
Тот факт, что поведение запечатлевается или сопровождается определенными последствиями, Торндайк назвал «законом эффекта». В своих экспериментах. он установил, что в рамках одной и той же ситуации определенное поведение протекает все более и более стабильно в отличие от других поведенческих проявлений. Фиксируя промежутки времени, которые требовались кошке для того, чтобы выбраться из ящика, он построил «кривую научения». Эта ранняя попытка описать поведенческий процесс количественно, аналогично описанию физических и биологических процессов, рассматривалась как важный шаг вперед. Он раскрыл процесс, который развертывался в течение длительного времени и который был доступен для наблюдения. Итак, Торндайк сделал открытие. С тех пор было получено много кривых, которые легли в основу многих психологических работ, посвященных научению.
Однако кривые научения не описывают сущность запечатления. Критерий Торндайка — время, необходимое животному для того, чтобы выбраться из клетки, — был связан с устранением других видов поведения, и его кривая зависела от ряда различных действий, которые могла выполнять кошка в определенном ящике. Форма кривой также зависела от поведения, которое было «успешным», и от того, был ли это редкий или обычный способ поведения в данном ящике. Можно сказать, что кривая научения, построенная таким образом, отражает свойства ящика с задвижкой, а не поведение кошки. Это положение распространяется на многие другие устройства, разработанные для изучения научения. Различные лабиринты, через которые белые крысы и другие животные учатся проходить, «ящики выбора», в которых животные научаются различать свойства, или паттерны стимулов, аппараты, посредством которых представляется последовательность стимулов, подлежащих усвоению при изучении памяти человека, — все они порождают различные кривые научения.
Усредняя многие показатели индивидов, мы можем сгладить эти кривые настолько, насколько хотим. Более того, кривые, полученные в различных условиях, могут иметь определенные общие свойства. Например, при измерении данным способом научение обычно «имеет негативную характеристику убыстрения» — улучшение выполнения наступает все более и более медленно до тех пор, пока оно вовсе не прекращается. Однако из этого не следует, что негативная акселерация характеризует сущность процесса. Предположим по аналогии, что мы наполнили стеклянный сосуд песком и так его перемешали, что песчинки одного и того же размера равномерно распределились внутри него. Если мы слегка встряхнем сосуд, то песчинки перераспределяются. Большие песчинки окажутся наверху, маленькие — внизу. Этот процесс также характеризуется негативной акселерацией. Сначала смесь перераспределяется быстро, но по мере приближения к его завершению процессы в распределении наступают реже и реже. Такая кривая может оказаться совершенно ровной и воспроизводимой, но один лишь этот факт не имеет большого значения. Кривая зависит от определенных процессов взаимодействия песчинок различного размера, от силы сотрясения, сосуда и т. д., но в то же самое время она прямо не отражает сами эти процессы.
Кривые научения показывают, как различные виды поведения, порождаемые в сложных ситуациях, отбираются, закрепляются и реорганизуются. Базисный: процесс запечатления отдельного акта осуществляет это изменение, но в самом изменении он прямо не отражен.
ОПЕРАНТНОЕ ОБУСЛОВЛИВАНИЕ
Для понимания сущности закона эффекта Торндайка нам необходимо дать четкое определение понятия «вероятность реакции». Это очень важное понятие, но, к сожалению, очень трудное. При обсуждении поведения человека мы часто апеллируем к тенденциям «расположенности» вести себя определенным образом. Почти в каждой теории поведения используются такие термины, как «потенциал возбуждения», «сила привычки» или «детерминирующая тенденция». Но как мы наблюдаем тенденцию? И как можно ее замерить?
Если бы определенное поведение существовало в двух ипостасях — в одном случае оно всегда бы имело место, а в другом — никогда, то мы оказались бы почти в беспомощном состоянии при введении программы функционального анализа. Феномен, имеющий характеристики «все и ничего», имеет только простые формы описания. Гораздо более продуктивным является предположение, что вероятность осуществления реакции последовательно распределяется между этими двумя полюсами «все — ничего». Тогда мы можем рассмотреть переменные, которые в отличие от стимулов порождения (eliciting stimulus), «не являясь причиной данного поведения», делают его наступление более вероятным. Далее мы можем, например, рассмотреть последствия действия нескольких таких переменных.
Распространенные выражения, отражающие вероятностную природу явления, — «тенденция» или «предрасположенность» — характеризуют частоту наступления определенных видов поведения. Мы никогда не наблюдаем вероятность. Мы говорим, что кто-то «обожает бридж», потому что замечаем, что он часто играет в бридж и часто говорит о нем. «Глубоко интересоваться» музыкой означает много играть, часто слушать музыку и много говорить о музыке. «Неисправимый игрок» много играет в карты. Любитель киносъемок делает снимки, проявляет их и любуется своими собственными снимками и снимками других людей и т. д…
Характеризуя поведение человека с точки зрения его частоты, мы принимаем определенные стандартные условия: он должен быть способен выполнить и повторить определенное действие, при этом другие виды поведения не должны мешать. Например, мы не можем знать, насколько сильна тяга человека к музыке, если ему приходится также заниматься другими вещами. Подойдя к проблеме уточнения научного определения вероятности, мы обнаруживаем, что исходными моментами являются частота и условия, при которых наблюдается то или иное поведение. Мы устраняем или по крайней мере сохраняем в неизменном виде любое условие, которое способствует проявлению конкурирующего с изучаемым нами видом поведения. Животное помещается в отдельный (quiet) ящик, и за его поведением наблюдают с помощью одно-канального экрана, или оно регистрируется посредством специальных технических устройств. Эти условия нельзя рассматривать как вакуумную среду, так как животное будет реагировать на свойства ящика многими способами, однако его поведение постепенно достигнет достаточно устойчивого уровня, на котором можно исследовать частоту заданной реакции.
Для изучения процесса, который Торндайк назвал запечатлением, мы должны иметь его «последствие». Это может быть, например, предъявление еды голодному животному. Мы можем предъявлять нашему испытуемому еду в удобном для него месте, на большом подносе, с помощью специального устройства. При первом предъявлении подноса животное, вероятно, будет реагировать на него различными поведенческими реакциями, которые мешают проявлению изучаемого нами поведения. Постепенно после нескольких кормлений оно без промедления принимает пищу и мы получаем возможность рассматривать это последствие как зависящее от поведения и наблюдать его результат.
Мы выбираем относительно простой вид поведения, который свободно и многократно воспроизводим и который легко поддается наблюдению и регистрации. Например, если испытуемым является голубь, то поднятие им головы выше определенного уровня является удобным поведением для изучения. Оно может быть зафиксировано взглядом экспериментатора на шкале, прикрепленной к задней стенке ящика, на фоне которой находится голубь. Сначала мы изучаем естественную высоту поднятия головы голубем и выбираем на шкале отметку, которая достигается им только в отдельных случаях. Фиксируя свой взгляд на шкале, экспериментатор начинает очень быстро открывать поднос, как только голова поднимается выше этой линии. Если эксперимент проводится в соответствии со спецификациями, то получается один и тот же результат: мы наблюдаем быстрое изменение частоты пересечения головой голубя заданной линии. Мы также видим, что голова голубя поднимается на более высокий уровень, и этот факт имеет большое теоретическое значение. Мы можем очень быстро заставить голубя высоко поднимать голову, установив время предъявления пищи. Через одну-две минуты поза голубя изменяется таким образом, что его голова редко опускается ниже линии, которую мы выбрали вначале.
Когда мы демонстрируем процесс запечатления в такой относительно простой форме, мы видим, что некоторые обычные интерпретации эксперимента Торндайка избыточны. Выражение «научение путем проб и ошибок», которое часто связывается с законом эффекта, здесь явно неуместно. Мы вкладываем особый смысл в наши наблюдения, когда называем любое поднятие головы «пробой», и нет оснований считать «ошибочным» любое движение, которое не приводит к установленному нами результату. Даже употребление термина «научение» вводит в заблуждение. Утверждение, что «птица научается получать пищу посредством вытягивания шеи», является неадекватным выражением того, что происходит. Говорить, что она приобрела «навык» вытягивать шею — значит просто обращаться к объяснительным вымыслам, поскольку единственным доказательством наличия навыка является приобретенная тенденция выполнять действие. Простейшим возможным описанием данного процесса является следующее: мы делаем данный контингент следствий зависимым от определенных физических свойств поведения (поднятия головы), далее фиксируем, что частота появления этого поведения возрастает. Принято рассматривать любое движение живого существа как реакцию. Это слово заимствовано из исследований, посвященных изучению рефлексов. Оно означает действие, которое наступает в ответ на предшествующее событие — стимул. Но мы можем сделать событие зависимым от поведения без определения предшествующего стимула. Мы не изменяем среду обитания голубя для того, чтобы вызвать поднятие головы. Вероятно, нельзя показать, что любой простой стимул неизменно предшествует этому движению. Такое поведение может оказаться под контролем стимулов, но при этом отсутствуют отношения по типу «одно порождает другое», поэтому термин «реакция» не вполне адекватен, но он настолько укоренился, что далее мы будем его использовать.
Конечно, нельзя предсказать и проконтролировать реакцию, которая уже произошла. Можно только предсказать, что похожие реакции будут наблюдаться в будущем. Поэтому единицей науки о прогнозировании является не реакция, а класс реакций. Для его описания будет использоваться слово «оперантный». Данный термин показывает, что поведение «воздействует» (operates) на среду, генерируя последствия. Следствия определяют свойства, по которым устанавливается сходство реакций. Он будет использоваться и как прилагательное (оперантное поведение), и как существительное, обозначающее поведение, определенное данным следствием.
Поднятие голубем головы один раз в определенный момент является реакцией. Это прошлое и его можно рассматривать со всех точек зрения, которые представляют для нас интерес. Поведение, называемое «поднятием головы», которое происходит независимо от определенных обстоятельств (instances), является оперантным. Его можно описать не как завершенное действие, а как состав действий, определяющийся свойствами высоты, на которую нужно поднять голову. В этом смысле оперант можно определить посредством следствия, характеризуемого с помощью физических терминов. «Поднятие головы» («cutoff») на определенную высоту является частью (property) поведения.
Традиционное употребление термина «научение» может быть сохранено для описания перераспределения реакций на классы в сложной ситуации. Терминология, необходимая для описания процесса запечатления, может быть заимствована из теории условных рефлексов И. П. Павлова. Сам Павлов называет все события, которые усиливают поведение «подкреплением» и все возникающие в связи с ним изменения, «обусловливанием». Однако в экспериментах Павлова подкрепление сочетается со стимулом, а при оперантном поведении оно зависит от реакции. Поэтому оперантное подкрепление является специальным процессом и нуждается в специальном анализе. В обоих случаях усиление поведения, происходящее в результате подкрепления, называется «обусловливанием». При оперантном обусловливании мы усиливаем оперант, чтобы увеличить вероятность или частоту появления реакции. В условиях павловского, или «респондентного», обусловливания мы просто повышаем величину реакции, вызванную условным стимулом, и сокращаем время между стимулом и реакцией. Мы уже отмечали, что этими двумя случаями исчерпываются возможности: 1) организм обусловливается, когда подкрепление сопровождает другой стимул или 2) следует за поведением организма. Любое событие, которое не приводит к одному из этих случаев, не влияет на изменение вероятности реакции. Тогда в эксперименте с голубем еда является тем, что подкрепляет, а.ее предъявление, когда реакция «выделяется», является подкреплением. Оперант определяется свойствами, от которых зависит подкрепление — высотой, на которую должна подниматься голова голубя. Изменение частоты поднятия головы на эту высоту есть процесс оперантного обусловливания.
Находясь в состоянии бодрствования, мы постоянно воздействуем на среду, и многие последствия нашего поведения имеют силу подкрепления. Посредством оперантного обусловливания среда конструирует базисный репертуар поведения, благодаря которому мы сохраняем равновесие, ходим, играем в спортивные игры, пользуемся инструментами, говорим, пишем, гребем, управляем автомобилем и самолетом. Мы можем оказаться не готовыми к изменению в среде, например появлению нового автомобиля, нового друга, новых интересов, к смене работы и местожительства, но мы обычно быстро приспосабливаемся к новой обстановке, приобретая новые реакции и утрачивая старые. ‹:…› Оперантное подкрепление не только структурирует репертуар поведения. Оно улучшает продуктивность поведения и еще долгое время сохраняет его после того, как его усвоение или продуктивность теряют свою значимость.
КОЛИЧЕСТВЕННЫЕ СВОЙСТВА
Совсем не просто получить кривую научения. Мы не можем полностью изолировать оперант и устранить все случайные помехи. Можно было бы построить кривую и показать, как частота поднятия головы на определенную высоту изменяется в зависимости от времени или количества подкреплений, но дело в том, что общий эффект больше. Происходит смещение в более крупной схеме поведения, и для того чтобы его полностью описать, необходимо проследить все движения головой. Даже в этом случае мы не исчерпаем всей проблемы. Высота поднятия головы была выбрана произвольно, и эффект подкрепления зависит от нее. Если подкрепить высоту, которая достигается редко, изменение в схеме будет гораздо больше, чем в случае, когда выбирается высота, на которую голубь обычно поднимает голову. Для адекватного объяснения необходимо получить набор кривых, описывающих все случаи. Если заставить голубя поднимать голову все выше и выше, появляется еще один произвольный элемент, так как можно использовать различные графики подкрепления. Каждый график дает свою кривую, и картину можно считать исчерпывающей, только если будут использованы все графики подкрепления.
Мы не можем обойти эти проблемы, выбрав реакцию, которая более строго определяется свойствами среды, например открытие двери. Определенный механический индикатор поведения, разумеется, предпочтительнее, поскольку, например, он позволяет организовать постоянное представление подкрепления. Можно регистрировать высоту поднятия голубем головы с помощью фотоэлемента, но легче выбрать такую реакцию, которая производит изменение в среде и которую легче регистрировать. Если птица научается нажимать на небольшой рычаг, находящийся на стене экспериментального ящика, можно сконструировать рычаг таким образом, чтобы он замыкал электрическую цепь, что позволит предъявлять поднос с пищей и регистрировать реакции. Думается, что такая реакция отличается от реакции поднятия головы тем, что она имеет характеристику «все или ничего». Но ниже будет видно, что «реакция», которая не так произвольна, как реакция поднятия головы, не определяется механическими свойствами движения «нажатия на рычаг».
Нет необходимости иметь совершенное экспериментальное устройство для того, чтобы получить важные количественные данные об оперантном обусловливании. Мы уже можем оценивать много факторов. Важность обратной связи ясна. Организм можно стимулировать последствием его поведения, если имеет место обусловливание. Например, при обучении шевелить ушами необходимо знать, когда уши двигаются, если мы хотим подкреплять двигательные реакции. При переучивании больного пользоваться частично парализованной конечностью можно с помощью специальных приспособлений или другого человека усиливать обратную связь при слабых движениях. Глухонемой научается говорить, только если он получает обратную связь о. своем поведении, что можно сравнить со стимуляцией, которую он получает от других говорящих людей. Одной из функций педагога является обеспечение произвольных (иногда ложных) последствий с целью получения обратной связи. Обусловливание также зависит от вида, количества и момента предъявления подкрепления, а также от многих других факторов.
Отдельное подкрепление может иметь значительный эффект.
При благоприятных условиях один какой-нибудь резкий шаг может привести к увеличению частоты появления реакции в дальнейшем. В обычных случаях такое значительное увеличение наблюдается уже после одного подкрепления, и дальнейший дополнительный прирост величины продолжается по мере предъявления последующих подкреплений. Это наблюдение ни в коей мере нельзя объяснить мгновенным изменением в сторону максимальной вероятности, поскольку не выделен оперант в чистом виде. Увеличение частоты можно интерпретировать с точки зрения других поведенческих характеристик ситуации. Тот факт, что обусловливание организма может быть быстрым у животных такого «низкого уровня развития», как крысы и голуби, приводит к интересным выводам. Различия в том, что обычно называют интеллектом, до некоторой степени объясняются различиями в скорости научения. Но не может существовать более быстрого научения, чем мгновенное увеличение вероятности реакции. Следовательно, специфичность человеческого поведения определяется какими-то другими факторами.
ОПЕРАНТНОЕ УГАШЕНИЕ
Когда подкрепление больше не поступает, реакция становится все менее и менее частой; этот процесс получил название «оперантного угашения». Если задержать подачу пищи, голубь перестанет поднимать голову. В общем, когда мы выполняем поведение, которое больше «не приносит нам никакой выгоды», мы утрачиваем тенденцию повторять его. Если мы потеряли авторучку, мы все реже и реже направляем руку в карман, в котором она хранилась. Если нам не отвечают на телефонные звонки, то в конце концов мы перестаем звонить. Если пианино расстраивается, то мы все реже и реже на нем играем. Если звук нашего радиоприемника стал слишком громким или передачи стали хуже, мы перестаем его слушать.
Поскольку оперантное угашение протекает гораздо медленнее, чем оперантное обусловливание, постольку наблюдать за ним гораздо проще. При благоприятных условиях получаются плавные кривые, показывающие, что скорость реакций медленно уменьшается, возможно, в течение нескольких часов. Кривые раскрывают свойства, которые нельзя получить из наблюдения. У нас «может сложиться впечатление», что организм реагирует реже и реже, но за характером изменения можно проследить только при регистрации поведения. Кривые показывают, что угашение есть довольно однородный процесс, который определяет силу поведения.
При определенных условиях на кривую оказывают влияние эмоциональные реакции. Отсутствие подкрепления приводит не только к угашению операнта. Оно вызывает также реакцию фрустрации, или ярости. Голубь, который не получил подкрепления, отворачивается от рычага, воркует, хлопает крыльями и демонстрирует другие виды эмоционального поведения. Человек также демонстрирует подобные реакции. Ребенок, у которого велосипед не двигается с места, когда он нажимает на педали, перестает их крутить. Взрослый, который находит ящик письменного стола запертым, скоро перестает дергать ручку, но он может колотить по столу и браниться или может проявлять другие признаки гнева. Точно так же как ребенок вновь вернется к велосипеду, а взрослый — к ящику стола, птица вновь повернется к рычагу, когда эмоциональная реакция угаснет. Могут наблюдаться и другие явления эмоционального характера. В таких условиях кривая угашения характеризуется циклическими колебаниями, поскольку эмоциональные реакции появляются, исчезают и вновь появляются. Если каким-либо способом удается устранить эмоцию, кривая принимает более простую форму.
Поведение, которое наблюдается во время угашения, является результатом обусловливания, которое ему предшествовало, и в свете этого кривая угашения дает еще одну меру эффекта подкрепления. Если было подкреплено всего лишь несколько реакций, угашение происходит быстро. Большое количество подкреплений приводит к длительному сохранению реакции. Силу сопротивления угашению нельзя предсказать по вероятности реакции, наблюдаемой в каждый отдельный момент. Необходимо знать историю подкрепления. Например, если мы получили подкрепление в виде великолеп-, но приготовленной пищи в новом ресторане, невкусно приготовленная пища может «свести на нет» хорошее впечатление от этого ресторана; но если мы питались в ресторане качественной пищей в течение многих лет, то тогда, при прочих равных условиях, нам надо будет несколько раз принять невкусную пищу, прежде чем мы утратим склонность постоянно питаться в нем.
Между количеством подкрепленных реакций и количеством реакций, возникающих при угашении, нет простых связей. Сила сопротивления угашению в режиме прерывистого подкрепления может быть гораздо больше силы сопротивления угашению в случае, когда то же количество подкреплений дается за каждую реакцию. Таким образом, если мы только один раз случайно подкрепим ребенка за хорошее поведение, то оно при отсутствии подкрепления будет сохраняться дольше, чем в том случае, когда мы подкрепляем каждое правильное выполнение.
Этот вывод имеет практическую значимость в тех случаях, когда ценные виды подкреплений ограничены. Подобного рода проблемы возникают в области образования, промышленности, экономики и пр. В условиях некоторых режимов прерывистого подкрепления голубь может произвести 10 000 поведенческих реакций, прежде чем полностью завершится процесс угашения.
Угашение является эффективным способом устранения операнта из организма. Его не следует путать с другими процедурами, созданными для получения того же эффекта. В настоящее время предпочтение отдается наказанию, которое включает в себя различные процессы и эффективность которого вызывает сомнения. С угашением часто путают забывание. При забывании эффект обусловливания утрачивается просто по мере прохождения определенного времени, в то время как угашение требует, чтобы реакция возобновлялась без подкрепления. Обычно забывание наступает не быстро; большие кривые угашения были получены через шесть лет после того, как реакции голубей были подкреплены последний раз. Шесть лет составляют больше половины жизни голубей. В этот период времени голуби жили в таких условиях, в которых реакция не могла быть подкреплена. В поведении человека реакции научения, порожденные относительно определенными условиями, часто сохраняются без использования на протяжении половины жизни человека. Утверждение, что ранний опыт определяет личность зрелого организма, предполагает, что эффект оперантного обусловливания долгосрочен. Таким образом, если из-за раннего опыта, полученного в детстве, мужчина женится на женщине, которая напоминает его мать, то это говорит о том, что эффект определенных подкреплений должен сохраняться долгое время. Большинство случаев забывания включают в себя оперантное поведение при контроле определенных стимулов, и их нельзя подвергнуть адекватному анализу до обсуждения проблемы контроля.
Эффект угашения. Условия процесса протекания угашения более или менее известны, однако сущность его часто понимают неправильно. Экстремальное угашение иногда называют «abulia». Определение этого феномена как «отсутствие воли» мало что дает, поскольку отсутствие или наличие воли выводится из наличия или отсутствия поведения. Однако термин представляется полезным, поскольку он предполагает, что поведение отсутствует по определенной причине, и мы можем провести то же самое различение другим способом. Поведение является сильным или слабым из-за действия многих различных переменных, и задача, науки о поведении заключается в том, чтобы их выявлять и классифицировать. Каждый случай мы определяем в терминах переменных величин. Условия, которые возникают в результате длительного угашения, по лежащим на поверхности признакам напоминают инактивность, возникающую в результате действия других причин. Различия этих случаев надо искать в истории организма. Целеустремленный писатель, отправляющий издателям одну рукопись за другой, когда все они были отвергнуты, может в конце концов заявить, что «он не может больше написать ни одного слова». Частично он парализован тем, что его «зажимают», но все-таки он продолжает настаивать на том, что он «хочет писать», и мы можем согласиться с ним и квалифицируем это так: чрезвы-: чайно низкая вероятность реакции определяется угашением. Однако другие переменные все еще сохраняют свое действие и если бы угашение не произошло, они бы дали высокую вероятность достижения.
Необходимо обратиться к условиям, при которых небольшая сила операнта является результатом угашения. Некоторые формы психотерапии являются системами подкрепления, созданными для восстановления поведения, которое было утрачено в процессе угашения. Терапевт может сам давать подкрепление или он организует такие условия жизни, которые будут подкреплять поведение. В терапии профессионального продвижения, например, терапевты способствуют тому, чтобы пациент начал осуществлять простые формы поведения, мгновенно и сравнительно постоянно подкрепляемые. Объяснения, что такая терапия помогает пациенту потому, что дает ему чувство «достижения» или «укрепляет его нравственную сферу», «формирует его интересы» или предотвращает его от «разочарования», не дают никаких преимуществ. Такая терминология просто увеличивает объем объяснительных фикций. Человек, который действительно вовлечен в данный вид активности, проявляет не интерес, а демонстрирует эффект подкрепления. Мы не даем человеку «чувство достижения», а подкрепляем определенное его действие. Разочароваться — просто означает утратить возможность реагировать из-за отсутствия подкрепления. Наша проблема состоит лишь в том, чтобы объяснить вероятность реакции в терминах процесса подкрепления и угашения.
УСЛОВНЫЕ ПОДКРЕПЛЕНИЯ
Презентируемый при оперантном подкреплении стимул может быть соединен с другим стимулом, представленным в респондентном обусловливании. В гл. 4 мы рассмотрели условия приобретения способности вызывать реакцию; здесь остановимся на феномене подкрепления. Хотя подкрепление имеет другую стимульную функцию, процесс, возникающий при сочетании стимулов, представляется таким же. Если голодному животному часто предъявлять пищу на подносе, то пустой поднос вызывает выделение слюны. В определенной степени пустой поднос также будет подкреплять оперант.
Можно еще проще продемонстрировать условное подкрепление на примере стимулов, которые легче контролировать. Если каждый раз, давая пищу голодному голубю, мы будем включать свет, то свет постепенно ста-яет условным подкреплением. Он может использоваться для обусловливания операнта так же, как используется пища. Нам уже кое-что известно о том, как свет приобретает это свойство: чем чаще свет сочетается с пищей, тем большую силу как подкрепление он приобретает; нельзя предъявлять пищу вслед за светом через большие промежутки времени; сила подкрепления быстро утрачивается, когда пища не предъявляется. Все это вытекает из наших знаний о стимульном обусловливании. Условные подкрепления часто являются продуктом естественных контингентов. Обычно пища или вода получаются только после того, как организм выполнил «предшествующее» поведение — после того, как он воздействовал на среду, чтобы создать возможность для того, чтобы поесть и попить. Поэтому стимулы, порожденные этим «предшествующим» поведением, становятся подкреплениями. Таким образом, прежде чем мы сможем успешно перенести пищу с тарелки к себе в рот, необходимо приблизиться к тарелке, и любое поведение, которое приближает нас к тарелке, автоматически подкрепляется. Следовательно, поддерживается сила «предшествующего» поведения. Это имеет большое значение, поскольку только незначительная часть поведения сразу подкрепляется пищей, водой, сексуальным контактом или другими событиями биологической важности. Хотя характерной особенностью человеческого поведения является то, что важные подкрепления могут быть эффективными при отсрочке на большие промежутки времени, это объясняется, по-видимому, тем, что промежуточные события становятся условными подкреплениями. Когда человек в октябре укрепляет на окнах своего дома вторые рамы, потому что в результате аналогичного поведения в октябре прошлого года в январе в доме было тепло, нам необходимо определить, как заполняется промежуток между поведением в октябре и его эффектом в январе. Среди условных подкреплений, ответственных за силу этого поведения, есть определенные вербальные последствия, исходящие от самого человека или его соседей. Иногда бывает важно оставить ряд событий между действием и конечным важным подкреплением для того, чтобы осуществлять контроль за поведением в практических целях. В сфере образования, промышленности, психотерапии и др. мы сталкиваемся с различными методиками, разработанными для создания соответствующих условных подкреплений. Обеспечение непосредственных эффективных последствий тогда, когда конечные последствия отсрочены, должно «улучшать мораль», «усиливать интерес», «предотвращать появление чувства неуверенности» или корректировать условия низкой оперантной силы, которые мы называем «abulia», и т. д. Конкретизируя это положение, можно сказать, что оно побуждает студентов учиться, лиц, нанятых на работу, приходить в учреждения, больных принимать посильное участие в общественной жизни и т. д.
Обобщенные (generalized) подкрепления. Условное подкрепление обобщается (is generalized), когда оно сочетается более чем с одним первичным подкреплением. Генерализованное подкрепление оказывается полезным потому, что состояние организма в данный момент необязательно является значимым. Оперантная сила, генерализованная посредством только одного подкрепления, наблюдается при создании соответствующего условия, депривации; когда мы подкрепляем пищей, мы получаем возможность управлять голодным животным. Но если условное подкрепление сочетается с подкреплениями, соответствующими многим условиям, тогда по крайней мере одно из них, соответствующее состоянию депривации, должно будет оказать влияние на последующую ситуацию. Поэтому реакция должна будет произойти. Например, когда мы подкрепляем деньгами, организуемое нами управление относительно независимо от кратковременных депривации…Создается один вид, обобщенного подкрепления, потому что многие первичные подкрепления получаются только после предъявленных преобразований физической среды.
В различных ситуациях одна форма «предшествующего» поведения может вести за собой различные виды подкреплений. Непосредственная стимуляция на основе такого поведения становится обобщенным подкреплением. Мы автоматически получаем подкрепление, независимо от любой определенной депривации, когда мы, успешно осуществляем контроль за физическим миром. Этим объясняется наша тенденция увлекаться профессиональным мастерством, художественным творчеством, и такими видами спорта, как игра в кегли, биллиард и теннис.
Однако возможны ситуации, при которых некоторые эффекты подкрепления «сенсорной обратной связи» не обусловливаются. Оказывается, что ребенок подкрепляется стимуляцией, идущей из среды, за которой не следует первичное подкрепление, например действие детской погремушки. Способность получать подкрепление таким образом могла возникнуть в эволюционном процессе, и она, возможно, аналогична подкреплению, которое мы получаем, просто «организуя мир соответствующим образом». Любой организм, который подкрепляется успешным взаимодействием со средой, несмотря на последствия в каждый момент, окажется в более благоприятных условиях, когда последуют значимые последствия.
Когда поведение подкрепляется другими людьми, появляется несколько важных генерализованных подкреплений, например внимание. Всем известны случаи, когда ребенок плохо ведет себя «только для того, чтобы привлечь к себе внимание». Внимание людей подкрепля