Какие события являются подкрепляющими
Имея дело с людьми в жизни, клинике и лаборатории, мы должны знать, каков подкрепляющий эффект какого-либо специфического события. Мы часто замечаем, насколько наше собственное поведение подкрепляется одним и тем же событием. Нередко подобного рода практика уводит нас в сторону; тем не менее существует общепринятое мнение, что подкрепления можно определять в отрыве от рассмотрения их воздействий на определенный организм. Однако в соответствии с нашим использованием этого термина единственной определяющей характеристикой подкрепляющего стимула является то, что он подкрепляет.
Для того чтобы сказать, подкрепляет ли определенное событие определенный организм в определенных условиях, необходимо провести прямое испытание. Мы наблюдаем за частотой выбранной реакции, затем делаем событие зависимым от нее и следим за изменениями, происходящими в его частоте. Если изменения имеют место, то тогда мы рассматриваем данное событие как подкрепляющее организм в данных условиях. В классифицировании событий на основе их эффектов нет ничего тавтологичного; используемый критерий является как эмпирическим, так и объективным. Однако он стал бы тавтологичным, если затем мы стали бы утверждать, что данное событие усиливает оперант, потому что оно подкрепляет. Мы достигаем определеных успехов, когда нам удается угадать подкрепляющее событие только в результате «грубого» наблюдения. Так как мы испытали подкрепляющий эффект стимула на себе, мы допускаем, что он будет оказывать то же воздействие и на других. Мы достигаем успеха только тогда, когда рассматриваем себя как организм, подвергаемый изучению, и корректно наблюдаем за собственным поведением.
Можно выделить два типа событий, обладающих эффектом подкрепления. Некоторые подкрепления представляют собой предъявление стимулов или добавление чего-то, например воды, еды или возможности сексуального контакта в ситуацию. Они называются положительными подкреплениями. Другой тип подкрепляемых событий состоит в устранении чего-либо, например сильного шума, яркого света, холода, жары или электрического шока из ситуации. Это — отрицательное подкрепление. В обоих случаях сохраняется один и тот же эффект подкрепления — вероятность реакции повышается. Мы не можем обойтись без этого различения, просто указав на то, что в негативной ситуации подкрепляет отсутствие яркого света, сильного шума и т. д., поскольку воздействие оказывает именно отсутствие чего-либо после его презентации, и это еще один способ выражения того, что стимул устранен. Различия между двумя случаями станут яснее, когда мы рассмотрим случаи с презентацией негативного подкрепления, или случаи с устранением позитивного подкрепления. Их последствия мы называем наказанием.
В условиях практического применения оперантного обусловливания часто бывает необходимо наблюдать за событиями, оказывающими подкрепляющее воздействие на данного индивида. В любой области, важной характеристикой которой является поведение, — образовании, управлении, семье, здравоохранении, промышленности, искусстве, литературе и т. д. — мы постоянно изменяем вероятности реакции с помощью их подкрепления. Промышленник, который хочет, чтобы его рабочие работали постоянно и без прогулов, должен заботиться о соответствующем подкреплении их поведения, и не только с помощью заработной платы, но также и с помощью подходящих условий работы. Девушка, которая хочет еще раз встретиться с молодым человеком, должна быть уверена, что поведение ее друга, связанное с назначением свидания и желанием сдержать свое слово, получило адекватное подкрепление. Для того чтобы обучить ребенка читать или петь, или играть на музыкальном инструменте, необходимо разработать программу педагогических подкреплений, в соответствии с которой правильные реакции должны постоянно «оцениваться». Если пациенту необходимо еще раз обратиться к врачу за консультацией, то последний должен быть уверен в том, что данное поведение пациента получило соответствующее подкрепление.
Мы оцениваем силу подкрепляющих событий, когда пытаемся установить, что «человек выбирает в жизни». Какие следствия определяют репертуар его поведения и относительную частоту реакций, входящих в него? Кое-что об этом говорят нам реакции на различные темы, обсуждаемые в разговоре, но его обычное поведение является еще лучшим ориентиром. Мы делаем вывод о значимых видах подкрепления на основании проявления им интересов к какому-то писателю, освещающему определенные проблемы, к магазинам или музеям, в которых представлены определенные предметы, к друзьям, проявляющим определенные виды поведения, к ресторанам, в которых подают определенную пищу и т. д. «Интерес» соответствует вероятности, являющейся результатом, по крайней мере частично, последствий поведения «проявления интереса». Мы можем быть почти уверены в значимости подкрепления, если наблюдаем за тем, как начинается и протекает поведение по мере чередующегося предъявления и удержания подкрепления, так как тогда изменение вероятности, очевидно, будет в меньшей степени определяться случайным изменением какого-то другого вида. Поведение, которое ассоциируется с дружбой с каким-либо человеком, изменяется, поскольку этот человек изменяет поставляемые им подкрепления.
Если мы пронаблюдаем за подобными изменениями, то сможем составить вполне определенное мнение о том, «что означает эта дружба» или «что наш испытуемый видит в своем друге».
Данная процедура наблюдения может быть усовершенствована с целью ее применения в клинических и лабораторных исследованиях. Можно составить набор картинок, предоставив испытуемому возможность просмотреть их и при этом записав время разглядывания каждой из них. Поведение «разглядывания картинки» подкрепляется тем, что видится в ней. Рассматривание одной картинки может иметь больший эффект подкрепления, чем рассматривание другой картинки и, время, затрачиваемое на рассматривание картинок, также будет варьировать. Эта информация может быть применена в тех случаях, когда возникает необходимость по какой-либо причине подкрепить или устранить поведенческие реакции нашего испытуемого.
Литературу, живопись и эстраду можно рассматривать как хорошо продуманные подкрепления. Так или иначе приобретение книг, билетов на представления и выставки произведений искусства зависит от того, являются ли эти книги, пьесы, концерты или картины подкреплениями. Часто художник ограничивает себя поисками того, что является подкреплением для него самого. Когда он действует таким образом, в его работе «отражается его собственная индивидуальность», и тогда только случайно (как мера универсальности) его книга или пьеса или музыка, или картина оказывают подкрепляющее воздействие на других. Поскольку коммерческий успех имеет большое значение, постольку с его помощью можно непосредственно изучать поведение других людей.
Для выяснения того, что является подкреплением для данного человека, мы не можем ограничиться простым вопросом к нему о том, что его подкрепляет. Его ответ может представлять определенную ценность, но его ни в коем случае нельзя считать надежным. Подкрепляющие связи не всегда очевидны для человека. Часто только в ретроспективе тенденции человека вести себя определенным образом рассматриваются как результат определенных последствий, и отношения могут совсем не репрезентироваться субъекту, даже если они очевидны для других людей.
Конечно, существуют большие различия между индивидами в отношении событий, которые имеют силу подкрепления. Различия между видами настолько велики, что едва ли они могут представлять интерес; очевидно, что-то, что подкрепляет лошадь, необязательно подкрепляет собаку или человека. Среди представителей вида большие различия могут объясняться не столько наследственностью, но и историей жизни индивида, обстоятельства которой могут быть прослежены. Тот факт, что организм наследует способность получать подкрепления в виде определенных событий, не может использоваться для предсказания неиспытанного стимула. Также и отношения между подкрепляющим событием и депри-вацией или любым другим условием организма не наделяют подкрепляющее событие никакими определенными физическими качествами. Особенно невероятно, чтобы событие, которое приобрело силу подкрепления, выделилось бы каким-то определенным образом. Тем не менее такие события являются важными видами подкрепления.
УСЛОВНЫЕ ПОДКРЕПЛЕНИЯ
Презентируемый при оперантном подкреплении стимул может быть соединен с другим стимулом, представленным в респондентном обусловливании. В гл. 4 мы рассмотрели условия приобретения способности вызывать реакцию; здесь остановимся на феномене подкрепления. Хотя подкрепление имеет другую стимульную функцию, процесс, возникающий при сочетании стимулов, представляется таким же. Если голодному животному часто предъявлять пищу на подносе, то пустой поднос вызывает выделение слюны. В определенной степени пустой поднос также будет подкреплять оперант.
Можно еще проще продемонстрировать условное подкрепление на примере стимулов, которые легче контролировать. Если каждый раз, давая пищу голодному голубю, мы будем включать свет, то свет постепенно ста-яет условным подкреплением. Он может использоваться для обусловливания операнта так же, как используется пища. Нам уже кое-что известно о том, как свет приобретает это свойство: чем чаще свет сочетается с пищей, тем большую силу как подкрепление он приобретает; нельзя предъявлять пищу вслед за светом через большие промежутки времени; сила подкрепления быстро утрачивается, когда пища не предъявляется. Все это вытекает из наших знаний о стимульном обусловливании. Условные подкрепления часто являются продуктом естественных контингентов. Обычно пища или вода получаются только после того, как организм выполнил «предшествующее» поведение — после того, как он воздействовал на среду, чтобы создать возможность для того, чтобы поесть и попить. Поэтому стимулы, порожденные этим «предшествующим» поведением, становятся подкреплениями. Таким образом, прежде чем мы сможем успешно перенести пищу с тарелки к себе в рот, необходимо приблизиться к тарелке, и любое поведение, которое приближает нас к тарелке, автоматически подкрепляется. Следовательно, поддерживается сила «предшествующего» поведения. Это имеет большое значение, поскольку только незначительная часть поведения сразу подкрепляется пищей, водой, сексуальным контактом или другими событиями биологической важности. Хотя характерной особенностью человеческого поведения является то, что важные подкрепления могут быть эффективными при отсрочке на большие промежутки времени, это объясняется, по-видимому, тем, что промежуточные события становятся условными подкреплениями. Когда человек в октябре укрепляет на окнах своего дома вторые рамы, потому что в результате аналогичного поведения в октябре прошлого года в январе в доме было тепло, нам необходимо определить, как заполняется промежуток между поведением в октябре и его эффектом в январе. Среди условных подкреплений, ответственных за силу этого поведения, есть определенные вербальные последствия, исходящие от самого человека или его соседей. Иногда бывает важно оставить ряд событий между действием и конечным важным подкреплением для того, чтобы осуществлять контроль за поведением в практических целях. В сфере образования, промышленности, психотерапии и др. мы сталкиваемся с различными методиками, разработанными для создания соответствующих условных подкреплений. Обеспечение непосредственных эффективных последствий тогда, когда конечные последствия отсрочены, должно «улучшать мораль», «усиливать интерес», «предотвращать появление чувства неуверенности» или корректировать условия низкой оперантной силы, которые мы называем «abulia», и т. д. Конкретизируя это положение, можно сказать, что оно побуждает студентов учиться, лиц, нанятых на работу, приходить в учреждения, больных принимать посильное участие в общественной жизни и т. д.
Обобщенные (generalized) подкрепления. Условное подкрепление обобщается (is generalized), когда оно сочетается более чем с одним первичным подкреплением. Генерализованное подкрепление оказывается полезным потому, что состояние организма в данный момент необязательно является значимым. Оперантная сила, генерализованная посредством только одного подкрепления, наблюдается при создании соответствующего условия, депривации; когда мы подкрепляем пищей, мы получаем возможность управлять голодным животным. Но если условное подкрепление сочетается с подкреплениями, соответствующими многим условиям, тогда по крайней мере одно из них, соответствующее состоянию депривации, должно будет оказать влияние на последующую ситуацию. Поэтому реакция должна будет произойти. Например, когда мы подкрепляем деньгами, организуемое нами управление относительно независимо от кратковременных депривации…Создается один вид, обобщенного подкрепления, потому что многие первичные подкрепления получаются только после предъявленных преобразований физической среды.
В различных ситуациях одна форма «предшествующего» поведения может вести за собой различные виды подкреплений. Непосредственная стимуляция на основе такого поведения становится обобщенным подкреплением. Мы автоматически получаем подкрепление, независимо от любой определенной депривации, когда мы, успешно осуществляем контроль за физическим миром. Этим объясняется наша тенденция увлекаться профессиональным мастерством, художественным творчеством, и такими видами спорта, как игра в кегли, биллиард и теннис.
Однако возможны ситуации, при которых некоторые эффекты подкрепления «сенсорной обратной связи» не обусловливаются. Оказывается, что ребенок подкрепляется стимуляцией, идущей из среды, за которой не следует первичное подкрепление, например действие детской погремушки. Способность получать подкрепление таким образом могла возникнуть в эволюционном процессе, и она, возможно, аналогична подкреплению, которое мы получаем, просто «организуя мир соответствующим образом». Любой организм, который подкрепляется успешным взаимодействием со средой, несмотря на последствия в каждый момент, окажется в более благоприятных условиях, когда последуют значимые последствия.
Когда поведение подкрепляется другими людьми, появляется несколько важных генерализованных подкреплений, например внимание. Всем известны случаи, когда ребенок плохо ведет себя «только для того, чтобы привлечь к себе внимание». Внимание людей подкрепляет, потому что оно является необходимым условием других подкреплений, исходящих от них. Вообще, только те люди, которые внимательны к нам, подкрепляют наше поведение. Внимание со стороны людей, которые прежде всего обычно являются источниками подкрепления — родителей, учителя или любимого человека, — служит особенно хорошим обобщенным подкреплением и формирует особенно сильное поведение «получения внимания». Специфичность многих вербальных реакций состоит в том, что они привлекают внимание, например «смотри», «пойми», а также произнесение имени человека. Другими характерными формами поведения, которые можно назвать сильными, потому что они требуют внимания, являются симуляция болезни, раздраженность и броскость (самореклама).
Часто внимания бывает недостаточно. Другой человек может подкрепить только ту часть поведения данного человека, которое он одобряет, и, следовательно, любой признак его одобрения по праву становится подкрепляющим. Поведение, которое вызывает улыбку, или вербальную реакцию «Правильно», «Хорошо», или любую другую похвалу, подкрепляет. Мы пользуемся этим обобщенным подкреплением для формирования поведения других людей, особенно в сфере образования. Например, мы обучаем детей и взрослых говорить правильно, произнося «Правильно», когда они дают правильную поведенческую реакцию.
Еще более сильным генерализованным подкреплением является аффектация. Она может быть прежде всего связана с сексуальным контактом как первичным подкреплением, но когда тот, кто вызывает аффектацию, также вводит другие виды подкрепления, эффект тенерализуется.
Трудно дать определение внимания, одобрения и аффекта и также трудно наблюдать за ними и измерять их. Они являются не вещами, а аспектами поведения других. Их неуловимые физические параметры представляют трудность не только для ученого, который должен изучать их, но также и для индивида, которого они подкрепляют. Если мы не можем легко обнаруживать, что человек обращает внимание на нас, одобряет
наше поведение или что мы привлекательны для него, тогда наше поведение не будет последовательно подкрепляться. Поэтому оно может оказаться слабым, может иметь тенденцию протекать в несоответствующее время и т. д. Мы не знаем, что делать для того, чтобы «привлечь к себе внимание», «вызвать любовь», или «когда это делать». Ребенок, борясь за внимание, влюбленный — за проявления любви, художник — за одобрение его произведений, демонстрируют стойкое поведение, которое является только результатом прерывистого подкрепления.
Другим генерализованным подкреплением является подчиненность других людей. Когда человек бывает вынужден давать различные подкрепления, то любое указание на его подчиненность становится подкреплением. Задиристого человека всегда подкрепляют признаки трусости, а представителей правящего класса — признаки уважения. Престиж и уважение являются генера-лизованными подкреплениями только постольку, поскольку они гарантируют, что другие люди будут действовать определенным образом. То, что наличие своего собственного образа действия подкрепляет, можно показать на примере поведения тех людей, которые управляют ради того, чтобы управлять. Физические признаки покорности обычно не бывают столь неуловимыми, как свойства внимания, одобрения и любви. Задиристый человек может настаивать на проявлении четких признаков признания его доминирования, а ритуальные обычаи могут подчеркивать уважение.
Источники обобщенных подкреплений легко забываются, и они рассматриваются как подкрепления, имеющие якобы самостоятельную силу. Мы говорим о потребности во внимании, одобрении или аффекте, о «потребности в доминировании» и «любви к деньгам», как будто бы они являются первичными условиями де-привации. Но способность к подкреплению с помощью подобных средств едва ли может развиться за короткий промежуток времени, в течение которого преобладают необходимые условия. Внимание, аффект, одобрение и подчинение, по-видимому, существовали в человеческом обществе только короткий промежуток времени в процессе эволюции. Более того, они не представляют собой фиксированные формы стимуляции, поскольку зависят от особенностей склада определенных групп. Поскольку аффектация главным образом связана с сексуальной сферой, постольку она может быть связана с условием первичной депривации, которая в определенной мере независима от истории жизни человека, но признаки «удовольствия», которые приобретают силу подкрепления благодаря их связи с сексуальным контактом или с другими подкреплениями, едва ли могут обладать эффектом подкрепления по генетическим причинам. Символы появились еще позднее, и редко высказывается мнение, что потребность в них врождена. Обычно мы можем наблюдать за процессом, в котором ребенок начинает получать подкрепление в форме денег. Однако часто «любовь к деньгам» кажется независимой от «потребности в одобрении», но если мы более детально рассмотрим эффективность этих генерализованных подкреплений, у нас окажется столько же оснований для признания врожденной потребности к деньгам, как и для признания врожденной потребности во внимании, удовольствии или доминировании.
Обычно генерализованные подкрепления оказываются эффективными, даже если первичные подкрепления, на которых они основываются, больше их не сопровождают. Мы играем в игры, требующие определенных навыков ради них самих. Аффекты не всегда вызываются сексуальным подкреплением. Подчиненность других людей подкрепляет, даже если мы не используем ее. Эффект подкрепления деньгами жадного человека может оказаться настолько сильным, что он может обречь себя на голод, чтобы не лишиться их. Эти факты, поддающиеся наблюдению, должны занять надлежащее место при построении теорий и изучении практики. Они не означают, что обобщенные подкрепления представляют собой нечто большее, чем физические свойства стимулов, наблюдаемые в каждом случае, или что существуют какие-то нефизические данности, которые необходимо принимать во внимание.
Закон эффекта не является теорией. Это просто правило, объясняющее усиление поведения. Когда мы подкрепляем реакцию и наблюдаем за изменениями ее частоты, можно легко описать то, что произошло, в объективных терминах. Но при объяснении того, почему это произошло, необходимо обратиться к теории. Почему подкрепление подкрепляет? Одна из теорий утверждает, что организм повторяет реакцию, потому что он находит, что его следствия «приятны» или «приносят удовлетворение». Но в каком смысле это является объяснением для естественной науки? Такие характеристики, как «приятный» или «приносящий удовлетворение», вероятно, не относятся к физическим свойствам того, что подкрепляет, поскольку физическая наука не использует ни эти термины, ни какие-либо другие их эквиваленты. Термины должны характеризовать определенное воздействие на организм, но можно ли его определить таким образом, чтобы оно было пригодным для объяснения подкрепления?
Иногда полагают, что вещь является приятной, если индивид стремится к ней или сохраняет ее, и она считается неприятной, если индивид избегает или отвергает ее. Сделано много попыток найти объективное определение, но все они уязвимы для критики: определяемое поведение может быть просто еще одним продуктом эффекта подкрепления. Утверждение, что стимул приятен, потому что организм стремится приблизиться к нему или удержать его, может быть еще одним способом выражения того, что стимул подкрепил поведение «приближения» или «удержания». Вместо того чтобы определять эффект подкрепления с точки зрения его воздействия на поведение в общем, мы просто определили известный нам вид поведения, который почти с неизбежностью подкреплялся и, следовательно, в общем является пригодным в качестве индикатора силы подкрепления. Если продолжать утверждать, что стимул подкрепляет потому, что он приятен, тогда то, что выдвигается как объяснение, включающее два эффекта, в действительности является излишним описанием одного из них.
Альтернативный подход к описанию характеристик «приятный» и «неприятный» (или «приносящий удовлетворение» и «раздражающий») заключается в том, что испытуемого спрашивают, что он ощущает, когда имеет дело с определенными событиями. Это предполагает, что подкрепление имеет два эффекта: усиливает поведение и порождает «чувства» и что одно является функцией другого. Но функциональные отношения можно рассмотреть и в другой плоскости. Когда человек сообщает, что событие приятно, он может просто иметь в виду, что это такое событие, которое подкрепляет его или по отношению к которому он обнаруживает в себе тенденцию стремиться, двигаться, так как оно подкрепляет такое движение. Далее мы увидим, что человек мог бы и не приобретать вербальные реакции, указывающие на его ощущение удовольствия, если бы подобный феномен не имел бы места. В любом случае сам испытуемый не получает преимуществ, фиксируя таким образом свои наблюдения. Субъективные суждения об удовольствии или удовлетворении, порождаемые стимулами, как правило, ненадежны и неустойчивы. Как подчеркивается в теории бессознательного, мы не можем давать самоотчет о всех событиях, которые проявляют себя как подкрепляющие нас, или мы можем сообщить о том, что вступает в прямое противоречие с объективными наблюдениями; также мы можем назвать неприятным событие, которое в действительности подкрепляет. Примеры такой аномалии варьируют от мазохизма до мученичества.
Иногда утверждают, что подкрепление оказывается эффективным потому, что оно редуцирует состояние депривации. В данном случае имеет место по крайней мере побочный эффект, который не следует путать с самим подкреплением. Очевидно, что депривация имеет большое значение для оперантного обусловливания. В наших экспериментах мы имеем дело с голодным голубем и по-другому не можем продемонстрировать oпeрантное обусловливание. Чем голоднее птица, тем чаще она реагирует в результате подкрепления. Но, несмотря на эту связь, неправильно было бы считать, что подкрепление всегда редуцирует депривацию. Обусловливание может наступать прежде любого значительного изменения в депривации, измеряемой другими способами.
Связь между насыщением и подкреплением следует искать в процессе эволюции. Едва ли можно оставить без внимания тот факт, что первичные подкрепления играют огромную биологическую роль. Пища, вода, сексуальный контакт и избегание боли явно связаны с благополучием организма. Индивид, который подкрепляется такими событиями, приобретает в высшей степени эффективное поведение. Также биологически значимым является то обстоятельство, согласно которому поведение, порождаемое определенным подкреплением, с большей вероятностью появляется в состоянии депривации. Таким образом, важным является не только то, что любое поведение, которое приводит к приему пищи, должно стать важной частью поведенческого репертуара, но и то, что это поведение оказывается особенно сильным, когда организм голоден. Эти две особенности организма, по-видимому, определяют то, что организм может подкрепляться специфическими способами и что результат будет наблюдаться в релевантных условиях депривации.
Некоторые формы стимуляции получают положительное подкрепление, хотя они не вызывают поведения, имеющего биологическое значение. Ребенок подкрепляется не только пищей, но и звоном колокольчика или блеском яркого предмета. Поведение, которое постоянно следует за этими стимулами, характеризуется увеличением вероятности. Трудно, а может быть и невозможно проследить эти эффекты подкрепления в истории обусловливания. Позднее мы можем обнаружить, что того же самого индивида подкрепляют звучание оркестра или красочный спектакль. В данном случае еще труднее убедиться в том, что эффект подкрепления не обусловлен. Однако можно утверждать, что способность получить подкрепление из среды с помощью любой обратной связи была бы биологическим достижением, поскольку она готовила бы организм к успешному управлению средой, прежде чем сформируется данное состояние депривации. Когда организм порождает тактильную обратную связь, например, ощущение текстуры материала или поверхности скульптуры, обусловливание обычно рассматривается как результат сексуального подкрепления даже тогда, когда стимулируемая область по функции не является первично-сексуальной. В этой связи хотелось бы предположить, что другие формы стимуляции, продуцированные поведением, точно так же связаны с биологически значимыми событиями.
Когда среда изменяется, тогда способность получать подкрепление данным событием с биологической точки зрения может рассматриваться как недостаток. Сахар является очень обильным подкреплением для большинства представителей человеческого рода, о чем свидетельствует огромное количество прилавков для продажи сладостей. В этом отношении его эффект гораздо превосходит биологическую потребность в нем в наши дни.
Этого не было до того, как сахар стал выращиваться и производиться в большом количестве. Несколько сот лет тому назад сильный подкрепляющий эффект сахара, вероятно, был оправдан. Среда изменилась, но генетические возможности организма остались на прежнем уровне. Секс является еще одним примером. В настоящее время сильный эффект сексуального контакта не является преимуществом организма, но нам нет необходимости возвращаться на много лет назад, для того чтобы обнаружить условия голода и эпидемий, при которых сила сексуального подкрепления была оправдана. Объяснение силы подкрепления биологией организма можно продолжать до тех пор, пока мы будем говорить о том, почему то или иное событие подкрепляет. Для функционального анализа такое объяснение, вероятно, ничего не даст, так как оно не дает никаких способов идентификации подкрепляющих стимулов, прежде чем мы не испытаем его подкрепляющего воздействия на организм. Следовательно, мы должны довольствоваться объяснением с точки зрения воздействий стимулов на поведение.