Научение через ответные последствия

Самый элементарный способ научения, уходящий корнями в непосредственный личный опыт, основан на результатах тех или иных действий — положительных или отрицательных. Переживая повседневные события

ИСТОКИ ПОВЕДЕНИЯ

своей жизни, люди очень скоро начинают понимать, что одни из их реакций, как правило, всегда ведут к успеху, другие — безрезультатны, а иногда даже имеют весьма печальные последствия. Благодаря процессу такого дифференцированного подкрепления постепенно отбираются эффективные формы поведения, в то время как неэффективные — отбрасываются.

Научение через подкрепление обычно изображается как механический процесс, в котором реакции автоматически и бессознательно формируются их непосредственными последствиями. Простые действия могут подвергаться модификации даже без осознания взаимосвязи между ними и их последствиями. Однако когнитивные способности человека позволяют ему извлекать гораздо больше пользы из своего личного опыта, чем это доступно организмам, не обладающим разумом.

Ответные последствия выполняют несколько функций. Во-первых, они несут в себе информацию. Во-вторых, они служат мотивацией, если благоприятны для организма. В-третьих, — и это, по-видимому, самая противоречивая их функция — они осуществляют автоматическое подкрепление реакций. Для полного понимания научения, основанного на ответных последствиях, требуется подробнейшим образом рассмотреть все три перечисленные функции.

Информативная функция

В ходе научения люди не только определенным образом реагируют, они также замечают произведенный ими эффект. Наблюдая за различными результатами своих действий, они вырабатывают гипотезы о том, какие реакции в данном случае являются более уместными, а какие — менее. Усвоенная таким образом информация в дальнейшем служит руководством к действию. Правильные гипотезы дают шанс совершать правильные действия, тогда как ошибочные ведут к действиям неэффективным. Сведения, получаемые в процессе позна-

2 Зак. №713

ГЛАВА ВТОРАЯ

ния, таким образом, избирательно или подкрепляются, или не подкрепляются (Dylany & O'Connell, 1963).

Результаты изменяют поведение человека в основном благодаря вмешательству мышления. (Такое заявление, безусловно, противоречит механистическим воззрениям.) Подкрепляющие последствия служат своеобразным каналом передачи человеку информации о том, как следует поступить, чтобы получить желаемый результат и избежать неприятностей — правда, информации довольно-таки неотчетливой. Поскольку научение через ответные последствия по большей части является процессом когнитивным, в тех случаях, когда нет осознания того, что же конкретно подкрепляется, последствия вносят лишь незначительные изменения в общее поведение. Даже если определенные реакции и получают положительное подкрепление, фактически это мало что меняет, если люди, исходя из другой информации, сохраняют уверенность в том, что в последующем подобные действия вряд ли будут вознаграждаться (Estes, 1972).

Мотивационная функция

Антиципирующая способность позволяет человеку мотивировать свои действия, опираясь на их возможные последствия. Прошлый опыт формирует ожидания того, что определенные действия принесут ощутимые преимущества, другие не приведут к существенным результатам, а третьи будут отдалять будущие неприятности. Представляя в уме, какими могут быть последствия совершаемых ими действий, люди способны превращать их в мотивационные факторы своего поведения. Таким образом, можно сказать, что большая часть человеческих -действий находится под предварительным контролем. Так, домовладельцы вряд ли станут дожидаться момента, когда им по-настоящему придется пережить ужас пожара, они заранее запасаются страховым полисом; люди, отправляющиеся в дальние путешествия, как правило, не стремятся подвергать себя невзгодам, причиняемым

ИСТОКИ ПОВЕДЕНИЯ

тропическими ливнями или снежными буранами, а предупреждают эти события, подбирая для себя подходящую одежду; точно так же и водитель не ждет остановки двигателя, чтобы заправить свой автомобиль бензином.

Способность предвидеть отдаленные последствия и переносить их на текущее поведение помогает выработке предусмотрительного поведения. Это достигается путем обеспечения человека стимулами и подкрепляющими мотивами для осуществления определенных действий. Побуждения, предвосхищающие само действие, повышают вероятность проявления того вида поведения, которое снова и снова получает подкрепление, — вот почему побудительная функция последствий играет исключительно важную роль.

Подкрепляющая функция

При объяснении подкрепления, как правило, исходно предполагается, что последствия подкрепляют поведение автоматически, то есть без участия сознания. Однако такой подход часто представляется весьма спорным — например, при ознакомлении с результатами исследований по вербальному научению, в ходе которого проводился анализ: при каких условиях и с какой частотой произносятся слова, получающие подкрепление, и в каких случаях они игнорируются. Параллельно отслеживалось, в какой мере частота применения тех или иных слов зависит от того, осознают или нет участники эксперимента, произнесение каких именно слов вознаграждается. На протяжении всего сеанса через определенные промежутки времени Спилбергер и Де Нике (1966) оценивали степень осведомленности участников. Выяснилось, что до тех пор, пока участникам эксперимента ничего не известно об условиях подкрепления, последствия никоим образом не изменяют их поведение; однако, как только они начинают понимать, какие именно реакции вознаграждаются, их поведение резко меня-

ГЛАВА ВТОРАЯ

ется в нужную сторону. Чуть позже другие исследователи (Dulany, 1968), используя уже иные задания и подкрепления, пришли к аналогичному наблюдению: при отсутствии знаний о том, какое поведение получает подкрепление, оно подвергается лишь незначительному воздействию последствий. Однако и после проведения всех этих исследований многие вопросы остались открытыми.

Свои ранние исследования Постман и Сассенрат (1961) посвятили изучению временного соотношения между осознанием людьми происходящего, и изменениями их реакций. При проведении экспериментов обнаружилось следующее: когда участники эксперимента не осознают смысла происходящего, подкрепление приводит лишь к незначительному улучшению показателей; однако после того, как испытуемые приходят к правильному решению, они начинают демонстрировать весьма заметное закрепление соответствующих реакций. Ученые пришли к выводу, что, хотя научение может происходить и неосознанно, в таких случаях оно крайне замедленно и малоэффективно. Однако нарастающее число правильных реакций в конце концов помогает распознать, что обостряется; и как только это открытие делается, люди с готовностью демонстрируют соответствующее поведение — разумеется, при наличии значимых побуждений. Можно получить совершенно различные результаты относительно взаимосвязи между осознанием происходящего и изменениями поведения: все зависит от того, насколько адекватно осведомленность измеряется. Если это происходит после выполнения многочисленных попыток, то к этому моменту участники эксперимента способны уяснить, какая реакция является правильной, а какая — нет, лишь на основе многократного подкрепления, и при отсутствии осведомленности. Имеются свидетельства, со всей очевидностью подтверждающие правильность такого предположения. Когда степень распознавания подкрепляющих условий измеряется спустя длительное время от начала эксперимента, то кажется, что осознание происходящего предшествует изменению поведения; но если измерения проводят через короткие промежутки времени, создается впечатление, что люди

ИСТОКИ ПОВЕДЕНИЯ

начинают действовать нужным образом еще до того, как осознают суть происходящего, до того, как отчетливо распознают, какие реакции являются правильными (Kennedy, 1970, 1971). А что, если участники экспериментов еще до изменения своего поведения отчасти осознают суть происходящего, но никоим образом не выражают этого знания? Так ли это? На этот вопрос еще предстоит дать ответ.

Процедуры, используемые в подобных исследованиях, вполне уместны для наглядной демонстрации того, что осознанное восприятие происходящего способствует изменению поведения, но они совершенно непригодны при рассмотрении таких основополагающих моментов — как, например, решение вопроса: является ли осознание происходящего непременным условием процесса научения и изменения поведения. Так как реакции и их последствия наблюдаемы, при выяснении вопроса, насколько это делается осознанно, исследователям приходится полагаться лишь на слова участников эксперимента.

В тех же случаях, когда дается задание без возможностей узнать правильный ответ — поскольку взаимосвязь между действием и его последствием является ненаблюдаемой — безусловно, можно дать более уверенный ответ на вопрос: должно ли научение непременно происходить при участии сознания. Ведь осознание происходящего в принципе исключается, если наблюдаемой является лишь реакция, но не ее последствия, или, наоборот, когда подкрепление очевидно, а какая из реакций его вызвала — непонятно.

Хефферлайн и его коллеги (Hefferline, Bruno & Da-vidiwitz, 1970) путем подкрепления успешно модифицировали внешне ненаблюдаемые реакции. В проведенных ими экспериментах мышечные сокращения, визуально незаметные, выявленные с помощью электронного усилителя, получали либо положительное подкрепление — в виде денежного вознаграждения, либо заканчивались неприятной стимуляцией. При наличии подкрепления эти реакции усиливались, а после прекращения его воздействия ослабевали — причем никто из участников так

ГЛАВА ВТОРАЯ

и не смог выявить, какие из реакций вели к подкрепляющим последствиям, хотя каждый из них выдвигал собственную гипотезу.

Осознание происходящего в данном случае отнюдь не представляет собой альтернативу «все или ничего». Можно изменить поведение в нужную сторону и на основании ложной гипотезы, если она каким-то особым образом связана с правильным решением задачи. Если, к примеру, участники эксперимента по вербальному научению считают, что их комментарии о предметах домашнего обихода являются вознаграждаемыми реакциями — в то время как правильными на самом деле являются замечания о кухонной утвари — они вполне могут «сгенерировать» несколько правильных реакций. Аналогично, при исследованиях, в которых используются невербальные задания, некоторые наблюдаемые виды деятельности, которые сами по себе являются отнюдь не идеально подходящими, время от времени также могут активизировать ненаблюдаемые реакции, которые можно назвать оптимальными в данной ситуации. В таких случаях присутствует не полное осознание, а осознание с некоторой степенью точности, зависящей от того, насколько близка к правильному ответу выбранная гипотеза. Те незначительные изменения поведения, которые происходят без вмешательства сознания, отчасти можно отнести на счет выдвигаемых гипотез.

Данный вопрос вряд ли можно назвать решенным, так как имеющихся в наличии фактов явно недостаточно для доказательства того, что подкрепление автоматически формирует поведение. Даже в тех случаях, когда применяются какие-то сверхусовершенствованные методики и в ходе их устанавливается, что обучать элементарным реакциям можно без уточнения, какое именно поведение получает подкрепление, и тогда отсюда вовсе не следует, что таким образом можно научить поведению в целом. В качестве примера рассмотрим случай, когда участникам эксперимента выдают задание, в котором предполагается, что их поведение будет регулироваться определенными правилами. Допустим, что вниманию участников эксперимента предложены слова различной

ИСТОКИ ПОВЕДЕНИЯ

длины; задание заключается в том, чтобы правильно назвать число, соответствующее каждому слову. Давайте сформулируем произвольное правило, согласно которому «правильное число» получается в результате вычитания из 100 количества букв в слове, деления остатка на 2 и умножения полученного результата на 5. Для того чтобы получить правильный ответ с учетом этого сложного правила, требуется трехступенчатый расчет, то есть испытуемый должен выполнить несколько мыслительных операций, причем в строго определенной последовательности. Организм, лишенный способности мыслить, не в состоянии выполнить правильные действия, сколь долго бы его реакции не подкреплялись.

Можно привести не одно доказательство в пользу достоверности той точки зрения, согласно которой подкрепление выступает скорее в роли информативного и мотивирующего начала, нежели в роли механического «усилителя» реакций. Понятие «усиление реакций» в лучшем случае является метафорой. После того как реакция усваивается, вероятность того, что она будет использована в той или иной ситуации, может с легкостью варьироваться путем изменения воздействий, которые она производит, но сама по себе эта реакция уже не может усиливаться. К примеру, люди водят автомобили, поскольку это дает им определенные преимущества, но эти преимущества ничего не добавляют к реакциям, связанным с вождением. Сомнительное само по себе упоминание об автоматизме и усилении реакций приводит к тому, что говорить о регуляции поведения становится уместнее, нежели о подкреплении поведения своими последствиями. Но в этой книге мы в первую очередь будем говорить именно о подкреплении.

К счастью, последствия усиливают автоматически не каждую реакцию, их вызывающую. Если бы поведение подкреплялось любым произведенным им мгновенным эффектом, то люди оказались бы до такой степени перегружены взаимоисключающими тенденциями различных ответных реакций, что вскоре вообще бы потеряли способность действовать. Прикладное значение имеет лишь ограниченное научение на основе отдельных, до-

ГЛАВА ВТОРАЯ

вольно выдающихся событий. Для низших организмов, обладающих ограниченными символизирующими способностями формирования символов, эволюционные преимущества заключены в биологической структуризации, так что ответные последствия формируют длительные эффекты механически, без символической обработки собственного опыта.

Подкрепление представляет собой эффективное средство регуляции уже заученного поведения, но в то же время оно является относительно малоэффективным способом его формирования. Следует отметить, что люди редко усваивают новую форму поведения в естественных условиях, если у них нет возможности пронаблюдать подобное поведение у окружающих. К тому же, поскольку воздействие подкрепления обычно происходит одновременно с наблюдением многочисленных примеров различных видов поведения, которые можно использовать, бывает очень нелегко определить, какую же миссию выполняет подкрепление: формирует оно новое поведение или лишь активизирует то, что уже было усвоено посредством наблюдения.

НАУЧЕНИЕ ЧЕРЕЗ МОДЕЛИРОВАНИЕ

Научение было бы исключительно трудоемким — не говоря уже рискованным — процессом, если бы люди, получая информацию о том, что делать, полагались бы исключительно на результаты собственных действий. К счастью, в большинстве случаев человеческое поведение подлежит научению через моделирование. На основании наблюдений за окружающими у человека формируется представление о том, каким образом должно ре-ализовываться новое поведение, и в дальнейшем такая закодированная информация служит для него руководством к действию. Прежде чем осуществить на практике то или иное поведение, люди могут обучаться на при-

ИСТОКИ ПОВЕДЕНИЯ

мерах, хотя бы приблизительных, и благодаря этому они избегают многих ненужных ошибок.

Наши рекомендации