Привыкание и сенсибилизация
Это чрезвычайно примитивные виды научения, при которых у организма вырабатывается относительно устойчивая и постоянная реакция на повторные стимулы. Эти две зачаточные формы научения проявляются в изменении степени активации организма данным стимулом: в случае привыкания активация уменьшается, а в случае сенсибилизации увеличивается.
Как уже говорилось в главе 4, привыкание (габитуация) наступает, когда организм -в результате изменений на уровне рецепторов или ретикулярной формации - «научается» игнорировать какой-то повторный или постоянный раздражитель, «убедившись», что он не имеет особого значения для той деятельности, которая в данный момент осуществляется. В отличие от этого при утомлении снижается внимание ко всем действующим раздражителям.
Сенсибилизация -это процесс, противоположный привыканию. При сенсибилизации повторение стимула ведет к более сильной активации организма, и последний становится все более и более чувствительным к данному стимулу; в результате раздражитель, не вызывавший при однократном воздействии никакой реакции, повторяясь, начинает провоцировать то или иное поведение. Представим себе, например, что в комнате, где мы работаем, жужжит назойливая муха или же из плохо завернутого крана в раковину мерно падают капли воды. Эти раздражители становятся для нас постепенно все труднее переносимыми. Можно привести и другие примеры - царапину на музыкальной пластинке, вызывающую при каждом прослушивании треск, который мы уже заранее ожидаем, или слова-паразиты вроде «так сказать», «значит» и т. п. в лекциях некоторых преподавателей; иногда такие слова повторяются настолько часто, что могут полностью отвлекать внимание студентов от содержания лекции.
Импринтинг
У низших позвоночных животных к реактивным типам научения можно отнести также импринтинг. Об этом явлении мы уже говорили в первой главе и поэтому здесь на нем останавливаться не будем. Напомним только, что речь идет о наследственно запрограммированном и необратимом формировании привязанности новорожденного животного к первому движущемуся объекту, который попадает в поле его зрения в первые часы жизни.
Условные рефлексы
Условные рефлексы возникают в результате формирования связи между специфическим стимулом, вызывающим тот или иной врожденный рефлекс, и каким-либо индифферентным стимулом. В результате индифферентный раздражитель сам по себе начинает вызывать данный рефлекс.
У всех нас к моменту появления на свет уже имеется ряд врожденных рефлексов, таких как выделение слюны при попадании в рот пищи или моргание в ответ на громкий звук. К врожденным рефлексам относятся также отдергивание руки при воздействии болевого раздражителя или коленный рефлекс-разгибание ноги при ударе по коленному сухожилию. Для проявления таких рефлексов не нужно никакого предварительного опыта и никаких других условий, кроме специфического стимула. Иными словами, это безусловные рефлексы -они автоматически включаются в ответ на определенные раздражители, тоже называемые безусловными. Например, когда раздается громкий звонок, мы можем вздрогнуть, но слюноотделение у нас не начнется; электрический удар, полученный конечностью, заставит нас отдернуть эту конечность. но не моргнуть; и т. д.
Бывает, однако, что одновременно со специфическим раздражителем,
вызывающим какой-либо безусловный рефлекс, действует другой раздражитель, не имеющий с ним ничего общего. Если такая связь между двумя раздражителями достаточно ясна или часто повторяется, то индифферентный раздражитель сам по себе начинает вызывать тот же рефлекс.
Это явление было открыто русским физиологом И. П. Павловым в 1903 году. В ходе своих опытов Павлов обратил внимание на то, что звон миски, в которую накладывали пищу, вскоре начинал сам по себе вызывать у собаки слюноотделение. Таким образом, индифферентный звуковой стимул, если он просто сочетается во времени с безусловным пищевым раздражителем, может приобрести способность вызывать тот же рефлекс. В связи с этим Павлов назвал такие раздражители условными, а вызываемое ими рефлекторное слюноотделение – условным рефлексом (рис. 7.1).
Достаточно быстро было доказано, что при формировании таких рефлексов действительно происходит образование условной связи с безусловным раздражителем. Павлов показал, что достаточно было прекратить предъявление безусловного стимула, чтобы и условный сигнал быстро переставал действовать. Например, если после подачи звукового сигнала животному не выдавалась пища, то этот сигнал вскоре уже не вызывал слюноотделения. Далее мы еще вернемся к этому феномену угасания, характерному для большинства видов научения путем обусловливания.
С физиологической точки зрения обусловливание можно объяснить тем, что к уже существующей прямой связи между специфическим сенсорным сигналом и безусловным рефлексом как бы пристраивается новый сигнал. В результате этот новый сигнал приобретает возможность сам по себе вызывать тот же рефлекс.
Итак, мы уже знаем, что звонок, подаваемый одновременно с пищей, может в дальнейшем сам по себе вызывать слюноотделение. Точно так же можно добиться того, чтобы электрический удар, наносимый одновременно с сильным звуком, вызывал моргание или, наоборот, чтобы сильный звук в сочетании с ударом тока приводил к одергиванию конечности, и т. п.
По мнению Павлова, таким ассоциативным обусловливанием можно объяснить большинство приобретенных форм поведения. Такой же точки зрения придерживался и бихевиорист Уотсон, который через несколько лет после Павлова показал, как могли бы развиваться некоторые эмоциональные реакции, не включенные от рождения в естественный репертуар индивидуума (см. документ 7.1).
Научение в результате оперантного обусловливания
Как мы видели, реактивные формы поведения возникают в результате таких событий, при которых организм в основном пассивно
испытывает внешние воздействия на какие-то его врожденные структуры.
Между тем для животных организмов особенно характерна активность: в любое время организм должен взаимодействовать со средой, стремясь удовлетворять свои потребности или избегать опасных ситуаций. Поэтому обстоятельства, в которые попадает организм и к которым он вынужден приспосабливаться, выбирая те или иные действия, способствуют формированию многих новых форм поведения.
Бихевиористы назвали такие формы поведения оперантными (от лат. operatic - действие), поскольку в этом случае все начинается с действия, совершаемого над окружающей средой; оно вызывает какие-то последствия, от которых и зависит, будет ли организм повторять это действие или, наоборот, избегать его. Таким образом, выработка подобных форм поведения осуществляется в результате закрепления тех действий, последствия которых для организма желательны, и отказа от действий, приводящих к нежелательным последствиям.
К оперантному научению можно отнести три разновидности: научение методом проб и ошибок, путем формирования реакции и путем наблюдения.
Научение методом проб и ошибок
При научении методом проб и ошибок индивидуум, встретившись с каким-либо препятствием, совершает попытки преодолеть его и при этом, постепенно отказываясь от неэффективных действий, находит в конце концов решение задачи.
Такой тип научения был открыт Торндайком (Thorndike, 1890)-одним из первых ученых, заинтересовавшихся процессами научения (рис. 7.2). В своих опытах Торндайк использовал так называемые проблемные клетки, в которые он помещал голодных кошек (рис. 7.3). Некоторые клетки открывались в том случае, если животное тянуло за веревку, а в других нужно было приподнять запорный крючок. Торндайк подсчитывал, сколько попыток и сколько времени требовалось кошке
Рис. 7.2. Эдуард Торндайк, американский психолог (1874-1949). Он впервые стал изучать решение животными задач в лабораторных условиях. Работы Торндайка привели его к теории научения методом проб и ошибок и к закону эффекта, на котором основана эта теория.
Рис. 7.3. «Проблемная клетка», разработанная Торндайком в 1911 году. Кошка, помещенная в такую клетку, должна была методом проб и ошибок научиться нажимать на деревянную педаль, что благодаря системе блоков и веревок позволяло открывать дверцу.
для того, чтобы решить стоящую перед ней задачу -выйти из клетки и получить пищу, помещенную снаружи.
Наблюдая за животными, Торндайк заметил, что сначала их действия были чисто случайными, но в конце концов кошка «нечаянно»
Ошибки Ошибки Ошибки
8 12 16 20 24 8 12 16 20 24 8 12 16 20 24
Пробы ПробыПробы
Рис. 7.4. Кривые научения методом проб и ошибок. Сходные кривые получал Торндайк по данным своих опытов на кошках. Видно, что чем больше проб совершает животное, тем меньше становится число ошибок.
задевала веревку или крючок, освобождалась и получала вознаграждение. Однако по мере увеличения числа попыток действия животных все больше сосредоточивались вокруг «ключевого» участка клетки, и число ошибок, а также и время, проведенное в клетке, быстро сокращалось. Торндайк представил эти результаты в виде кривых (рис. 7.4) и вывел закономерности, позволяющие объяснить эффективность такого метода «проб и ошибок». Согласно важнейшей из этих закономерностей - закону эффекта,- в случае, если какое-то действие приводит к желательным результатам, вероятность его повторения возрастает, а если к нежелательным последствиям -снижается (см. документ 7.2).
Однако научение методом проб и ошибок само по себе не очень эффективно. Если бы новые формы поведения удавалось «изобрести» лишь случайным образом, было бы трудно объяснить быстрое приобретение новых навыков людьми и домашними животными. Без сомнения, вполне вероятно, что на протяжении миллионов лет именно такой процесс приводил к выработке различных навыков у наших предков. Но не менее очевидно, что по мере совершенствования этих навыков и упрочения власти человека над окружающей средой постепенно складывались новые способы формирования и передачи новых типов поведения.
Скиннер - признанный вождь американских бихевиористов в последние 30 лет -систематизировал теорию Торндайка, пытаясь объяснить, каким образом в структурированной среде формируется множество различных типов поведения. При этом Скиннер вскрыл принципы оперантного обусловливания и формирования реакций путем последовательных приближений.
Формирование реакций
С точки зрения Скиннера, поведение не всегда возникает чисто случайным образом -нередко оно формируется в результате отбора под действием подкрепляющего фактора. Таким фактором может быть любой стимул, появляющийся или исчезающий после той или иной поведенческой реакции и повышающий вероятность того, что эта реакция будет повторена с целью получить подкрепление. Это позволяет объяснить формирование очень сложных поведенческих реакций поэтапно, каждый этап при этом будет подкрепляться.
Исходя из этих соображений, Скиннер разработал способ формирования поведения путем последовательных приближений, составляющий основу оперантного обусловливания. Этот способ состоит в том, что весь путь от исходного поведения (еще до начала обучения) до конечной реакции, которую исследователь стремится выработать у животного, разбивается на несколько этапов. В дальнейшем остается лишь последовательно и систематически подкреплять каждый из этих этапов и таким образом подводить животное к нужной форме поведения. При таком способе обучения животное вознаграждают за каждое действие, приближающее его к конечной цели, и у него постепенно вырабатывается заданное поведение.
Рис. 7.5. Голубь в клетке Скиннера реагирует на световой сигнал, появляющийся перед ним на стенке при освещении пластмассового диска с другой стороны. В ответ на такой сигнал голубь ударяет по диску клювом, чтобы в кормушке появилось зерно.
Допустим, что нам нужно обучить голубя ударять клювом по маленькому светящемуся кружку, когда он захочет получить вознаграждение в виде зернышка (рис. 7.5). Вначале мы будем давать ему зернышко каждый раз, когда он зайдет в ту половину клетки, где находится светящийся кружок. Далее мы будем вознаграждать его лишь в том случае, если он не только зашел в эту половину клетки, но еще и повернулся головой к стенке, на которой находится кружок. На третьем этапе можно, например, давать зернышко при сочетании этих двух условий, если вдобавок еще клюв животного направлен в сторону кружка. Затем постепенно можно заставить голубя касаться клювом кружка и, наконец, ударять по нему с целью получить вознаграждение. Как мы видим, при таком методе обучения к очередному этапу переходят лишь тогда, когда уже сформировалась поведенческая реакция, необходимая на предыдущем этапе (рис. 7.6).
По мнению Скиннера и других бихевиористов, именно так происходит выработка большинства поведенческих реакций у человека. Действительно, можно привести множество примеров, как будто бы частично подтверждающих это.
С позиций Скиннера можно объяснить очень быстрое обучение ребенка первым словам (не распространяя, однако, эту концепцию на освоение языка в целом). Вначале, когда ребенок еще только начинает произносить какие-то членораздельные звуки, лепет «ме-ме-ме» уже вызывает восторг окружающих, и особенно счастливой мамы, которой уже кажется, что дитя зовет именно ее. Однако вскоре энтузиазм родителей по поводу таких звуков остывает до тех пор, пока младенец ко всеобщей радости не выговорит «мо... мо». Потом и эти звуки перестают для новорожденного подкрепляться, пока не появится сравнительно членораздельное «мо-мо». В свою очередь это слово по тем же причинам вскоре сменится сочетанием «мома», и наконец ребенок отчетливо выговорит свое первое слово-«мама». Все же остальные звуки будут восприниматься окружающими лишь как «детский лепет» в буквальном смысле слова, и они постепенно исчезнут из «лексикона» новорожденного.
Рис. 7.6. Крыса, помещенная в клетку Скиннера, должна при появлении определенного стимула нажать на рычаг, за что получает пищевое вознаграждение.
Таким образом, в результате избирательного поощрения со стороны членов семьи младенец отбрасывает те неправильные реакции, за которые он не получает социального подкрепления, и сохраняет лишь те, которые наиболее близки к ожидаемому результату.
Формирование реакции играет роль не только в воспитании ребенка, но также в отношениях между супругами и в различных аспектах социальной жизни. Каждый раз, когда индивидуум или социальный институт хочет добиться той или иной поведенческой реакции от партнера или от группы населения, он вполне может запланировать и реализовать такие подкрепляющие факторы, которые повышали бы вероятность желательного поведения. Однако ясно, что подобные методы часто находятся на грани манипулирования личностью и не всегда практикуются исключительно для ее блага.
Кроме того, как мы уже знаем из главы 6, сторонники когнитивного подхода к мотивации полагают, что внешняя мотивация, создаваемая подкреплением, чаще всего приводит к исчезновению внутренней мотивации, присутствующей на первых этапах во многих видах поведения у человека (см. документ 7.3).
Для того чтобы лучше разобраться в приведенных примерах, нам нужно теперь вернуться к некоторым аспектам подкрепления.