Теория оперантного обусловливания Берреса Фредерика Скиннера
Будучи ортодоксальным бихевиористом, Б.Ф. Скиннер отрицал все представления о том, что люди самодеятельны и их поведение определено предполагаемым существованием внутренних факторов. Отдавая должное глубине теоретических положений психоанализа, автор утверждал, что используемая терминология не позволяет давать рабочие определения и осуществлять эмпирическую проверку гипотез. Он считал необходимым тщательнее изучать условия среды, в которых формируется личность. Эти условия Б.Ф. Скиннер рассматривал как ключевой фактор, управляющий поведением человека.
В теории Б.Ф. Скиннера отсутствуют попытки изучения внутренних процессов и состояний личности. Автор утверждал, что человеческий организм – это "черный ящик", чье содержимое (мотивы, влечения, конфликты, эмоции и так далее) следует исключить из сферы эмпирического исследования [27]. Следовательно, адекватные толкования можно сделать не обращаясь к каким-либо иным объяснениям, кроме тех, что отвечают за функциональные отношения между различными стимулами и наблюдаемыми поведенческими реакциями.
В отличие от представителей классической теории обусловливания (И.П. Павлов, Дж. Б. Уотсон), Б.Ф. Скиннер не делал акцента на важности нейрофизиологических факторов, отвечающих за поведение человека. Скиннер допускал, что поведение можно достоверно определить, предсказать и проконтролировать условиями окружения.
Признавая необходимость и значимость экспериментального исследования, Скиннер придерживался мнения о том, что определение влияния контролируемых переменных на обусловленный компонент поведения отдельного организма в контролируемом окружении важнее, нежели делать выводы о поведении несуществующего усредненного индивида.
Прерогативой подхода Б.Ф. Скиннера являлся функциональный анализ поведения организма: установление точных, реальных и обусловленных взаимоотношений между открытым поведением (реакцией) организма и условиями окружающей среды (стимулами), контролирующими их.Эти переменные должны существовать независимо от нас, быть очевидными и определяемыми количественно. Причинно-следственные отношения, проистекающие из функционального анализа, становятся всеобщим законом науки о поведении. Практической целью является возможность манипулирования переменными окружающей среды (независимыми), которые позволяют делать прогноз, и затем измерение поведенческой реакции (зависимые переменные) [27].
Структура.Формулируя идеи об устройстве личности Б.Ф. Скиннер опирался на классический бихевиоральный подход, изложенный в условно-рефлекторной терии И.П. Павлова и теории Дж.Б. Уотсона. Оба автора подчеркивали значение условных стимулов для формирования реакции организма и исключали значение промежуточных переменных (рис. 4).
Стимул |
Реакция |
Рис. 7. Условно-рефлекторная модель поведения
Обусловливание поведения стимулами внешней среды, предшествующими этому поведению называется классическим или респондентным обусловливанием.Респондентное поведение обычно влечет за собой рефлексы, включающие автономную нервную систему. Однако респондентному поведению можно и научить.
Классическими в этом плане являются эксперименты И.П. Павлова, который, сочетая индифферентный стимул (звук) со значимым стимулом (пища), вызывающим безусловный рефлекс (слюноотделение), добился формирования реакции слюноотделения на первоначально индифирентный стимул. Новая реакция (слюноотделение на звук) получила название условный рефлекс.
В более поздних трудах И.П. Павлов отмечал, что при угасании условного рефлекса подкрепление (пища) значимо для сохранения респондентного научения.
Теория инструментального, или оперантного, обусловливания Б.Ф. Скиннера осталась в рамках прежней парадигмы «стимул–реакция (поведение)», однако подчеркнула значение событий, следующих за поведением (носящих также характер стимулов). Эти стимулы имели позитивный или негативный характер и играли роль в закреплении поведения или отказе от его повторения. В этой теории стимул приобрел функциональные качества подкрепления,повышающего силу реакции [27]. Таким образом формула прежняя формула поведения была расширена (рис.5).
Стимул |
Реакция |
Последствия |
Рис. 8. Оперантная модель поведения
Обусловливание поведения стимулами внешней среды, следующими за этим поведением называется оперантным обусловливанием.
Б.Ф. Скиннер полагал, что в целом поведение животных и человека нельзя объяснять в терминах классического обусловливания. В основном на поведение воздействуют стимульные события, которые наступят после него, а именно – его последствия. Природа этого последствия изменяет тенденцию организма повторять данное поведение в будущем. Если последствия благоприятны для организма, тогда вероятность повторения операнта в будущем усиливается. Сила позитивного подкрепляющего стимула определяется в соответствии с его воздействием на последующую частоту реакций, которые непосредственно предшествовали ему. В случае неблагоприятных последствий вероятность получить оперант уменьшается. Следовательно, негативные, или аверсивные последствия ослабляют поведение, порождающее их, и усиливают поведение, устраняющее их, через что и происходит научение. Суть оперантного научения состоит в том, что подкрепленное поведение стремится повториться, а поведение неподкрепленное или наказуемое имеет тенденцию не повторяться или подавляться.
Скорость, с которой оперантное поведение приобретается и сохраняется, зависит от режима применяемого подкрепления. Режим подкрепления – правило, устанавливающее вероятность, с которой подкрепление будет происходить. Самым простым правилом является предъявление подкрепления каждый раз, когда субъект дает желаемую реакцию. Это называется режимом непрерывного подкрепления и обычно используется на начальном этапе любого оперантного научения, когда организм учится производить правильную реакцию. В большинстве случаев социальное поведение человека подкрепляется только иногда.
. Режим прерывистого подкрепления можно классифицировать в соответствии с двумя основными параметрами:
1) подкрепление может иметь место только после того, как истек определенный временной интервал с момента предыдущего подкрепления;
2) подкрепление может иметь место только после того, как с момента подкрепления было получено определенное или случайное количество реакций. В соответствии с этими двумя параметрами выделяют четыре основных режима подкрепления:
–режим подкрепления с постоянным соотношением–организм подкрепляется по наличию заранее определенного числа соответствующих реакций (например, выплата заработной платы за количество произведенных действий);
– режим подкрепления с постоянным интервалом – организм подкрепляется после того, как установленный временной интервал проходит с момента предыдущего подкрепления (например, выплата денег за определенный период работы);
– режим подкрепления с вариативным соотношением – организм подкрепляется на основе какого-то в среднем предопределенного числа реакций (например, игра в рулетку).
– режим подкрепления с вариативным интервалом (ВИ) – организм получает подкрепление после того, как проходит неопределенный временной интервал (например, неожиданные контрольные работы для студентов) [27].
Различают два типа подкрепления – первичное и вторичное. Первичное подкрепление – это любое событие или объект, сами по себе обладающие подкрепляющими свойствами (пища, вода, физический комфорт, секс). Вторичное, или условное подкрепление – это любое событие или объект, которые приобретают свойство осуществлять подкрепление посредством тесной ассоциации с первичным подкреплением, обусловленным прошлым опытом организма (деньги, внимание, статус, отношения, оценки). Характерным для условного подкрепления является то, что оно генерализуется, если объединяется с более чем одним первичным подкреплением. Существуют социальные подкрепляющие стимулы (определенное поведение других людей), действующие неявно, но влиятельно относительно подкрепления поведения в разнообразных ситуациях.
Согласно точке зрения Б.Ф. Скиннера, условные подкрепляющие стимулы очень важны в контроле поведения человека, и вероятно, каждый человек проходит уникальную науку научения. Подкрепление и наказание, будучи стимулами, регулирующими поведение, могут носить позитивный и негативный характер (табл. 8). Для закрепления реакции демонстрируемой реакции используются оба типа подкрепления, для отказа от демонстрируемого поведения – оба типа наказания.