Радикальный бихевиоризм (Б. Ф. Скиннер)
Б. Ф. Скиннер. Большое влияние на его научные интересы оказали работы основателя теории бихевиоризма Уотсона и труды И.П. Павлова по формированию и изучению условных рефлексов.
Скиннер утверждал, что переход от внутренних объяснений таких как черты, к внешним объяснениям таким как подкрепление и стимулы, был шагом вперед в науке. Внешние переменные удобны для науки, так как их можно обработать таким образом, что их статус как причин поведения оказывается неоспорим. Человек никогда сам реально не управляет своим поведением, оно всегда детерминировано внешней средой.
Бихевиоризм Скиннера называют – радикальный бихевиоризм, так какимеет сугубо внешний характер. В то время как другие бихевиористы учитывают и внутренние причины поведения – такие как драйвы (Доллард и Миллер), и когнитивные факторы (Мишель и Бандура).
Одной из центральных идей Скиннера являлось стремление понять причины поведения и научиться им управлять. В этом плане он полностью разделял разработанные Уотсоном и Торндайком взгляды на социогенетическую природу психического развития, т.е. исходил из того, что развитие есть научение, которое обусловливается внешними стимулами. Однако от констатации Скиннер перешел к разработке методов целенаправленного обучения и управления поведением, а потому в психологию он вошел в первую очередь как теоретик обучения, разработчик различных программ обучения и коррекции поведения.
На основе представления о том, что не только умения, но и знания представляют собой вариации поведения, Скиннер разработал его особый вид – оперантное поведение. В принципе он исходил из того, что психика человека основана на рефлексах разного рода и разной степени сложности. Однако, сравнивая свой подход к формированию рефлексов с подходом Павлова, он подчеркивал существенные различия между ними. Условный рефлекс, формируемый в экспериментах Павлова, он называл стимульным поведением, так как его формирование связано с ассоциацией между разными стимулами и не зависит от собственной активности субъекта. Так, собаке по звонку всегда дается мясо, независимо от того, что она в этот момент делает. Таким образом, возникает ассоциация между мясом и звонком, в ответ на который наблюдается слюноотделение. Однако, подчеркивал Скиннер, такая реакция быстро формируется, но и быстро исчезает без подкрепления, она не может быть основой постоянного поведения субъекта.
В противовес этому подходу при оперантном обучении подкрепляется не стимул, но поведение, операции, которые совершает субъект в данный момент и которые приводят к нужному результату. Большое значение имеет и тот факт, что сложная реакция при этом разбивается на ряд простых, следующих друг за другом и приводящих к нужной цели.
Скиннер обратил внимание на то, что даже одноразовое подкрепление может иметь значительный эффект, так как при этом устанавливается, пусть и случайная, связь между реакцией и появлением стимула. Если стимул был значимым для индивида, он будет пытаться повторить реакцию, которая принесла ему успех. Такое поведение Скиннер называл «суеверным», указывая на его значительную распространенность.
Не меньшее значение" имеет и тот факт, что обучение при оперантном обусловливании идет быстрее и проще. Это связано с тем, что экспериментатор имеет возможность наблюдать не только за конечным результатом (продуктом), но И за процессом выполнения действия (ведь оно разложено на составляющие, реализуемые в заданной последовательности). Фактически происходит экстериоризация (переход во внешний план) не только исполнения, но и ориентировки и контроля за действием. Ведь, подкрепляя правильное действие нужным стимулом, учитель демонстрирует ребенку, на какие элементы ситуации ему надо обращать внимание, а также что и в каком порядке с ними делать, т.е. детям дается схема ориентировки и схема действия, причем учитель имеет возможность наблюдать процесс усвоения этих схем.
В последующие годы Скиннер обратился к проблеме социализации человека, он разрабатывал вопросы возможности обучения «нормативному поведению». Изложению позиции ученого по этим вопросам посвящены книги «По ту сторону свободы и достоинства» (1971), «Размышления о бихевиоризме и обществе» (1978). Однако разработанный Скиннером подход к программированию поведения и так называемые жетонные программы, которые были разработаны с целью коррекции отклоняющегося поведения (у малолетних преступников, психически больных людей), подверглись обоснованной критике. Прежде всего указывалось на недопустимость тотального контроля за поведением, без которого невозможно применение этих программ, так как речь идет о постоянном положительном подкреплении желательного поведения и отрицательном подкреплении (или игнорировании) нежелательного. Кроме того, возникал вопрос и о награде за определенное количество набранных жетонов и особенно о наказании за их недостаточное количество. Проблема заключалась в том, что такое наказание должно быть достаточно эффективным, т.е. значимым для ребенка, но в то же время при этом не должны нарушаться основные права детей и не должна возникать фрустрация их основных потребностей.
Но несмотря на эти недостатки, подход Скиннера дал реальную возможность корректировать и направлять процесс обучения, формирования новых форм проведения. Он оказал огромное влияние на психологию, и в современной американской науке Скиннер является одним из наиболее влиятельных авторитетов, он превзошел по количеству цитирования и числу сторонников даже Фрейда. При этом наибольшее влияние его теория оперантного поведения оказала на практику, дав возможность пересмотреть процесс научения и разработать новые подходы и новые программы обучения.
Принципы адаптивного поведения.Теория Скиннера фокусировала внимание на ситуационных факторах, которые определяют поведение. Он отмечал, что способность человека адаптироваться к среде (ситуации) может быть самой выдающейся видовой особенностью человека. При этом оперантное поведение предполагает обоюдную реактивность человека и среды. Поведение индивида приводит к вытекающему из этого изменению среды; в свою очередь изменяется поведение индивида. Исходя из многочисленных наблюдений, Скиннер сформулировал принципы этого адаптивного поведения.
В общем и целом существует два способа повысить частоту реакции:
- позитивное подкрепление (или просто подкрепление)
- негативное подкрепление.
Есть два пути понизить частоту реакции: наказание и угасание.
Говоря проще, человек адаптируется, чаще делая то, что повышает благоприятные результаты (позитивное подкрепление) или снижает неблагоприятные результаты (негативное подкрепление). И человек делает реже то, что приносит неблагоприятные результаты (наказание) или не позволяет добиваться благоприятных результатов (угасание).
Формирование поведения. Одно дело, когда требуется повысить или понизить частоту уже существующей реакции, а как же Скиннер предлагает формировать новое поведение. Его метод названный формированием поведения предполагает подкрепление удачных приближений желаемой реакции. Сначала возникает реакция отдаленно напоминает конечную реакцию, желаемую. Эта реакция подкрепляется, и тем повышается ее частота. Так, методом успешных приближений можно сделать более частой реакцию с исходным нулевым уровнем.
Сцепление. Сложные последовательные действия можно установить, используя оперантное обусловливание. Т.е. Скиннер описывает цепочку, которая выстраивается, когда одна реакция организма порождает или изменяет некоторые факторы, контролирующие другую реакцию. Например успешная учеба может начаться с похода в библиотеку. Эта реакция изменяет среду, которая делает наиболее вероятной следующую реакцию – открывание книги, затем вид открытой книги стимулирует ее чтение и т.д.
Различающее научение – научение дифференцированному реагированию в зависимости от окружающих стимулов.
Генерализация– реагирование на стимулы, которых не было в течение обучения, при том, что в ходе прошедшего обучения они были бы различительными стимулами
Режимы подкрепления
Адаптируясь к среде, организм тонко модифицирует свое поведение в ответ на частоту и продолжительность подкреплений. Термином режим подкрепления обозначается специфическая сопряженность между реакцией и подкреплением.
Постоянное подкрепление -реакции, которые всегда порождают подкрепление(ПП — CR). Это происходит, если студент получает балы всякий раз, когда предоставляет письменный ответ на вопросы семинара. Режим постоянного подкрепления порождает быстрое научение, потому что подкрепление непосредственно сопровождает реакцию. Хотя при постоянном подкреплении научение идет быстро, но и угасание — стремительно. Стратегии, которые всегда срабатывали в прошлом, быстро отбрасываются, стоит им провалиться.