Бихевиоризм. Закономерности научения
Впервые закономерности научения, установленные эмпирическими методами, сформулированы в рамках бихевиористской парадигмы. Они были зафиксированы в истории психологии под названием «законы научения», но фактически являются эмпирическими обобщениями, а иногда и постулатами. Сформулированные преимущественно Э. Торндайком (E.L. Thorndyke), а затем модифицированные или дополненные К. Халлом (C.L. Hull), Э. Толманом (E.G. Tolman) и Э. Газри (E.R. Guthrie; в отечественной литературе встречаются и другие написания: Гатри, Гасри, Гетри) на основе большого эмпирического материала, полученного в опытах с участием человека и животных, они в неявной форме учитывали также и результаты исследований, проведенных в школе И.П. Павлова. Именно поэтому выделенные закономерности описывают факторы, важные для разных форм обучения, и, несмотря на непрекращающуюся критику, принимаются во внимание по сей день.
Следует обратить внимание на то, что все приведенные далее «законы научения», описывают феноменологию научения, а не собственно процессы формирования нового опыта, не обращаются к свойствам и строению формирующихся при научении структур. Эти особенности предписываются самими основами бихевиоризма: предмет изучения — внешне наблюдаемые характеристики поведения, которое понимается как «совокупность реакций, моторных или железистых, которую организм производит в ответ на воздействие той или иной ситуации» [Dre-ver, 1969, с. 28]; внутренние психологические структуры признаются либо несуществующими, либо недоступными для изучения. Эти ограничения не касаются «нервной сети» постольку, поскольку она рассматривается как среда проведения возбуждения, вызванного стимулом, обеспечивающая переключение направления распространения нервного процесса.
Представление о стимуле как о факторе, не только инициирующем акт поведения, но и порождающем новые акты — одна из важнейших черт всех парадигм, реализующих исследовательскую программу бихевиоризма. Все эти теории научения — инструктивные, они основаны на концепции tabula rasa. Эти черты ярко проявляются и в рассматриваемых далее «законах научения», в процедурах исследования, разработанных в рамках бихевиористских парадигм. Заметим, что результаты, получаемые при использовании некоторых методик, построенных на принципах инструктивиз-ма, могут быть интерпретированы и как «селективные». Так, методика оперант-ного обусловливания, широко используется также в небихевиористских парадигмах, рассматривающих процессы научения с позиций «селективизма».
Закон готовности (law of readiness). Удовлетворение при научении есть производное от функционирования единиц, обеспечивающих поведение (The satisfaction is derived from the functioning of behavioral «conduction units»), т. е. в случае если нервная сеть готова к проведению возбуж-
дения, то оно вызывает удовлетворение. Иная трактовка закона готовности, предлагаемая в различных отечественных и зарубежных руководствах, связывает успешность научения с «напряжением потребности»: чем выше уровень соответствующей потребности, тем быстрее и эффективнее протекает научение.
Закон эффекта (law of effect). В наиболее общей форме — события во внешнем мире (стимулы) являются основой селекции какого-либо конкретного поведения из множества возможных. Поведение, которое приводит к полезному событию (стимулу/подкреплению), будет повторяться, в то время как приводящее к «вредным» последствиям (стимулу/событию/наказанию) повторяться не будет.
Первоначально Торндайк выделял также «негативный закон эффекта» (negative law of effect), который описывал снижение вероятности реакций, приводящих к нежелательным последствиям.
Строгая форма закона эффекта (strong law of effect) гласит: подкрепление не только увеличивает частоту или вероятность реакции, но служит необходимым условием ее возникновения.
Торндайк использовал понятия «удовлетворительное положение дел» (satisfying state of affairs) и «неприятное положение дел» (annoying state of affairs), а не «подкрепление» и «наказание»; события он обозначал соответственно «satisfiers» и «annoyers» (см. [Kling, Riggs, 1971]).
Бихевиористы отметили параллели между этим законом и принципами естественного отбора. Подобно тому как из множества организмов выживают наиболее приспособленные, так и из множества возможных в данный момент вариантов поведения отбирается тот, который приведет к полезному событию. Наиболее полное развитие эта аналогия получила в работах Б.Ф. Скиннера [Skinner, 1984] (см. также подразд. «Процедуры», метод проб и ошибок).
Закон упражнения(law of exercise): при прочих равных условиях повторение определенного действия облегчает совершение поведения, приводит к более бы-
строму выполнению и снижению вероятности ошибок. Позже Торндайк экспериментально показал ограниченность действия закона упражнения: не при всяких условиях повторение способствует упрочению навыка, знания, опыта. Тем не менее при моторном научении и формировании навыков повторение — весьма важный фактор модификации поведения. Показано постоянное возрастание скорости выполнения серии стереотипных действий при их повторении даже в течение 10 лет (см. [Норман, 1985, с. 91]). Выполнение простейшей двигательной задачи может совершенствоваться на протяжении миллионов повторений: «Не существует такого акта у человека, чтобы он был слишком простым для усовершенствования» [Gottlieb et al., 1988].
Закон недавности (law of recency), принцип или эффект недавности: тенденция к лучшему заучиванию (лучшему воспроизведению) материала, который предъявлялся в конце серии. Особенно ярко эффект недавности проявляется при использовании материала, не представляющего интереса для испытуемого. Эта формулировка находится в противоречии с эффектом первичности (primacy effect, principle of primacy, law of primacy) — тенденцией к лучшему заучиванию материала, предъявляемого в начале сессии научения. «Эффект края (последовательности)» (serial position effect) снимает это противоречие, поскольку проявляется в лучшем заучивании начальных и конечных элементов предъявляемого ряда. U-образная зависимость степени заученности материала, отображающая этот эффект, называется «позиционная кривая» (см. [Сол-со, 1996, с. 152]).
Закон соответствия (matching law): существует пропорциональное отношение между вероятностью ответа и вероятностью подкрепления.
Принцип реагирования по аналогии(response-by-analogy principle): испытуемый в незнакомой ситуации будет вести себя так же, как в знакомой ситуации, сходной с настоящей.
Процедуры
Метод «проб и ошибок» (trial-and-error learning) Этот метод впервые описан Э. Торндай-ком в 1898 г. Феноменологически состоит в том, что в проблемной ситуации субъект для решения задачи применяет большой набор пробных действий, при этом происходит постепенное устранение неэффективных и закрепление действий, приводящих к достижению результата. Для изучения этой формы научения Торндайк разработал специальное устройство — «проблемный ящик» (problem box). Он полагал, что «слепые» пробы, ошибки и случайный успех, закрепляющий удачные пробы, составляют суть процесса научения у животных и человека. В настоящее время состав и порядок перебора пробных актов в ситуации научения методом проб и ошибок не считаются случайными. Субъект использует действия, сформированные в прошлом опыте, а также модифицированные, для решения новой для него задачи. Если альтернатив достаточно много и многие из них оказываются неадекватными поставленной задаче, поведение выглядит хаотическим. Согласно представлениям, развитым Б.Ф. Скиннером [Skinner, 1984], научение путем проб и ошибок аналогично естественному отбору (см. разд. 3.5.4 «Законы и принципы научения», закон эффекта). Действительно, с позиции селективной концепции научения, это не просто глубокая аналогия, а само существо процесса порождения нового поведенческого акта. Однако зона поиска решения проблемы появления нового акта у бихевиористов была ограничена объяснениями феномена проб и ошибок. По-видимому, именно ограничение предмета исследования поверхностными феноменами, характерное для бихевиоризма, не позволило реализовать эволюционную аналогию в полной версии: если в процессах эволюции происхождение разнообразия объясняется, в частности, мутагенезом, то остается неясным, какие именно факторы порожда-
ют разнообразие поведенческих актов, из которых происходит выбор?
Для того чтобы распространить представление о роли проб и ошибок в модификации внешне наблюдаемого поведения на скрытые, внутренние процессы, такие, как мышление, было введено представление о замещающих, «викарных», пробах и ошибках (vicarious trial and error— VTE). Предполагается, что этот феномен проявляется, например, в переборе возможных ходов при игре в шахматы.
Ограниченность представлений о научении, основанных на методе проб и ошибок, очевидна при рассмотрении таких феноменов, как инсайт, подражание, научение с одной попытки, научение, основанное на наблюдении.
Оперантное (инструментальное) обусловливание
Метод формирования условных связей, разработанный Б.Ф. Скиннером. В отличие от классической процедуры выработки условного рефлекса при оперантном обусловливании подкрепляется не предъявление условного стимула, а какое-либо действие субъекта. В случае классического условного рефлекса условный ответ воспроизводит безусловную реакцию; при выработке инструментального условного рефлекса субъект научается совершать определенные действия, которые приводят к получению подкрепления. Экспериментальная камера, применяемая для оперантного обусловливания (Skinner box), оборудована рычагом, педалью или каким-либо иным органом управления. Нажатие на рычаг приводит к получению подкрепления. Поисковая активность приводит к повышению частоты нажатия на рычаг. Исходную частоту совершения вознаграждаемого поведения называют оперантным уровнем. Поведение, которое актуализируется с высокой частотой, характеризуют как обладающее высоким оперантным уровнем, редко осуществляемое поведение — низким. В качестве оценки уровня обучения применяют частоту совершения вознаграждаемого поведения. Показано, что, применяя one-
рантное обусловливание, можно обучить животное совершать поведение, которое не было представлено в видовом или индивидуальном репертуаре. Такая процедура, называемая «шейпинг» (shaping), состоит в подкреплении форм поведения, составляющих последовательный ряд приближений (successive approximations) к желаемому поведению. Сторонники радикального бихевиоризма, последователи Скиннера, полагают, что оперантное обусловливание представляет собой нечто большее, чем лабораторный феномен, и лежит в основе высших форм научения человека и животных. Методика, разработанная Скиннером, обладает огромным эвристическим потенциалом. Круг феноменов, который выявлен при ее использовании, намного шире собственно «бихевиораль-ных». Она применяется при изучении поведения (включая социальные формы поведения) и его нейрональных основ настолько широко, что можно говорить о ее надпарадигмальном статусе.