Бихевиоризм. Закономерности научения

Впервые закономерности научения, ус­тановленные эмпирическими методами, сформулированы в рамках бихевиорист­ской парадигмы. Они были зафиксирова­ны в истории психологии под названием «законы научения», но фактически явля­ются эмпирическими обобщениями, а иногда и постулатами. Сформулирован­ные преимущественно Э. Торндайком (E.L. Thorndyke), а затем модифициро­ванные или дополненные К. Халлом (C.L. Hull), Э. Толманом (E.G. Tolman) и Э. Газри (E.R. Guthrie; в отечественной литературе встречаются и другие написа­ния: Гатри, Гасри, Гетри) на основе боль­шого эмпирического материала, полу­ченного в опытах с участием человека и животных, они в неявной форме учиты­вали также и результаты исследований, проведенных в школе И.П. Павлова. Именно поэтому выделенные законо­мерности описывают факторы, важные для разных форм обучения, и, несмотря на непрекращающуюся критику, прини­маются во внимание по сей день.

Следует обратить внимание на то, что все приведенные далее «законы науче­ния», описывают феноменологию науче­ния, а не собственно процессы формиро­вания нового опыта, не обращаются к свойствам и строению формирующихся при научении структур. Эти особенности предписываются самими основами бихе­виоризма: предмет изучения — внешне наблюдаемые характеристики поведения, которое понимается как «совокупность реакций, моторных или железистых, ко­торую организм производит в ответ на воздействие той или иной ситуации» [Dre-ver, 1969, с. 28]; внутренние психологичес­кие структуры признаются либо несуще­ствующими, либо недоступными для изу­чения. Эти ограничения не касаются «не­рвной сети» постольку, поскольку она рассматривается как среда проведения возбуждения, вызванного стимулом, обес­печивающая переключение направления распространения нервного процесса.

Представление о стимуле как о фак­торе, не только инициирующем акт по­ведения, но и порождающем новые акты — одна из важнейших черт всех па­радигм, реализующих исследовательс­кую программу бихевиоризма. Все эти теории научения — инструктивные, они основаны на концепции tabula rasa. Эти черты ярко проявляются и в рассматри­ваемых далее «законах научения», в про­цедурах исследования, разработанных в рамках бихевиористских парадигм. Заме­тим, что результаты, получаемые при использовании некоторых методик, по­строенных на принципах инструктивиз-ма, могут быть интерпретированы и как «селективные». Так, методика оперант-ного обусловливания, широко исполь­зуется также в небихевиористских пара­дигмах, рассматривающих процессы на­учения с позиций «селективизма».

Закон готовности (law of readiness). Удовлетворение при научении есть произ­водное от функционирования единиц, обеспечивающих поведение (The satisfac­tion is derived from the functioning of beha­vioral «conduction units»), т. е. в случае если нервная сеть готова к проведению возбуж-

дения, то оно вызывает удовлетворение. Иная трактовка закона готовности, пред­лагаемая в различных отечественных и зарубежных руководствах, связывает ус­пешность научения с «напряжением по­требности»: чем выше уровень соответ­ствующей потребности, тем быстрее и эф­фективнее протекает научение.

Закон эффекта (law of effect). В наибо­лее общей форме — события во внешнем мире (стимулы) являются основой селек­ции какого-либо конкретного поведения из множества возможных. Поведение, ко­торое приводит к полезному событию (стимулу/подкреплению), будет повто­ряться, в то время как приводящее к «вредным» последствиям (стимулу/собы­тию/наказанию) повторяться не будет.

Первоначально Торндайк выделял также «негативный закон эффекта» (ne­gative law of effect), который описывал снижение вероятности реакций, приво­дящих к нежелательным последствиям.

Строгая форма закона эффекта (strong law of effect) гласит: подкрепление не только увеличивает частоту или вероят­ность реакции, но служит необходимым условием ее возникновения.

Торндайк использовал понятия «удов­летворительное положение дел» (satisfy­ing state of affairs) и «неприятное поло­жение дел» (annoying state of affairs), а не «подкрепление» и «наказание»; события он обозначал соответственно «satisfiers» и «annoyers» (см. [Kling, Riggs, 1971]).

Бихевиористы отметили параллели между этим законом и принципами есте­ственного отбора. Подобно тому как из множества организмов выживают наибо­лее приспособленные, так и из множе­ства возможных в данный момент вари­антов поведения отбирается тот, кото­рый приведет к полезному событию. Наиболее полное развитие эта аналогия получила в работах Б.Ф. Скиннера [Skin­ner, 1984] (см. также подразд. «Процеду­ры», метод проб и ошибок).

Закон упражнения(law of exercise): при прочих равных условиях повторение оп­ределенного действия облегчает совер­шение поведения, приводит к более бы-

строму выполнению и снижению вероят­ности ошибок. Позже Торндайк экспери­ментально показал ограниченность дей­ствия закона упражнения: не при всяких условиях повторение способствует упро­чению навыка, знания, опыта. Тем не менее при моторном научении и форми­ровании навыков повторение — весьма важный фактор модификации поведения. Показано постоянное возрастание ско­рости выполнения серии стереотипных действий при их повторении даже в тече­ние 10 лет (см. [Норман, 1985, с. 91]). Вы­полнение простейшей двигательной зада­чи может совершенствоваться на протя­жении миллионов повторений: «Не суще­ствует такого акта у человека, чтобы он был слишком простым для усовершен­ствования» [Gottlieb et al., 1988].

Закон недавности (law of recency), принцип или эффект недавности: тен­денция к лучшему заучиванию (лучше­му воспроизведению) материала, кото­рый предъявлялся в конце серии. Осо­бенно ярко эффект недавности прояв­ляется при использовании материала, не представляющего интереса для испыту­емого. Эта формулировка находится в противоречии с эффектом первичности (primacy effect, principle of primacy, law of primacy) — тенденцией к лучшему за­учиванию материала, предъявляемого в начале сессии научения. «Эффект края (последовательности)» (serial position effect) снимает это противоречие, по­скольку проявляется в лучшем заучива­нии начальных и конечных элементов предъявляемого ряда. U-образная зави­симость степени заученности материа­ла, отображающая этот эффект, назы­вается «позиционная кривая» (см. [Сол-со, 1996, с. 152]).

Закон соответствия (matching law): существует пропорциональное отноше­ние между вероятностью ответа и веро­ятностью подкрепления.

Принцип реагирования по аналогии(response-by-analogy principle): испытуе­мый в незнакомой ситуации будет вести себя так же, как в знакомой ситуации, сходной с настоящей.

Процедуры

Метод «проб и ошибок» (trial-and-error learning) Этот метод впервые описан Э. Торндай-ком в 1898 г. Феноменологически состо­ит в том, что в проблемной ситуации субъект для решения задачи применяет большой набор пробных действий, при этом происходит постепенное устране­ние неэффективных и закрепление дей­ствий, приводящих к достижению резуль­тата. Для изучения этой формы науче­ния Торндайк разработал специальное устройство — «проблемный ящик» (prob­lem box). Он полагал, что «слепые» про­бы, ошибки и случайный успех, закреп­ляющий удачные пробы, составляют суть процесса научения у животных и челове­ка. В настоящее время состав и порядок перебора пробных актов в ситуации на­учения методом проб и ошибок не счи­таются случайными. Субъект использует действия, сформированные в прошлом опыте, а также модифицированные, для решения новой для него задачи. Если альтернатив достаточно много и многие из них оказываются неадекватными по­ставленной задаче, поведение выглядит хаотическим. Согласно представлениям, развитым Б.Ф. Скиннером [Skinner, 1984], научение путем проб и ошибок аналогично естественному отбору (см. разд. 3.5.4 «Законы и принципы науче­ния», закон эффекта). Действительно, с позиции селективной концепции науче­ния, это не просто глубокая аналогия, а само существо процесса порождения но­вого поведенческого акта. Однако зона поиска решения проблемы появления нового акта у бихевиористов была огра­ничена объяснениями феномена проб и ошибок. По-видимому, именно ограни­чение предмета исследования поверхно­стными феноменами, характерное для бихевиоризма, не позволило реализовать эволюционную аналогию в полной вер­сии: если в процессах эволюции проис­хождение разнообразия объясняется, в частности, мутагенезом, то остается не­ясным, какие именно факторы порожда-

ют разнообразие поведенческих актов, из которых происходит выбор?

Для того чтобы распространить пред­ставление о роли проб и ошибок в моди­фикации внешне наблюдаемого поведения на скрытые, внутренние процессы, такие, как мышление, было введено представле­ние о замещающих, «викарных», пробах и ошибках (vicarious trial and error— VTE). Предполагается, что этот феномен прояв­ляется, например, в переборе возможных ходов при игре в шахматы.

Ограниченность представлений о на­учении, основанных на методе проб и ошибок, очевидна при рассмотрении та­ких феноменов, как инсайт, подражание, научение с одной попытки, научение, ос­нованное на наблюдении.

Оперантное (инструментальное) обусловливание

Метод формирования условных связей, разработанный Б.Ф. Скиннером. В отли­чие от классической процедуры выработ­ки условного рефлекса при оперантном обусловливании подкрепляется не предъ­явление условного стимула, а какое-либо действие субъекта. В случае классическо­го условного рефлекса условный ответ воспроизводит безусловную реакцию; при выработке инструментального условного рефлекса субъект научается совершать определенные действия, которые приво­дят к получению подкрепления. Экспери­ментальная камера, применяемая для оперантного обусловливания (Skinner box), оборудована рычагом, педалью или каким-либо иным органом управления. Нажатие на рычаг приводит к получению подкрепления. Поисковая активность приводит к повышению частоты нажатия на рычаг. Исходную частоту совершения вознаграждаемого поведения называют оперантным уровнем. Поведение, кото­рое актуализируется с высокой частотой, характеризуют как обладающее высоким оперантным уровнем, редко осуществля­емое поведение — низким. В качестве оценки уровня обучения применяют ча­стоту совершения вознаграждаемого по­ведения. Показано, что, применяя one-

рантное обусловливание, можно обучить животное совершать поведение, которое не было представлено в видовом или ин­дивидуальном репертуаре. Такая процеду­ра, называемая «шейпинг» (shaping), со­стоит в подкреплении форм поведения, со­ставляющих последовательный ряд при­ближений (successive approximations) к же­лаемому поведению. Сторонники ради­кального бихевиоризма, последователи Скиннера, полагают, что оперантное обу­словливание представляет собой нечто большее, чем лабораторный феномен, и лежит в основе высших форм научения че­ловека и животных. Методика, разработан­ная Скиннером, обладает огромным эври­стическим потенциалом. Круг феноменов, который выявлен при ее использовании, намного шире собственно «бихевиораль-ных». Она применяется при изучении по­ведения (включая социальные формы по­ведения) и его нейрональных основ на­столько широко, что можно говорить о ее надпарадигмальном статусе.

Наши рекомендации