Заучивание последовательностей стимулов

Интерес к этой форме когнитивной деятельности животных возник в связи с обучением обезьян языкам-посредникам, при котором выяснилось, что шимпанзе могут составлять «фра­зы» из нескольких «слов» - жестов и понимать смысл обращен­ных к ним «высказываний». Г. Террес (Terrace et al, 1977), один из авторов этих ранних работ, проанализировал структуру таких фраз и высказал гипотезу, что в основе подобного поведе­ния лежит не истинное понимание правильного порядка слов в английском предложении, а более простая и, вероятно, более универсальная для животных способность запоминать длин­ные ряды («списки») стимулов.

Процесс запоминания цепей стимулов путем их разделения на подгруппы называется «делением на куски» («chunking»). Террес подробно исследовал этот процесс на голубях и пока­зал, что в основе такого запоминания лежит не фиксация неко­ей последовательности стимулов и ответов, как это предпола­галось бы с позиций бихевиоризма и теории условных рефлек­сов (цепи УР). Эксперименты показали, что здесь происходит формирование иерархически организованных внутренних пред­ставлений о структуре такой последовательности, т. е. прояв­ляется способность мысленно проанализировать ряд стимулов и запомнить их, разбивая такой ряд на отрезки, подобно тому, как человек запоминает номера телефонов группами по 3 циф­ры (Terrace, 1991; Terrace, Chien, 1991a, b).

Исследования Терреса позволяют понять, каким образом животные обрабатывают информацию о совокупностях, или цепях, вос­принимаемых стимулов, чтобы выполнить в ответ серию действий.

Предполагают, что внутренняя организация таких представ­лений осуществляется сходным образом у животных разного уровня организации. У голубей подобное обучение протекает так же, как у высших приматов, однако скорость обучения у них гораздо ниже, а последовательности, которые они в состоянии запомнить, менее сложные (D'Amato, Colombo, 1988).

Инсайт – обучение

Термин «инсайт-обучение» (Thorpe, 1963) был введен в 60-е годы для описания ряда случаев сложных форм обучения, а также проявлений мышления, которые явно нельзя было от­нести ни к одной из упомянутых выше простых категорий. Его использовали в случаях, когда решение задачи происходило слишком быстро для обычного обучения методом «проб и оши­бок». К инсайт-обучению относили описанное В. Кёлером (1925; 1997) поведение шимпанзе, соединившего две палки, чтобы до­стать недоступное лакомство, а также опыты Я. Майера (Maier, 1929), в которых, как выражался автор, можно было тестиро­вать способность крыс «к рассуждению». Однако согласно со­временным представлениям эти формы поведения относятся к проявлениям мышления, и они будут рассмотрены в следу­ющих главах. В настоящее время термин «инсайт-обучение» употребляется все реже, уступая место конкретным определе­ниям тех или иных форм обучения или рассудочной деятель­ности. Так, в 4-м и 5-м изданиях одного из самых известных учебников по поведению животных (Manning, Dawkins. An In­troduction in Animal Behavior, 1992; 1998) появился раздел «Могут ли животные думать и осмысливать, планировать свои действия?». В нем авторы приводят ряд примеров разумных действий животных в природе (которые ранее они классифи­цировали как инсайт-обучение), а также описывают некото­рые эксперименты, уделяя особое внимание необходимости строгого анализа и возможности использования «канона Ллой­да-Моргана» (см. 2.3) при трактовке подобных данных. <...>

К. Прайор

НЕ РЫЧИТЕ НА СОБАКУ!

О ДРЕССИРОВКЕ ЖИВОТНЫХ И ЛЮДЕЙ[25]

Эта книга о том, как обучать кого угодно: человека или жи­вотное, старого или молодого, самого себя или других — и чему угодно. Как добиться, чтобы кот спрыгнул с кухонного стола, а бабушка перестала ворчать; как управлять поведением до­машних животных, детей, начальства и друзей; как улучшить свои достижения в теннисе, гольфе, математике, развить па­мять? Всего этого можно достичь, используя принципы, обу­чения с подкреплением. Эти принципы являются такими же непреложными законами природы, как законы физики. Они лежат в основе всех ситуаций обучения, точно так же как па­дение яблока основано на законах гравитации. При попытке изменить чье-либо поведение, будь то собственное «ли чужое, мы используем эти законы, независимо от того, знаем мы их или нет. Чаще всего мы их применяем неправильно. Мы запу­гиваем, спорим, принуждаем, лишаем чего-либо. Мы ругаем окружающих, когда дела идут плохо, и забываем похвалить, когда все хорошо. Мы грубы и нетерпеливы с детьми, друг с другом, даже сами с собой, и потом сожалеем об этой грубос­ти. Зная лучшие способы управления поведением, мы достиг­ли бы своей цели быстрее, к тому же без нервотрепки, но мы не представляем, как это сделать. Мы попросту не можем при­вести в соответствие те приемы, которыми современные дрес­сировщики достигают успеха, с законами положительного под­крепления. Какой бы ни была наша задача — заставить ли че­тырехлетнего малыша вести себя тихо при посторонних, отучить ли щенка грызть дома все что попало, тренировать ли спортив­ную команду, выучить ли стихотворение — она решается быс­трее, легче, веселее, если вы знаете, как пользоваться поло­жительным подкреплением. Законы подкрепления просты: их можно за десять минут записать на школьной доске и за час выучить. Применение их в основном зависит от ситуации, обу­чение с подкреплением подобно игре, в которой надо быстро соображать.

Обучение с подкреплением — это вовсе не система наград и наказаний; современные тренеры даже не используют этих терминов. Награды и наказания приходят обычно после того, как действие совершено, часто спустя длительное время, как, например, в уголовном суде. Они могут повлиять, а могут и не повлиять на будущее поведение, но они, безусловно, не могут воздействовать на уже совершенное действие. Подкрепление — будь то «положительное», то, к чему надо стремиться, напри­мер улыбка или ласка, или «отрицательное» — то, чего надо избегать, подобно рывку поводка или нахмуренным бровям, — происходит именно во время поведения, на которое надо воз­действовать. Подкрепление изменяет поведение только тогда, когда дается в правильно выбранный момент.

Впервые я услышала об обучении с положительным под­креплением на Гавайях, куда в 1963 году я была приглашена старшим тренером дельфинария «Жизнь моря». Раньше rfдрес­сировала собак и лошадей, пользуясь традиционными метода­ми, но дельфины — другое дело; на животное, которое просто уплывает от тебя, не воздействуешь поводком, уздечкой или даже кулаком. Положительное подкрепление — в основном вед­ро с рыбой — единственное, чем мы располагаем. Психологи в общих чертах познакомили меня с принципами обучения с под­креплением. Искусство применения этих принципов я по­стигла при работе с дельфинами.

То, чему я обучилась, работая с дельфинами, я стала при­менять и в дрессировке других животных. И я начала замечать, как эта система входит в мою повседневную жизнь. Например, я перестала кричать на своих детей, потому что заметила, что крик не помогает. Подмечать поведение, которое мне нужно, и сразу подкреплять его — это гораздо более действенно, да к тому же еще и сохраняет мирные отношения в семье.

Тот опыт, который я извлекла из дрессировки дельфинов, имеет солидное теоретическое обоснование. В этой книге я по­старалась держаться подальше от теоретизирования, так как, на­сколько мне известно, правила по применению этих теорий обыч­но не описываются наукой и, с моей точки зрения, ученые часто неправильно ими пользуются. Но основные законы уже твердо установлены и должны приниматься во внимание при обучении.

Основа этой теории по разным источникам известна как мо­дификация поведения, теория подкрепления, оперантное обусловливание, бихевиоризм, психология поведения и т. д.; это тот раздел психологии, который принес мировую известность Б. С. Скиннеру, профессору Гарвардского университета.

Я не знаю другой современной области науки, которую бы в такой степени поносили, не понимали, переиначивали, не­правильно истолковывали и неверно использовали. Одно толь­ко имя Скиннера приводит в ярость тех, кто является поборни­ком «свободной воли» в качестве характеристики, отделяющей человека от животного. Для тех, кто воспитан в гуманистичес­ких традициях, воздействие на поведение человека при помо­щи своего рода осознанной техники кажется непоправимо без­нравственным, несмотря на тот очевидный факт, что все мы пытаемся влиять на поведение друг друга любыми попавши­мися под руку средствами.

Пока гуманисты нападали на бихевиоризм и самого Скин­нера с таким же жаром, с каким когда-то правоверные обру­шивались на еретиков, бихевиоризм превратился в громадный раздал психологии, которым занимаются целые факультеты в университетах, он широко применяется в клинике, бихевиористы издают специальные журналы и созывают международные конгрессы, бихевиоризму обучают на специальных курсах, в нем возникает ряд доктрин и разных течений, ему посвящают­ся целые горы литературы. Это принесло определенную пользу обществу. Некоторые болезни — например, аутизм — оказа­лись более чувствительны к формированию и подкреплению, чем к любым другим воздействиям. Многие врачи успешно раз­решали эмоциональные проблемы своих пациентов, используя приемы бихевиоризма. Большая эффективность простого из­менения поведения по сравнению со скрупулезным копанием в источниках его происхождения — по крайней мере, в некото­рых обстоятельствах, способствовала возникновению семей­ной терапии, в которой рассматривается поведение, каждого члена семьи, а не только того, чье страдание наиболее очевид­но. Обучающие машины и программированные учебники, раз­работанные на основе Скиннеровской теории, были первыми попытками разбить обучение на этапы и поощрять обучающе­гося за правильные ответы. Эти ранние механизмы были не­уклюжими, но именно они были предвестниками компьютер­ного обучения, которое оказалось не только высокоэффектив­ным, благодаря совершенству выбора времени подкрепления компьютером, но и внесло в процесс обучения веселые нотки в связи с забавным характером подкрепления (фейерверки, танцующие роботы). Программы подкрепления, использую­щие жетоны и талоны, которые можно накопить и обменять на конфеты, сигареты или какие-то льготы, были установлены в психиатрических лечебницах и некоторых других учреждени­ях. Нет недостатка в программах аутотренинга, позволяющих следить за весом и изменением других привычек в нужную сторону, и все они основаны на положительном подкреплении. Шопенгауэр сказал однажды, что каждая оригинальная идея сначала осмеивается, потом на нее яростно нападают, и наконец, она принимается как нечто само собой разумеющее­ся. Насколько мне известно, теория подкрепления не является исключением. Несколько лет назад Скиннера повсюду высме­ивали за то, что он продемонстрировал формирование навы­ка, обучив пару голубей играть в пинг-понг...

В теории подкрепления, по-видимому, существует естествен­ный порядок, и в книге главы идут в той последовательности, в которой происходят процессы тренировки, от простого к слож­ному, как при реальном обучении, и это та самая последова­тельность, при которой наиболее легко овладеть профессией тренера. Книга построена таким образом, чтобы постепенно складывалось разумное понимание процесса тренировки при помощи позитивного подкрепления. Однако так как эта тео­рия широко применяется на практике, то в пяти главах книги в качестве примеров приводятся различные жизненные ситу­ации, в которых позитивное подкрепление играет положитель­ную роль.

Наши рекомендации