Принцип вторичного подкрепления
Отличимые друг от друга стимулы, вызывающие одну реакцию, могут послужить вторичным подкреплением для последующей реакции. Как я говорил, цепочка начинается с обусловливания последней реакции и развивается, звено за звеном, в обратном направлении.
Один из важнейших принципов называется «вторичным негативным подкреплением». Мы видели, что негативное подкрепление в определенном смысле заключается в наказании. Вот пример вторичного негативного подкрепления. Охотник приводит натасканную на кроликов гончую в изолированный участок леса, не зная, что там бродит медведь. У собаки на холке шерсть поднимается дыбом — такую реакцию проявляет большинство гончих, впервые учуяв запах медведя. Тут медведь выскакивает из укрытия, бьет собаку лапой, набрасывается на нее, сильно кусает, но охотник отпугивает его, пока он не убил гончую. Собаке удается удрать из леса и добраться домой, где она приходит в себя.
Что она сделает в следующий раз, когда ее подведут поближе к тому же участку? В пылу охоты собака сперва может не сообразить, куда ее направляют, но потом вдруг понимает. У нее снова встает дыбом шерсть. Она отказывается идти. Поранил ее медведь, но теперь она избегает участка, где получила наказание, словно он тоже «виноват» в этом. Таким образом, участок леса становится вторичным негативным подкреплением.
Может быть, для собак, так же как и для людей, вторичные негативные подкрепления важнее всех прочих.
Понятно, что в нашем приведенном в пример случае бегство из леса, равно как и от медведя, служит для собаки позитивным подкреплением.
Как избавить собаку от страха перед зарослями? Мы видели, что стимулы утрачивают эффект, когда становятся регулярными и привычными (человек, живущий рядом с железнодорожной линией, со временем перестает слышать шум поездов), так что если достаточное число раз провести собаку через тот же участок, не встречаясь с медведем, вторичный негативный стимул утратит способность вызывать реакцию.
Помните, ваша собака будет быстрее учиться, испытывая определенную потребность, имея соответствующий стимул и сразу же после каждого правильного поступка получая должное подкрепление.
Ко всем этим условиям надо добавить еще одно, чрезвычайно важное — сосредоточенное внимание. Некоторые дрессировщики окликают собак, привлекая внимание. Есть лучшие способы. При повторении ученик становится невнимательным, если его потребности остаются неудовлетворенными.
Не менее важно не позволять собаке отвлекаться на что-либо. Шумы, незнакомые предметы, присутствие других собак и других людей — все это следует исключить. Пустая комната или гараж, который собака имеет возможность обследовать, — хорошее место для начала тренировок. Нет ничего хуже для дрессировки, чем обстановка на площадках, где проводят занятия по послушанию. Площадки прекрасно подходят для дальнейших тренировок уже хорошо обученных собак или для демонстрации результатов, достигнутых дома. Там также можно получить разъяснения инструктора, как дрессировать собак дома. Одна из причин необходимости длительного посещения занятий состоит в том, что новой собаке сперва надо привыкнуть к множеству отвлекающих факторов, а для этого требуется немало времени.
Если бы владельцы собак могли обращаться со своими любимцами так же, как ученые обращаются с подопытными животными, они усвоили бы несколько примечательных фактов о влиянии отвлекающих факторов на поведение. Легче всего отвлекается сытое животное, которое находится в прекрасном физическом состоянии.
Степень и скорость обучаемости зависят от количества повторений и свежести опыта. Собака постоянно обнаруживает, что реакции связаны с определенными аспектами ее окружения. Она быстро обучается различению множества реакций, а степень ее обучения зависит от различения тысяч реакций. Одни из них обусловлены внешними стимулами, другие — внутренними влечениями и потребностями собаки. Мы должны использовать оба типа реакций, увеличивая репертуар наших собак или, если это охотники, приучая к желательному для нас поведению.
Собака не нуждается в подкреплении каждой правильной реакции благодаря тому факту, что подкреплением может служить и его предвкушение. Этот феномен связан с памятью. Один из моих новых подопытных псов, например, не желал идти в вольер, когда я выходил вечером запереть собак в питомнике. Тогда я решил вызвать у него сильную жажду. Не давал пить двадцать четыре часа, а вечером стукнул маленьким молоточком, чтобы привлечь внимание, после чего налил в стоявшую в вольере миску столовую ложку воды. Когда я ушел, он лихорадочно бросился в вольер и вылакал воду. Я вернулся — он выскочил. Я стукнул молоточком и снова налил воды. Через несколько раз он стал заходить в вольер при стуке молоточка. У него быстро возник условный рефлекс. На третий вечер я начал его поить, и никаких проблем у нас больше не возникало. Но на свободе собак, в том числе этого пса, поили мои ассистенты, после чего он опять отказался войти и остаться в вольере. Тогда я утром не накормил его и целый день продержал голодным. Вечером дал немного еды и стукнул молоточком. Пес вел себя почти точно так же, как в случае жажды, только воспоминание о том, как он входил в вольер ради утоления жажды, сменилось ожиданием еды. Отныне я мог каждый вечер протягивать ему небольшой бисквит и закрывать в вольере. Суть в том, что память хранила воспоминание об удовлетворенной потребности, что бы ни служило подкреплением — вода для утоления жажды или еда для утоления голода.
Изучая труды по психологии, часто можно встретиться с принципами «частоты» и «свежести». Едва ли их требуется разъяснять тем, кто дрессировал животных или задумывался о своем собственном обучении. Чтобы учиться, необходимо часто повторять усвоенное, а наиболее живо запечатляются в памяти самые свежие впечатления. Опытные психологи говорили, что надо получать сразу несколько впечатлений, чтобы между ними возникали ассоциации. Хорошо установлено, что для обучения необходимы частота повторения и свежесть впечатлений, но это не принесет должного эффекта, если не будет сопровождаться результативностью и согласованностью (одновременностью). Какое значение это имеет для дрессировки собак? Мы найдем здесь частичный ответ на вопрос о том, как обучается собака.
Допустим, мы посадили собаку в вольер с несколькими педалями. Она хочет есть и стремится утолить голод. Дотрагивается до правой педали — открывается маленькая дверца, за которой лежит немного еды. От прикосновения к любой другой части вольера и к любой другой педали ничего не происходит, и собака привыкает воздерживаться от этого. Нужная педаль превращается в условный стимул для получения пищи, а все прочее, что находится в вольере, — в условные стимулы для воздержания. Разве не ясно, какое значение это имеет, например, для приучения щенка соблюдать чистоту в доме? Он испытывает действительную потребность облегчиться. Дверь на улицу должна стать условным стимулом для этого, а все прочее в доме — условными стимулами для воздержания. Это вполне возможно. Вопрос в том, как этого добиться. Как и во всех прочих областях обучения, здесь важны частота повторения и свежесть последнего впечатления. Если щенок усвоит, что должен сообщить вам о своем желании выйти, дом со временем превратится в условный стимул для воздержания.
Другой принцип, известный как «правило наименьшего сопротивления», означает, что животное выбирает кратчайший путь или предпочитает действовать с минимальной затратой сил. Собака не обучается, если ее поступки не стимулирует некое внутреннее напряжение и если она не имеет достаточных побуждений облегчить это напряжение. Помните: беспричинного поведения никогда не бывает! Никогда, и на этом факте основано обучение.
При некоторых способах обучения уклонение собаки от опасности — скажем, от электрического удара или холодной воды — может послужить более сильным стимулом, чем удовлетворение аппетита. Приведем пример. Вам желательно, чтобы собака входила в дом только через черный ход. Вы слышите, как она лает и просится в дом. Возможно, она испытывает потребность согреться, утолить голод или нуждается в вашем обществе. Но хотя вы постоянно даете свисток у задней двери и вручаете вошедшей в нее собаке лакомство, она продолжает лаять у парадной двери, может быть, потому, что чует там ваш запах. Ее надо остановить.
Знаменитая звезда состязаний по послушанию, кейзхонд, Чемп. Ровике Чим-ни Близ, U.D.
Вы теперь уже знаете, что она реагирует на свисток, но это не стало условным стимулом, который заставлял бы ее всегда подходить к черному ходу. Как быть? Надо сделать так, чтобы ей стало неприятно подходить к парадной двери. Каким образом? Отучить одним из многочисленных способов. Например, каждый раз, услышав лай у парадного, выплескивать в морду чашку воды. И вы обнаружите, что, пять раз выплеснув чашку, добились гораздо более существенного результата, чем за двадцать попыток с вручением лакомства в качестве подкрепления. Такова иллюстрация вышеупомянутого принципа.
Это подводит нас к вопросу о мотивации. Что заставляет собаку испытывать то или иное желание? Потребности или инстинкты. Одна из потребностей — голод. Потребность нуждается в удовлетворении. Если использовать в качестве мотивирующей потребности голод и собака, приступив к обучению, будет каждый раз регулярно получать одно и то же вознаграждение, она не станет прилагать такого усердия, какое проявит при не совсем регулярном поощрении. В ходе любой тренировки вы обнаружите, что на пятой попытке она старается сильнее, чем на первой. Это можно наблюдать у собак, которых приучают к наморднику или учат новому трюку. Положительная уверенность в получении поощрения за удачный поступок не столь эффективна, как разумные ожидания.
Собаки, охотящиеся на белок, должны загнать их на дерево, облаять, дождаться выстрела охотничьего ружья, увидеть падающую белку, схватить и потрепать подстреленное животное. Они могут загнать на дерево полдюжины белок, которые спрячутся в дупле и не будут подстрелены, но это не отбивает у собак желания выслеживать и загонять на деревья других белок. Основывается подобное поведение на том факте, что их первый охотничий опыт каждый или почти каждый раз вознаграждался.
Один из самых важных фактов, связанных с дрессировкой, получен из наблюдений за лабораторными собаками и другими животными и заключается в том, что для формирования привычек (навыков) необходимо найти золотую середину между длительной серией постоянных реакций и редкими возможностями к чему-либо привыкнуть. Если давать собаке много уроков, в ходе которых она будет допускать некоторые ошибки, возникает большая вероятность закрепления тенденции к совершению этих ошибок вместе с желательными в целом формами поведения. Но если устраивать между занятиями короткие перерывы, она научится избегать ошибок и реагировать правильно и безошибочно. Это и есть золотая середина. При увеличении перерывов собака позабудет об ошибках, но ей придется дольше учиться избегать их в будущем.
Опытным дрессировщикам, обучающим собак на воле, этот факт известен и вошел им в плоть и кровь. Приступая к дрессировке, они устраивают занятия в каждый погожий день, но на первых порах ведут их недолго. Они никогда не пытаются уложиться в две недели и не ожидают быстрых результатов. Ошибки представляют собой отрицательные реакции. Собаки должны научиться избегать их, продолжая в то же время устанавливать ассоциации между стимулами и положительными реакциями. Таким образом они учатся вести себя в окружающей обстановке и служить своим хозяевам именно так, как нам этого хочется.
Спасибо, что скачали книгу в бесплатной электронной библиотеке Royallib.ru
Оставить отзыв о книге
Все книги автора
[1]Евгеника — теория о наследственном здоровье человека и путях его улучшения; в современной науке многие проблемы евгеники решаются в рамках генетики человека. (Здесь и далее примеч. ред.)
[2]Кунхаунды — выведенные в Америке несколько пород древесных енотовых гончих.
[3]Фунт — 453,6 г.
[4]Миля — 1609 м.
[5]Ярд — 0,9 м.
[6]Карибу — североамериканский дикий северный олень.
[7]Фут — 30,48 см.
[8]Дюйм — 2,5 см.
[9]«Корзинщики» — индейская культура II в. до н. э. — VII в. н. э., обладавшая развитой техникой плетения корзин.
[10]Лерчер — порода, разводившаяся главным образом в Ирландии. Наиболее распространенная комбинация — кросс грейхаунда с терьером или с колли.
[11]Стимул — переменный фактор среды.
[12]Унция — 28,3 г.
[13]Афферентный — центростремительный, эфферентный — центробежный.
[14]Так называемое привыкание.
[15]Так называемый порог слышимости.
[16]Имеются в виду высокочастотные ультразвуковые свистки.
[17]Асафстила — каучукообразный сок корней некоторых растений с сильным чесночным запахом, использующийся в медицине; бензолы, ксилолы — ароматические углеводороды, содержащиеся в каменном угле и продуктах нефтепереработки, использующиеся, в частности, как растворители.
[18]Галлон — по американским мерам 3,78 л.
[19]Джеймс, Уильям (1842–1910) — психолог и философ, основоположник прагматизма, автор фундаментального труда «Принципы психологии», остающегося классикой психологии.
[20]Бэрд, Ричард Ивлин (1888–1957) — полярный исследователь, летчик, впервые пролетевший над обоими полюсами, Северным и Южным.
[21]Маламут — ездовая собака, получившая название от коренных жителей Аляски малемутов.
[22]Пролактин, или лютеотропный гормон — гормон, вырабатываемый у животных гипофизом, обеспечивающий имплатанцию яйцеклетки, усиливает секрецию молока, а также обусловливают проявление материнского инстинкта.
[23]Фрустрация (букв, с лат.: обман, срыв) — психическое состояние, возникающее в результате неосуществимости какой-либо важной цели, невозможности удовлетворения серьезной потребности.
[24]Акр — около 0,4 гектара.
[25]Rough (англ.) — здесь: тяжело, трудно, горько.
[26]Out (англ.) — выйти наружу.
[27]Тсуга — вид хвойного дерева, растущего в северной части Американского континента.
[28]Описано желание следовать за вожаком, так называемое общественное поведение (стайный рефлекс или рефлекс «вожак-ведомый».
[29]Так называемый «провокатор».
[30]Аген — фирменное название ароматического продукта (кумарина), содержащего трихлорид азота, так привлекающего собак в сене.
[31]Брудер — согревающее устройство.
[32]Уотсон, Джон Броудес (1878–1958) — психолог, один из основоположников бихевиоризма (науки о поведении).
[33]Так называемое переутомление.
[34]От так называемого созревания.
[35]Скиннер, Бэррес Фредерик (1904–1990) — психолог, основатель одного из направлений бихевиоризма, автор фундаментальных трудов «Наука и поведение», «Анализ поведения», «Технология обучения».
[36]Мендель, Грегор Иоганн (1822–1884) — австрийский естествоиспытатель, основоположник учения о наследственности, сформулировавший, в частности, закономерности независимого расхождения признаков и комбинирования наследственных факторов.
[37]101 градус по Фаренгейту — около 38,5 по Цельсию; 50 градусов — около 10.
[38]Пинта — 0,568 литра.
[39]Речь идет о сером бугре гипоталамуса (высшем вегетативном центре, в частности влияющем на обмен веществ и теплорегуляцию), верхушка которого вытянута в узкую полую воронку, на слепом конце которой находится мозговой придаток — гипофиз.
[40]Прогестерон — женский стероидный половой гормон, регулирующий обмен веществ в организме в период беременности.
[41]Кинзи, Альфред (1864–1956) — американский зоолог, автор исследований «Сексуальное поведение мужчины» (1948) н «Сексуальное поведение женщины» (1953), положивших, как принято считать, начало «сексуальной революции» в США.
[42]Гиляцкая лайка — аборигенное отродье амурских лаек.
[43]Рефлекторное поведение — выработка классических, павловских, рефлексов (ассоциативное научение), то есть возникает связь между индифферентным раздражителем и последующим «вознаграждением» или «наказанием»; оперантное — выработка условных рефлексов II типа, то есть животное выполняет действия, желательные для него.
[44]Весли, Джон (1703–1791) — английский теолог, один из основателей протестантской секты методистов.