Минимальная сложность системы
С другой стороны, из сказанного понятно, почему обучение посредством успеха не могло возникнуть у одноклеточных и низших многоклеточных животных, лишенных центральной нервной системы. Система, способная оценить как источник знания успех или неудачу некоторой предыдущей формы поведения и применить результат такой оценки для обратного модифицирующего действия на механизм этой формы поведения, имеет, разумеется, своей предпосылкой существование нескольких не слишком простых, весьма эффективно действующих подсистем. Эти подсистемы и их образ действия мы рассмотрели при обсуждении свойственного виду импульсивного поведения.
Легче всего представить себе механизм, подкрепляющий животное в тех формах поведения, которые ведут к простому удовлетворению потребностей тканей.
* Усиление (англ.). ^Усиление (нем.). ^Усиливать (нем.). — Примеч. пер.
В этом случае достаточен был бы единственный "датчик"*, регистрирующий наличие или отсутствие некоторого необходимого для жизни вещества и посылающий свое сообщение в аппарат предыдущего поведения. Такая простейшая возможность подлинной условной реакции и в самом деле осуществляется в отдельных случаях, например, по наблюдениям Детье, при добывании пищи у многих мух. Но, вообще говоря, для большинства систем поведения, адаптивно модифицируемых подлинным обучением, должны быть выполнены следующие три предпосылки.
Во-первых. Форма поведения, с которой начинается все действие, должна быть "широко открытой", т. е. иметь программу, предоставляющую возможность разнообразных адаптивных модификаций; как мы уже знаем, такая программа предполагает особенно большой запас генетической информации.
Во-вторых. Должна каким-то образом "заноситься в протокол" или "запоминаться" форма, какую имели вводные звенья цепи действий при ее последнем выполнении, и эта запись должна связываться с обратным сообщением об успехе.
В-третьих. Это обратное сообщение должно быть достаточно надежным. Завершающее действие, которое удовлетворяет побуждение, т. е. "consummatory act"* в смысле Уоллеса Крейга или, в случае аппетенции по состояниям покоя в смысле Мейер-Гольцапфель, целевая стимулирующая ситуация должны быть столь однозначно определены внутренними и внешними рецепторными процессами, чтобы с достаточной вероятностью исключить ошибочное сообщение об успехе или неудаче. Иными словами: рецепторный аппарат, передающий обратные сообщения, должен выполнять функции, аналогичные функциям врожденного механизма запуска (с. 290). Нельзя представить себе более простую мысленную модель физиологического аппарата, осуществляющего обучение посредством успеха (conditioning by reinforcement).
Система поведения, способная к такой функции, тем самым никак не может быть простым "рефлексом", как это подсказывает терминология И. П. Павлова. Конечно, существуют простые "рефлекторные" реакции избегания, подобные рассмотренным в 5.6, которые возникают путем простой ассоциации между реакцией бегства и приобретенным запускающим действием некоторой стимулирующей ситуации; они имеют внешнее сходство с рассматриваемыми здесь процессами обучения. Но нам не известен ни один случай, когда бы удалось адаптивно модифицировать некоторую систему поведения посредством дрессирующих, т. е. положительно действующих, "вознаграждающих" стимулов без участия аппетентного поведения. На это обстоятельство давно уже указал Э. Ч. Толмен.
* "Завершающее действие" (англ.), от consummate — доводить до конца, завершать. — Примеч. пер.
Даже в классическом случае слюнных условных "рефлексов", исследованном И. П. Павловым, указанный рефлекторный процесс никоим образом не является единственным процессом, подкрепляемым дрессировкой; более того, слюноотделение составляет лишь малую часть гораздо более сложной последовательности форм поведения, большая часть которых, однако, в классическом лабораторном опыте выключается той простой мерой, что собака привязывается тщательно продуманной кожаной сбруей, едва ли позволяющей ей сделать какое-нибудь движение. Мой покойный друг Говард Лиделл, работавший в качестве приглашенного сотрудника в одной из павловских лабораторий, вызвал там некоторое неприятное удивление, произведя неортодоксальный опыт. Сначала он выдрессировал собаку на условный стимул, состоявший в ускорении звуков метронома. Когда собака научилась надежно выделять слюну на этот стимул, Лиделл освободил ее от уз. Тогда собака сразу же подбежала к метроному, продолжавшему равномерно тикать, подпрыгнула к нему, приветствовала его, виляя хвостом и подвывая, иначе говоря, продемонстрировала все поведение собаки, выпрашивающей еду у хозяина или старшего товарища по своре. При этом она интенсивно выделяла слюну, хотя метроном не ускорил своего хода, так что условный стимул вовсе не предлагался. У общественных псовых (Canidae) выпрашивание корма и взаимное кормление широко распространены. Согласно Крайслеру, волки уже в возрасте одного года кормят чужих более молодых детенышей, у гиеновых собак (Lycaon pictus L.) удачливый охотник кормит всех членов своры. У обоих этих видов врожденные координации выпрашивания те же, что у домашней собаки. Эти координации — а вовсе не одно только отделение слюны — воплощают ту реакцию, которая в классическом опыте выступает в качестве условной!
Я никоим образом не хочу преуменьшить значение опытов Павлова. Вполне законно искусственно изолировать некоторую отдельную реакцию, особенно если это доставляет такие хорошие возможности количественного исследования, как слюноотделение собаки. Но при этом не следует упускать из виду, что в таком случае мы вырезаем кусок из системы. Ни в коем случае не следует впадать в ошибку мышления, присущую некоторым людям с несомненными аналитическими способностями, которые полагают, что система состоит теперь из одной только изолированной части и что одной этой части уже достаточно, чтобы понять все свойства системы в целом.
Если мы теперь бросим взгляд с точки зрения биологического системного анализа на важнейшие известные в настоящее время факты о возникновении условных реакций при подкреплении (reinforcement), то мы увидим, что они полностью подкрепляют изложенное здесь мнение: положительная дрессировка посредством вознаграждения есть важный критерий "подлинной" условной реакции. В перечень "обусловливаемых" реакций, которые приводит в своей книге К. Фоппа, вкралось несколько случаев, где реакция избегания, основанная на простой ассоциации, принимается за подлинное "conditioning"*.
* Кондиционирование" (англ.), в смысле создания условных реакций. — Примеч. пер.
3. ПОИСК ЭНГРАММЫ*
Прежде чем обратиться к вопросу, на какие части всей модифицируемой обучением системы воздействует адаптивная модификация и откуда происходит новая информация, воздействующая на них, я хотел бы высказать некоторые общие соображения о физиологической природе обучения и памяти.
Поиск энграммы, знака в памяти*, оставляемого обучением, до сих пор остался удручающе бесплодным. Для своего остроумного доклада "In Search of the Engram'"* К. С. Лешли избрал подзаголовок: "Thirty years of frustration"2*. В действительности же терпеливые исследования Лешли обнаружили, наряду с другими очень важными результатами, тот факт, что энграмма не локализована в каком-либо определенном месте мозга, а заключается в организации, связывающей всевозможные части мозга. Впрочем, даже сегодня мы не можем сказать, какие физиологические процессы лежат в ее основе. Отсюда понятно, почему многие серьезные исследователи сразу же после открытия генетического кодирования информации в цепных молекулах выдвинули гипотезу, что знание, приобретенное в индивидуальном опыте и хранимое в памяти, удерживается таким же способом. Между тем эта гипотеза вызывает большие сомнения. Если бы она была верна, то должно было бы существовать два механизма, функционирующих независимо друг от друга, один из которых тотчас же "записывает на пленку" все поступающие нервные импульсы, т. е. превращает их временную последовательность в пространственную конфигурацию соответствующей цепной молекулы, заключающей в своем коде воспринятые факты. Второй механизм должен быть в состоянии считывать записанные этим химическим кодом сообщения и переводить их обратно в нервные импульсы, координированные во времени и пространстве. Эта гипотеза, независимо от ее общей невероятности, не может объяснить, почему у всех известных живых существ способность к обучению находится в прямом отношении к числу ганглионарных клеток и вообще к величине и дифференцированное™ центральной нервной системы. В последнее время биохимики показали, что химическое кодирование индивидуально приобретенной информации в цепных молекулах невозможно по временным причинам. Поскольку, кроме того, большая часть результатов, как будто доказывавших химическую передачу индивидуально приобретенной информации, при критическом повторении не смогла быть воспроизведена, я твердо придерживаюсь предположения, что все функции обучения, во всяком случае в той мере, в какой они обусловливают более сложные адаптивные модификации поведения, разыгрываются в синапсах, т. е. в соединениях, связывающих отдельные нервные элементы, и что эти изменения, как уже было сказано (с. 302 и далее), ближе всего родственны эмбриогенетическим процессам индукции. Этим не исключается, что в таких локальных явлениях могут играть роль изменения в кодировании цепных молекул.
* "В поисках энграммы" (англ.). — Примеч. пер.^"Тридцать лет фрустрации" (англ.). — Примеч. пер.
ВРОЖДЕННЫЕ НАСТАВНИКИ
Открытая программа тех механизмов поведения, которыми каждый индивид благодаря эволюционному развитию его предков снабжается в начале жизненного пути, всегда сконструирована надежно испытанным способом, так, что оставленные открытыми переменные части ее относятся к условиям окружающей среды, не предсказуемым в их особенностях, в их временном и пространственном осуществлении, но достаточно постоянным в жизни индивида, чтобы оправдать хранение соответствующей информации. Только что вылупившийся серый гусь никоим образом не может знать, как выглядят индивиды, которые являются его родителями и за которыми ему придется следовать в течение месяцев; молодая пчела не может иметь врожденной информации о географическом строении окрестностей ее улья. Способность узнавать отдельных собратьев по виду и способность приобретать посредством дрессировки навыки отыскания пути представляют собой хорошие примеры установок обучения, доставляющих такую существенную информацию, которая не может быть получена ни от генома, ни от механизмов приобретения текущей информации.
С другой стороны, как мы знаем, именно открытая программа имеет своей предпосылкой большую массу филогенетически приобретенной, связанной с геномом информации. Эта информация превращается в целесообразное поведение животного не посредством морфогенетического* развития, а иным путем. Конечно, сначала морфогенез создает на основе этой информации вполне определенные нейтральные устройства, как, например, описанную на с. 312 врожденную установку обучения, позволяющую мгновенно ассоциировать очень сильный стимул к бегству со всей сопровождающей его стимулирующей ситуацией. Далее, вся описанная в 6.2 структура аппарата подкрепления успехом построена, разумеется, на основе информации, заключенной в геноме. И если мы хотим остаться в пределах естественнонаучного объяснения, то нельзя себе представить, чтобы заключенная в геноме информация могла превращаться в способствующее сохранению вида поведение каким-нибудь иным способом, чем посредством построения реальных структур нервной системы и органов чувств.
Именно это структурирование направляет обучение на целесообразные пути. Из него вырастают "наставники", заботящиеся о том, чтобы открытые места различных программ всегда заполнялись способом, содействующим сохранению вида. Как уже не раз говорилось, сами эти структуры должны быть как можно меньше подвержены изменению вследствие модификации, чтобы ничего не потерять из содержащейся в них врожденной информации. Если в некоторой системе форм поведения имеется подсистема, способная сильно модифицироваться обучением, это неизбежно предполагает, что другие подсистемы достаточно резистентны по отношению к модификациям, чтобы обеспечить выполнение учебной программы модифицируемых частей.
Если не допускать сверхъестественных факторов, например предустановленной гармонии между организмом и окружающим миром, то необходимо постулировать существование врожденных механизмов обучения, чтобы объяснить функции большинства процессов обучения, очевидным образом способствующие сохранению вида. К числу условий возможного опыта принадлежат и те наставники, которые соответствуют Кантову определению априорного: эти врожденные наставники — то, что предшествует любому обучению и должно ему предшествовать, чтобы сделать обучение возможным.
Для естествоиспытателя в высшей степени захватывающее предприятие — разыскивать в некоторой комплексной системе форм поведения, способной к функционированию лишь при адаптивной модификации посредством обучения, те места, где содержится генетически закрепленная открытая программа процессов обучения. Лежащая в основе всего этого информация, связанная с геномом, может быть заложена в самые различные механизмы органов чувств и нервной системы. Например, она может быть сосредоточена в чисто рецепторных механизмах. При типе поведения, который Уоллес Крейг назвал аверсией* и который я, вместе с Моникой Мейер-Гольцапфель, предпочитаю называть аппетенцией по состояниям покоя, это филогенетически запрограммированные рецепторные процессы, говорящие организму, что во внешнем мире что-то "не в порядке". Может быть слишком сухо, слишком влажно, слишком тепло, слишком холодно, слишком светло, слишком темно, соленость воды может быть слишком высокой или слишком низкой, биотоп может доставлять слишком мало укрытий или содержать слишком много препятствий для обзора и т. д. и т. п. Моторное возбуждение, владеющее животным, пока продолжается "вызывающая аверсию" стимулирующая ситуация, может принимать самые разнообразные формы и происходить на самых разных уровнях организации, от простейшего кинезиса до сложных, целенаправленных способов поведения, включающих обучение и понимание. Во всех случаях, когда имеется адаптивная модификация, она затрагивает формы поведения, связанные с поиском пути. Как подлинные условные реакции, возникают путевые дрессировки, быстрейшим образом удаляющие организм от мешающего стимула.
Другой вид возникновения условных реакций, столь же широко распространенный и имеющий столь же простую врожденную программу, выполняет важную функцию — сохраняет посредством внешнего поведения постоянные условия внутри организма, т. е. обеспечивает с помощью целесообразных реакций гомеостазы. Мы знаем о самих себе, что получаем достоверные сообщения, когда в каком-либо из различных регулирующих контуров нашего тела что-нибудь не в порядке. Сообщение "датчика" может быть специфического рода, как, например, при недостатке в тканях определенных веществ. Самые обычные примеры — голод и жажда. Первые бихевиористы, как, например, Торндайк, полагали, что удовлетворение потребностей тканей (tissue needs) является важнейшим подкреплением (Bekräftigung), производящим самодрессировки. При этом даже не ставился вопрос, каким образом организм в целом, и прежде всего его центральная нервная система, "узнает", чего недостает и какими формами поведения он может устранить этот недостаток.
Еще один пример механизма, сообщающего о неблагополучии уже в несколько ином смысле, — чувство боли. Его особая функция — локализация помехи: мы сразу узнаем, где непорядок, и нам уже не дозволяется о нем забыть. Но особенно интересны наименее поддающиеся локализации сообщения, которыми наше тело дает знать о нарушении его гомеостазов. В таких случаях мы можем лишь сказать, что нам плохо. Например, при небольшой инфекции мы никак не в состоянии указать, в каком месте происходит нарушение, даже если чувствуем себя "отвратительно". Но если человека "тошнит", это доставляет уже более точную информацию о месте неблагополучия, а часто можно даже сказать, почему этому человеку так плохо. Как раз в этом и состоит, конечно, ценность такого сообщения для сохранения вида. Если, например, неприятность произошла от употребления испорченной еды, то большей частью мы наталкиваемся посредством "свободных ассоциаций", как выражаются психоаналитики, на какое-нибудь блюдо с душком, съеденное накануне, и тогда причинная связь становится для нас субъективно очевидной. Условные реакции избегания, возникающие вследствие таких переживаний, могут сохраняться надолго, часто на всю жизнь.
Врожденный механизм обучения, производящий эти условные реакции, используя неприятные самочувствия как "наказания" и приятные — как подкрепления, может программироваться очень общим образом. Такому механизму достаточно иметь датчики, в смысле техники управления, в различных регулирующих контурах организма, наказывая за любое изменение, отклоняющееся от желательного номинального значения, и вознаграждая за любое изменение, приближающееся к нему. На этом принципе и в самом деле основывается механизм, определяющий выбор пищи у многих "всеядных", т. е. животных, потребляющих очень разнообразные питательные вещества. Курт Рихтер давно уже установил, что крысы, которым предлагали различные необходимые для их питания вещества порознь, во множестве отдельных сосудов — так что белки были даже разложены на отдельные аминокислоты, — брали из каждой мисочки ровно столько, сколько требовал хорошо рассчитанный рацион. Поскольку крыса никак не может иметь филогенетически приобретенной информации о том, из каких аминокислот синтезируются обычные для нее белковые вещества и в каких отношениях они туда входят, это знание должно приходить к животным другим путем. Исследования X. Гарсиа и Ф. Р. Эрвина привели к весьма важным результатам о программе врожденного механизма обучения, доставляющего крысе такую информацию. Ее можно приучить или отучить от употребления некоторого вида пищи только посредством переживаний, исходящих из ее кишечника. Указанные авторы использовали в качестве наказывающих стимулов инъекции апоморфина, вызывающие тошноту и рвоту, или определенную дозу рентгеновского излучения, производящую то же действие в виде так называемого "рентгеновского похмелья". Все попытки отучить крыс от приема некоторых питательных веществ посредством болевых стимулов и других сильнейших наказаний не приводили к цели. С другой стороны, с помощью указанных способов раздражения кишечника столь же невозможно было отучить крыс от иных форм поведения, кроме приема определенной пищи.
Как в адаптивных модификациях аппетентного поведения, стремящегося к состояниям покоя, так и в только что описанных самодрессировках на определенные виды пищи на передний план выступают условные реакции избегания. Поэтому в некоторой степени оправданно говорить об аверсиях в более общем смысле, как это и делал Крейг. Но когда, например, животное переползает из более холодной среды в более теплую, то никак нельзя объективно установить, избегает ли оно холода или ищет тепла; именно поэтому я предпочитаю термин Мейер-Гольцапфель. Однако несомненно, что в обоих случаях организм находится в состоянии возбуждения и что именно снятие возбуждения действует в качестве дрессирующего подкрепления. Это и есть тот тип подкрепления посредством снижения напряжения — relief of tension, — особую важность которого выяснил Ч. Л. Халл.
Существуют также модифицируемые системы поведения, в которых врожденная информация содержится не только в рецепторных механизмах запуска, анализирующих стимулирующую ситуацию, но и в самих запускаемых наследственных координациях. Хороший пример этого составляет постройка гнезда у галок (Coloeus monedula L.), а также у других врановых (Corvidae). Стоя в центре будущего гнезда, птица выполняет с материалом в клюве толкательное движение со своеобразным дрожанием, направленное по широкой окружности в сторону и немного вниз, которым она прижимает материал к основанию гнезда или к уже построенным его частям и втыкает его в эти места. Если материал наталкивается при этом на сопротивление, то дрожательное движение усиливается и непрерывное во времени толкание превращается в ряд сильных ударов в одном направлении, механическое действие которых несколько напоминает действия человека, чистящего трубку, когда введение чистителя в отверстие трубки наталкивается на сопротивление. И если птица держит ветку или что-нибудь в этом роде, то она продвигает этот предмет до тех пор, пока наконец после ее длительных усилий он не пристает таким образом, что его нельзя уже передвинуть ни вперед, ни назад. Когда это происходит, движения "дрожательного толкания" достигают своего оргиастического максимума и внезапно прекращаются. Птица теряет теперь всякий интерес к объекту, а на какое-то время и вообще к постройке гнезда. Дрожательное толкание с его внезапным, удовлетворяющим побуждение концом — это типичный пример завершающего действия, "consummatory act" в смысле Уоллеса Крейга.
В отличие от многих других певчих птиц, галки и другие врановые явно не имеют локализованной в механизме запуска информации о том, что подходит для постройки гнезда. Когда у них впервые пробуждается стремление к этому, они приносят самые невероятные предметы и пытаются прикрепить их дрожательным толканием к месту, подходящему для постройки гнезда. Знание такого места является, однако, врожденным. Я видел галок и воронов, заталкивающих этим движением осколки стекла, патроны для электрических ламп, даже кусочки льда. Конечно, эти вещи не пристают, так что удовлетворяющее завершающее действие не запускается. И в очень короткое время птица научается использовать лишь такие предметы, которые при дрожательном толкании доставляют обратные сообщения, или "реафференции", запрограммированные в качестве подкреплений во врожденном механизме обучения. Этих сообщений достаточно, чтобы выдрессировать у птицы выбор таких материалов, которые могут быть сплетены инстинктивным движением в очень прочное строение. Иногда у этого врожденного наставника случаются ошибки, что легко объясняется экономностью врожденной информации: конечно, проволока или полосы жести дают особенно подкрепляющие реафференции, и может случиться, что птица выдрессируется на такой материал, биологически неприемлемый из-за своей теплопроводности. Поблизости от промышленных предприятий не так уж редко встречаются металлические гнезда. Описанный процесс представляет пример действия так называемого сверхнормального объекта; реакция на такой объект, как мы еще увидим дальше, напоминает по своему характеру порок.
Сложнее те процессы обучения, которые интегрируют в единую функцию различные инстинктивные движения при постройке крысиного гнезда. Как показал И. Эйбль-Эйбесфельдт, каждая отдельная наследственная координация, входящая в этот процесс, является полностью врожденной. В единственном случае врожденной является также их последовательность: крыса "знает" от рождения, что постройку гнезда надо начинать со сбора материала далеко от места будущего гнезда и доставки его на это место. Крысы, которых Эйбль-Эйбесфельдт вырастил в клетках, не содержавших никаких свободно переместимых предметов, использовали в качестве замещающего объекта собственный хвост, который они брали в зубы далеко от привычного места сна, несли его туда и добросовестно укладывали в надлежащем месте. Поскольку желательно было провести эксперимент с особями без всякого опыта, пришлось повторить его с другими особями, которым в ранней молодости, задолго до проявления побуждений к постройке гнезда, ампутировали хвост. Когда они выросли, им впервые предложили мягкие полоски бумаги, и они сразу же принялись строить. Те из них, которые уже выбрали себе в нерасчлененном помещении определенное место для сна, сразу же стали складывать там принесенные бумажные полоски. У тех, которые до эксперимента спали то в одном месте, то в другом, прошло несколько минут, прежде чем они решились выбрать место для гнезда. Когда отделили угол помещения куском жести площадью в несколько квадратных сантиметров, все подопытные животные стали строить гнезда в этом укрытии.
Строительная деятельность лишенных опыта крыс выразительным образом отличалась от поведения нормальных контрольных животных. Вначале она была намного более интенсивной. Подопытные животные с жадностью набросились на строительный материал, что объяснялось накоплением ни разу не отреагированных инстинктивных движений и чего, конечно, следовало ожидать. Но важное различие состояло в том, что у них отсутствовал порядок наследственных координации, характерный для постройки гнезд опытными крысами. Опытная крыса в начале постройки гнезда ограничивается доставкой материала, пока он не наберется в значительном количестве. Затем она подтягивает этот материал к себе концентрически, вращаясь вокруг вертикальной оси, так что образуется кольцеобразный вал с центром в середине гнезда. Лишь когда этот вал достигает достаточной высоты, опытное животное переходит к так называемому "движению обойщика", заключающемуся в том, что крыса уплотняет и приглаживает внутреннюю стенку вала передними лапами. Подопытное животные Эйбля сразу же выполняли каждую из этих форм движения в законченной координации, так что даже при анализе с помощью замедленной киносъемки не обнаружилось никаких отличий по сравнению с их опытными собратьями по виду. Но указанная выше последовательность полностью отсутствовала: крысы поспешно прибегали с полоской бумаги, клали ее на пол, а затем выполняли в пустом воздухе движения укладки и сглаживания одно за другим, без всякого порядка.
У крыс вся модифицируемая система сложнее, чем у галок, но каждый из множества имеющихся врожденных механизмов обучения действует по тому же принципу. Дрессировка и подкрепление определенной последовательности движений в обоих случаях осуществляются посредством двух процессов. Первый процесс состоит в том, что данная форма наследственной координации может выдать вознаграждающее обратное сообщение лишь при вполне определенной, предусмотренной программой ситуации окружающей среды. Второй же процесс осуществляется обратным сообщением об успехе или неудаче, доставляемым экстероцепторными* и, вероятно, также проприоцепторными* механизмами.
Если инстинктивное движение, так сказать, тратится впустую, не вызывая никаких реаффрекций, то и это действует, вероятно, так же, как прямая отрицательная дрессировка. Во всяком случае, при непосредственном наблюдении рассматриваемых процессов обучения складывается впечатление, что движение укладки доставляет крысам гораздо больше удовлетворения и выполняется с большим изяществом, если материал для укладывания уже собран, а "движение обойщика" вполне удовлетворяет их лишь в том случае, если вал из строительного материала уже сооружен.
Для читателя, интересующегося теорией обучения, замечу, что процессы обучения, при которых большая часть врожденной информации сосредоточена не в рецепторном секторе, а в самой наследственно координированной форме движения, могут быть включены в понятие "оперантного обучения" (opérant conditioning). Но в этом случае "оперант" состоит не в простом, многократно применимом движении, как, например, царапание или сгребание передней лапой, которое может иногда по чистой случайности иметь подкрепляющий успех, как при нажатии рычажка в ящике Скиннера или в более старомодном "ящике с секретом". Он заключается в высокодифференцированном инстинктивном движении, пригодном лишь для единственной специфической функции, и именно той, ради которой оно выработано эволюцией соответствующего вида.
В случае простого, многократно применимого способа поведения справедливы закономерности, сформулированные Б. Ф. Скиннером для процесса обучения, который он назвал кондиционированием типа R. Первый из этих законов гласит, что сила операнта возрастает, если за ним следует подкрепляющая стимулирующая ситуация. Согласно второму закону, сила уже подкрепленного кондиционированием операнта убывает, если за ним не следует подкрепляющий стимул. Эти законы справедливы, если оперантом является так называемая инструментальная реакция, такая, как пространственное перемещение или другие простые формы движения, служащие различным побуждениям. Они справедливы лишь отчасти, если оперант есть инстинктивное движение, аппетенция которого мотивирует животное. В таком случае предшествующее движение в длительной перспективе, возможно, и подкрепляется успехом, но на ближайшее время оно может даже совсем угаснуть. Пока что побуждение удовлетворено, и действие дрессировки станет заметным, лишь когда оно снова проснется. Но отсутствие подкрепления никоим образом не приводит к тому, что животное отказывается от операнта. Поскольку он является наследственной координацией с автономным побуждением, отсутствие удовлетворения приводит лишь к тому, что животное стремится удовлетворить свою потребность в этой форме движения в других ситуациях и на других объектах, но со все возрастающей аппетенцией.
Важно подчеркнуть эти различия, потому что способ проб и ошибок, описанный уже в случае галок и крыс и наблюдаемый, по существу, в том же виде у очень многих животных, можно спутать с так называемым исследовательским поведением, или поведением любопытства, о котором будет речь в дальнейшем.
В описанных выше процессах инстинктивное движение подвержено собственному автохтонному* мотивационному давлению, и эта одна и та же форма движения без изменений испытывается на самых разнообразных объектах. Но при подлинном поведении любопытства организм находится под действием совсем иной мотивации, не зависящей от давления, побуждающего к отдельному инстинктивному движению; это убедительно доказала Моника Мейер-Гольцапфель. При таком поведении животное не испытывает одно инстинктивное движение на различных объектах, а, напротив, испытывает на одном объекте множество инстинктивных движений, часто весь свой рабочий репертуар, выполняя эти движения одно за другим. Оба процесса обучения отличаются от классического "opérant conditioning" в том отношении, что при этом последнем "оперантом" является универсально применимая инструментальная реакция, которая может быть запущена под давлением самых различных мотиваций.
Особенно интересную и неожиданную локализацию врожденной информации открыл М. Кониси в своих исследованиях развития способности к пению у молодых певчих птиц. О многих видах этой группы известно, что неопытный птенец должен услышать пение взрослого собрата по виду, чтобы у него развилось свойственное виду, нормальное во всех подробностях пение. Как известно, исследования И. Николаи обнаружили тот поразительный факт, что некоторые птицы, например снегири, учатся только у вполне определенных особей, с которыми они состоят в столь же определенных, очень тесных социальных отношениях. Известно было также, что птенцы многих видов, которым приходится учиться путем подражания, выбирают в качестве образца пение своего вида даже в том случае, когда слышат много других птичьих голосов и когда голоса их собратьев по виду вовсе не самые заметные и громкие из всех. Кроме того. Оскар Гейнрот заметил, что воспитанные в изоляции птенцы тех видов, которым необходим образец пения своих собратьев, после длинного ряда попыток производят в конце концов песню, приблизительно напоминающую свойственную их виду. Гейнрот предположил, что это "самоподражание".
Все эти явления находят объяснение благодаря открытиям Кониси. Птицы, у которых он разрушал в самом раннем возрасте орган слуха, взрослыми производили пение, состоявшее скорее из шумов, чем из музыкальных звуков, и лишенное всякой структуры. Это наблюдалось и у таких видов, индивиды которых, выросшие в звукоизолированных камерах, вырабатывали вполне отчетливое видовое пение. Отсюда вытекает удивительный, но неизбежный вывод, что лишенные опыта птицы имеют рецепторный прообраз своего видового пения; Кониси называет его "auditory template"*. Птица играет своим голосом, тихо напевает подобно лепечущему ребенку, испытывая самые разнообразные комбинации звуков, и сохраняет те из них, которые лучше всего соответствуют свойственному виду акустическому шаблону, предстоящему перед ее "воображением". Тихие напевы, которые наши любители птиц так мило называют "сочинением"*, носят, таким образом, характер исследовательской игры.
Рассмотренных примеров филогенетически запрограммированных механизмов обучения достаточно, чтобы продемонстрировать три факта, важных в контексте этой книги.
Во-первых. В принципе всегда можно показать соответствующим экспериментальным анализом, в какой подсистеме комплексной модифицируемой системы поведения находится врожденная информация, обеспечивающая возможность выдрессировать у животного целесообразные для сохранения вида формы поведения.
Во-вторых. Ни один процесс обучения не может быть понят, если не известна вся система, адаптивную модификацию которой он осуществляет.
В-третьих. Невозможно сформулировать общие, справедливые для всякого обучения утверждения о том, что именно действует в качестве подкрепления ("reinforcement"). Теория Торндайка, по которой сущностью подкрепления является удовлетворение потребностей тканей, или теория Халла, видящего существенный дрессирующий фактор в снятии нервного напряжения ("relief of tension"), обе подходят лишь к специальным случаям. Физиологическая природа процесса подкрепления должна отдельно исследоваться в каждом случае обучения.