Разнообразие условных рефлексов

Каждый условный рефлекс можно характеризовать по трем основным признакам:

1) типу безусловного рефлекса, на базе которого вырабатывается условная реакция (иначе, типу подкрепления);

2) типу сенсорной системы, воспринимающей исходно незначимый сигнал, превращающийся позже в сигнал условный;

3) типу регистрируемой реакции (иначе, эффекторному ответу) (табл. 4.2).

Таблица 4.2 КЛАССИФИКАЦИЯ ФОРМ УСЛОВНО-РЕФЛЕКТОРНОГО ПОВЕДЕНИЯ  
Признак Конкретные варианты
По типу безусловного рефлекса Пищевые Пассивно-оборонительные Половые и др. С положительным подкреплением. С отрицательным подкреплением
По типу условного сигнала Зрительные Слуховые Обонятельные и др.
По типу реакции Вегетативные Двигательные (в том числе инструментальные)

Исходя из первого признака выделяют пищевые, пассивно-оборонительные, активно-оборонительные, половые, подражательные и прочие условные рефлексы. Чем значимее для организма подкрепление (чем сильнее возникающий безусловный рефлекс), тем быстрее идет обучение и прочнее оказывается условная связь. При этом выделяют положительный и отрицательный типы подкрепления. К первому типу относятся подкрепляющие сигналы, получение которых благоприятно с биологической точки зрения (пища); ко второму — те, чье воздействие на организм неблагоприятно и имеет повреждающий характер (болевые стимулы). Следовательно, все варианты обучения можно разделить на протекающие с положительным и отрицательным подкреплением.

С реакцией на положительное подкрепление связан центр положительного подкрепления, расположенный в средней части гипоталамуса; его активность субъективно воспринимается как положительные эмоции. Реакцию на любое отрицательное подкрепление обеспечивает центр отрицательного подкрепления, расположенный в задней части гипоталамуса. Его активность субъективно воспринимается как отрицательные эмоции. При этом положительные эмоции возникают также при успешном избавлении от отрицательного подкрепления, а отрицательные эмоции — при отсутствии ожидаемого положительного подкрепления.

В целом поведение организуется таким образом, чтобы активация центра положительного подкрепления наступала возможно чаще, активация центра отрицательного подкрепления — возможно реже. Второй фактор особенно важен, поскольку означает избегание потенциально опасных ситуаций. В результате оказывается, что обучение, проводящееся на фоне отрицательного подкрепления, как правило, протекает быстрее, а соответствующие условные рефлексы оказываются более стойкими.

Перейдем ко второму из перечисленных признаков условных рефлексов. Необходимыми участниками процесса обучения являются сенсорные центры, реагирующие на условные раздражители и формирующие временные связи с корковыми представительствами безусловных рефлексов. В зависимости от типа задействованной сенсорной системы можно выделить зрительные, слуховые, вкусовые, кожные, обонятельные условные рефлексы. Иногда, делая акцент на специфике условного сигнала, говорят о световых, звуковых, тактильных, температурных условных рефлексах.

Параметры применяемого исходно индифферентного сигнала должны соответствовать сенсорным способностям животного (уровню и особенностям развития его органов чувств): у плохо видящих существ сложно вырабатывать зрительные условные рефлексы, а у лишенных обоняния (например, дельфинов) невозможно сформировать реакцию на запах. Сила сигнала также должна быть оптимальной, если мы хотим провести обучение максимально быстро. Слишком сильный сигнал способен вызвать запуск врожденных оборонительных реакций, слишком слабый — не сможет в достаточной мере активировать корковые сенсорные центры. Еще один важный момент — новизна подаваемого сигнала: чем привычнее будущий условный стимул, тем медленнее формируется рефлекс.

Третье из свойств всякого условного рефлекса — тип регистрируемой реакции. Существует два основных варианта: интересующий нас поведенческий ответ протекает как реакция скелетной мускулатуры либо как реакция некоторого внутреннего органа. В первом случае говорят о двигательных, во втором — о вегетативных условных рефлексах.

Методика формирования вегетативного условного рефлекса описана выше на примере работ Павлова. В случае двигательных условных реакций «технология» обучения несколько иная: она сводится к тому, что, отслеживая разнообразные движения животного, вы подкрепляете пищей только некоторые из них (например, переход в определенное место экспериментальной камеры). При этом важно, чтобы данные движения были достаточно естественными для изучаемого организма. Если обучение идет с отрицательным подкреплением, то экспериментатор, включив болевое воздействие, прекращает его лишь после выполнения двигательной реакции. Если в результате действий животного или человека происходит изменение в окружающей среде (нажатие на педаль или кнопку, открывание двери), такие двигательные условные рефлексы называют инструментальными (оперантными).

Важно понять, что в случае двигательных условных реакций в качестве «корковых представительств безусловных рефлексов» выступают различные области моторной (прецентральной) коры. Следуя генетически предопределенным программам, через них реализуются двигательные компоненты врожденных исследовательских, пассивно-оборонительных, агрессивных ответов и др. Именно к ним «присоединяются» за счет формирования временных связей различные сенсорные корковые центры.

Если мы хотим достаточно точно описать процесс установления временной связи, необходима скрупулезная оценка параметров возникающих реакций. Измерить реакцию внутренних органов можно лишь с использованием различных приборов. Так, различные электрофизиологические методики позволяют в настоящее время оперативно определять не только частоту сердечных сокращений и артериальное давление, но и содержание кислорода в крови, активность потовых желез (кожно-гальваническая реакция), сокращения стенок желудочно-кишечного тракта.

В случае двигательных условных рефлексов реакция организма оказывается «на виду». Остается лишь измерить скорость и время движения особи к источнику положительного подкрепления или оценить степень избегания источника отрицательного подкрепления.

Методики двигательного обучения относительно просты, обычно не требуют оперирования животных и электрофизиологической регистрации. В результате они получили более широкое распространение, чем способы выработки вегетативных условных рефлексов. Сейчас экспериментаторов сравнительно редко занимают особенности самого процесса формирования временных связей, которые достаточно хорошо изучены. В настоящее время различные условно-рефлекторные методики используются прежде всего для оценки действия на процессы обучения различных физико-химических и психофармакологических факторов. Экспериментальными животными являются преимущественно крысы и мыши — животные, с одной стороны, обладающие сложной нервной деятельностью; с другой — относительно мелкие и удобные в содержании. При этом произошла стандартизация экспериментальных процедур, что позволяет исследователям разных стран сопоставлять полученные результаты. Рассмотрим три наиболее часто применяемые методики: выработку условной реакции активного избавления, выработку условной реакции пассивного избегания и выработку двигательного пищедобывательного навыка в лабиринте.

Первый вид обучения проводится в экспериментальной камере, имеющей форму высокого ящика. К ее боковой стенке прикрепляется небольшая полка (рис. 4.9). Мышь помещается в камеру, некоторое время ей отводится на ознакомление с новой обстановкой. Затем включается сенсорный сигнал — звонок, и через 5 с экспериментатор подает на пол камеры электрический ток. Ток не выключается, пока мышь, совершая в попытках избавиться от неприятного стимула хаотические прыжки, не окажется на полке. После паузы процедура повторяется. В результате через 10—20 сочетаний исходно незначимого звонка и отрицательного подкрепления животное при включении условного сигнала совершает быстрый и точный прыжок на полку. Оборонительный слуховой двигательный условный рефлекс сформирован. Критерием его завершенности служит число верно выполненных реакций на каждые 10 предъявлений звонка. Впрочем, пока вашему вниманию была представлена упрощенная схема наблюдаемых событий. Мы еще вернемся к этой экспериментальной ситуации в разд. 4.6 и рассмотрим ее подробнее.

Рис 4.9. Экспериментальная установка для выработки условной реакции активного избавления: 1 — звонок; 2 — полка; 3 — пол камеры, на который может подаваться электрический ток Разнообразие условных рефлексов - student2.ru

Выработка условной реакции пассивного избегания проводится в камере, разделенной на ярко освещенный и темный отсеки (рис. 4.10). Между отсеками находится перегородка с отверстием. Мышь помещается в светлую часть камеры и, самостоятельно реализуя характерную для норных животных пассивно-оборонительную реакцию, переходит в темный отсек. Вслед за этим экспериментатор закрывает отверстие в перегородке и подает на пол темной части камеры электрический ток (в течение нескольких секунд). Больше никаких воздействий на животное не производится. Повторное тестирование обычно осуществляется через неделю. Мышь вновь помещают в светлый отсек. При этом выясняется, что, как следствие обучения с отрицательным подкреплением, животное обычно отказывается переходить в темную часть камеры, демонстрируя реакцию затаивания (избегания). Критерием обученности служит длительность пребывания на свету за некоторый фиксированный период наблюдений.

Разнообразие условных рефлексов - student2.ru  
Рис. 4.10. Экспериментальная установка для выработки условной реакции пассивного избегания: 1 — яркий свет; 2 — темнота; 3 — электрический ток

Описанная ситуация имеет две особенности. Во-первых, мы не использовали никакого специального условного стимула, но рефлекс все же сформировался. Следовательно, в данном случае сенсорными сигналами, запускающими оборонительное поведение, явились различные свойства внешней среды: зрительный образ экспериментальной камеры, ее запах, тактильные ощущения. Рефлексы подобного рода называют «обстановочными», т. е. запускаемыми всей окружающей обстановкой. Вторая особенность — это формирование рефлекса после однократного действия электрического тока. В разделе, посвященном механизмам долговременной памяти, будет сделана попытка пояснить нейрофизиологические основы данного процесса.

Выработка двигательного навыка в лабиринте проводится на базе положительного пищевого подкрепления. Лабиринт обычно представляет собой систему соединенных друг с другом коридоров (рис. 4.11). Пища помещается в один из коридоров (всегда на одно и то же место). Точка «старта» животного также фиксирована. Перед экспериментом питание крыс обычно ограничивают для усиления выраженности пищевого поведения.

Впервые помещенная в лабиринт крыса или мышь достаточно быстро начинает осуществлять поисковое поведение. В результате она обычно в течение 1—2 мин находит пищу, которую, будучи голодной, немедленно съедает. Затем животное вновь возвращают в точку старта, и процедура повторяется. Обучение проявляется в форме сокращения времени достижения подкрепления (до 3—5 с) и количества ошибок, т. е. заходов в пустые, тупиковые, не связанные с продвижением к пище коридоры. Поскольку, как и в предыдущем примере, явный запускающий поведение условный стимул отсутствует, описанная реакция может быть классифицирована как пищевой обстановочный двигательный рефлекс.

Рис. 4.11. Лабиринт для выработки двигательного рефлекса с пищевым подкреплением: 1 — пища; 2 — оптимальная траектория движения животного Разнообразие условных рефлексов - student2.ru

Рассмотренные варианты не исчерпывают всего многообразия условно-рефлекторного поведения, поскольку, во-первых, существуют категории приобретенных реакций, не подпадающие под приведенную классификацию, например, рефлексы на время и сенсорные ассоциации; во-вторых, описано значительное число сложных рефлекторных реакций, являющихся производными от более простых типов приобретенного поведения.

Временной фактор присутствует в каждом условном рефлексе, так как при выработке подобных реакций интервал между условным стимулом и подкреплением достаточно фиксирован. Однако время и само по себе может быть условным раздражителем. Если запускать безусловный рефлекс через равные интервалы времени, то после нескольких повторов каждый раз по истечении такого интервала начнет самопроизвольно возникать реакция — еще до появления подкрепления. Примером могут служить повторяющиеся 1 раз в минуту слабые удары тока. Рефлекс на время будет при этом проявляться в виде опережающего боль учащения сердцебиения. В основе подобного обучения лежит врожденная способность нервной системы «отсчитывать» временные интервалы.

Физиологический термин «условный рефлекс» и психологический термин «ассоциация» очень близки. По существу, под ассоциацией можно понимать установление временной связи между двумя любыми центрами коры больших полушарий. Условие замыкания такой связи — одновременная активация данных центров, происходящая на фоне реализации какого-либо врожденного поведения. Все обычные условные рефлексы могут считаться ассоциациями, но не все ассоциации являются условными рефлексами.

Проведем эксперимент: будем одновременно предъявлять (без явного последующего подкрепления) два сенсорных стимула — включение звонка и лампочки. После 10—20 таких предъявлений выработаем на лампочку условный рефлекс (лучше оборонительный). Если теперь подать звонок, то он с большой вероятностью с первого раза вызовет тот же рефлекс. В основе обучения такого рода лежит замыкание временных связей (ассоциаций) между отдельными сенсорными центрами коры. Своеобразным подкреплением (безусловно-рефлекторной основой происходящего) является в таком случае исследовательское поведение. Поэтому важно, чтобы стимулы, между которыми формируется ассоциация, характеризовались достаточным уровнем новизны, а число их сочетаний не было бы слишком большим (иначе начнется процесс, описанный как угашение ориентировочной реакции).

Сложные поведенческие проявления, производные от более простых условных реакций, весьма многообразны. К ним можно отнести рефлексы на комплексный раздражитель, на отношение, условные реакции второго порядка, цепные двигательные и экстраполяционные рефлексы.

Рефлекс на комплексный раздражитель формируется тогда, когда животное реагирует только на одновременное предъявление двух или более сенсорных сигналов. При этом реакция на действие каждого сигнала в отдельности должна отсутствовать.

О рефлексе на отношение можно говорить в ситуациях выбора из двух сенсорных сигналов (наборов обстановочных стимулов). При этом нервная система сравнивает раздражители по какому-либо признаку и реагирует предпочтительно на источник, например, более высокий звук или более яркий зрительный объект. Следовательно, под «отношением» подразумевается соотношение некоторых характеристик в целом довольно сходных сигналов (объектов).

Рефлексы второго порядка основаны на том, что при прочном условном рефлексе раздражитель начинает сам выступать в роли подкрепления: выработав реакцию на звонок, можно затем (уже без подкрепления) создать ассоциацию между звонком и прикосновением. В итоге с большой вероятностью окажется, что прикосновение начнет запускать тот же поведенческий ответ, что и звонок. Над первым условным стимулом «надстроится» второй — отсюда название этой группы рефлексов. В случае оборонительных условных рефлексов возможны «надстройки» третьего и более порядков.

Цепные двигательные условные рефлексы мы наблюдаем тогда, когда окончание предыдущей моторной реакции является стимулом для запуска следующего звена программы действий. С точки зрения наблюдателя такое поведение характеризуется непрерывностью и «естественностью» переходов от движения к движению, отсутствием пауз и сбоев.

В качестве экстраполяционных рассматриваются рефлексы, которые животное реализует в новой для него обстановке с первого же раза. Возникающая реакция выглядит как целесообразная и приводит к биологически благоприятным результатам. Так, животное, заглянув в отверстие ширмы, находит там миску с едой, но, лишь только оно начинает есть, миска приходит в движение и перемещается вдоль ширмы направо или налево. Вновь получить пищу можно, только обойдя ширму со стороны, соответствующей направлению движения миски. Подобную реакцию успешно реализуют млекопитающие с наиболее сложным мозгом (хищники, приматы), а также врановые птицы (рис. 4.12).

Суть происходящего при запуске экстраполяционных рефлексов состоит в переносе имеющегося у особи опыта (предварительно сформированного навыка) в относительно новую ситуацию. Относительность здесь состоит в том, что новизна условий опыта лишь частична, и обстановка эксперимента должна по некоторым ключевым признакам напоминать особи о ситуациях, уже ей известных. В приведенном примере у животного должен предварительно иметься «рефлекс на движение» — реакция следования за любым перемещающимся объектом. Эта реакция — результат предшествующего обучения, она возникает на базе врожденных пищевых, исследовательских и прочих компонентов поведения. Поэтому возможен ее перенос в новые условия и с первого же предъявления — движение, соответствующее направлению перемещения миски с едой. С точки зрения наблюдателя, такая реакция выглядит как «предугадывание» (экстраполяция) факта появления подкрепления с соответствующей стороны ширмы.

Мы еще вернемся к перечисленным вариантам приобретенного поведения, поскольку пока лишь кратко охарактеризовали их внешние признаки. Говорить о лежащих в их основе механизмах, о роли различных отделов мозга еще рано, поскольку вначале следует познакомиться с более простыми формами приобретенного поведения.

Разнообразие условных рефлексов - student2.ru  
Рис. 4.12. Изучение экстраполяционного рефлекса у голубя и лисицы: 1 — ширма; 2 — кормушка с едой; 3 — кормушка без еды; 4 — направление движения кормушек; 5 — траектория движения голубя; 6 — траектория движения лисы

Дело в том, что условные рефлексы, ассоциации и прочие рассмотренные типы обучения составляют только одну из двух обширных групп реакций, которые модифицируют индивидуальное поведение особи. Группа эта названа «ассоциативным обучением». Ей противостоит, а в чем-то и дополняет ее «неассоциативное обучение». Относящиеся к этой категории приобретенные реакции или идут без подкрепления, или сохраняются относительно небольшое время, или не сопровождаются формированием новых нервных связей. Наиболее характерные из них рассмотрены в следующей главе, причем основное внимание уделено их вкладу в деятельность систем памяти.

Наши рекомендации