Участие дофамина в пластических перестройках при инструментальном обусловливании

Как и классический условный рефлекс, инструментальное обусловливание на физиологическом уровне представляет собой пластические изменения синапсов нейронов, активированных в процессе обучения. В мозге голод-

ной крысы, нажимающей на педаль для получения пищи, возбуждение ней­ронных цепей, ответственных за этот тип поведения (нажатие на педаль), ведет к усилению связей с нейронами зрительной коры, обнаруживающи­ми пищу. В дальнейшем подкрепляющий стимул (пища) возбуждает меха­низм подкрепления, тот, в свою очередь, обеспечивает связь между нейро­нами, обнаружившими пищу, и моторными нейронами, активация которых ведет к получению пищи путем включения соответствующих синапсов.

Таким образом, различие между классическим условным рефлексом и ин­струментальным обусловливанием состоит в том, что инструментальное обус­ловливание требует системы подкрепления. Уже отмечалось, что пластичес­кие изменения в процессе условнорефлекторного обучения обеспечиваются активацией NMDA-рецепторов. Их возбуждение усиливает взаимодействие между синапсами, активированными условными и безусловными стимулами. Не исключено, что может существовать еще другой механизм, ответственный за пластические перестройки. Классический условный рефлекс включает два взаимодействующих элемента: условный стимул и безусловную реакцию. Инструментальное обусловливание обеспечивается взаимодействием трех элементов: стимула, поведенческого ответа и подкрепления. На нейрональ-ном уровне в настоящее время оно представляется следующим образом.

Внешний стимул возбуждает сенсорные нейроны. В тот момент, когда жи­вотное нажимает на педаль, активируются моторные нейроны. Если за этим следует подкрепление, то оно модулирует взаимодействие первых двух элемен­тов оперантного обусловливания. Подкрепляющий механизм усиливает секре­цию нейромедиатора в тех областях коры головного мозга, где происходят си-наптические изменения под воздействием предшествующего возбуждения. Та­ким образом, он модулирует активность двух первых элементов инструменталь­ного обусловливания и обеспечивает формирование связей между ними.

Доказано, что именно дофамин выполняет модулирующую функцию (Stein, Beluzzi, 1989). Это подтверждает запись активности нейронов обла­сти СА1 гиппокампа, имеющих дофаминергические рецепторы. При под­креплении (не позднее, чем через полсекунды) введением дофамина или его агониста с помощью микропипетки любого спонтанного возбуждения ней­ронов области СА1 гиппокампа вероятность их повторного возбуждения на­растает. Этого не наблюдалось, если вместо дофамина вводили физиологи­ческий раствор. Можно предположить, что дофамин изменяет функциони­рование работающих синапсов. Поскольку роль гиппокампа в формирова­нии следов памяти доказана, можно полагать, что воздействие на его ней­роны через дофаминовые рецепторы со стороны прилежащего ядра являет- ^ ся частью механизма подкрепления.

То, что именно усиление секреции дофамина в прилежащем ядре лежит в основе подкрепления, показано многократно. В одном из экспериментов уровень дофамина в прилежащем ядре мозга крыс определяли методом мик­родиализа. Если самцов помещали в клетку, где прежде они осуществляли ^ копуляцию, то в прилежащем ядре фиксировалось нарастание уровня дофа­мина. Максимальная концентрация этого медиатора отмечалась в момент самой копуляции (Pfaus e. а., 1990).

Уже отмечались структуры, от которых прилежащее ядро получает вхо­ды. Но и сама эта область может воздействовать на многие структуры. Кро­ме гиппокампа, о влиянии на который говорилось выше, прилежащее ядро регулирует поведение и через бледный шар. Именно поэтому повреждение указанной структуры блокирует поведенческое возбуждение у крыс, вызван­ное введением непосредственно в прилежащее ядро кокаина или агонистов дофамина (Hubner, Koob, 1990). Прилежащее ядро ответственно за механизм подкрепления, однако оперантное обусловливание включает кроме под­крепления еще соответствующий стимул и определенное поведение. Сле­довательно, многие другие структуры мозга должны принимать участие в целом акте оперантного обусловливания.

Итак, оперантное обусловливание на физиологическом уровне представ­лено усилением связей между нейронами, выявляющими сигнал, за кото­рым последует подкрепление, и нейронами, контролирующими поведенчес­кую реакцию. К сожалению, данные о конкретных взаимосвязях при инст­рументальном обусловливании еще недостаточны.

Можно предполагать, тем не менее, что при этом типе обучения входы от перцептивных систем способны активировать нейронные цепи, отвеча­ющие за движение. Центральными структурами, где происходит объедине­ние активности этих входов и выходов, по-видимому, являются базальные ганглии и лобная кора. Доказательством этому служит то, что повреждение базальных ганглиев у человека и животных нарушает заученные ранее ав­томатические действия (Reading е. а., 1991). Базальные ганглии иннервиру-ются дофаминергическими нейронами черного вещества. Дегенерация во­локон, связующих черное вещество и базальные ганглии, ведет к болезни Паркинсона. Какова роль этих волокон в формировании пластичности в процессе оперантного обусловливания, пока не ясно.

Окончательный контроль поведения происходит в префронтальной коре (моторная и премоторная области), которая также имеет дофаминергичес­кие входы от прилежащего ядра. Вполне возможно, что именно на ее ней­ронах происходят пластические модификации синапсов в процессе инст­рументального обусловливания. Повреждение префронтальной коры ведет к нарушению выработанного навыка (Passingham, 1988).

Оценка мозгового кровотока посредством ПЭТ-сканирования при инстру­ментальном обусловливании у человека обнаружила нарастание метаболичес­кой активности в левой париетальной коре, премоторной коре и соответству­ющей моторной коре во время выполнения движения. Левополушарная ак­тивация в этом эксперименте объясняется использованием в задании правой руки. Область париетальной коры, в которой нарастала активность, получала информацию от сенсорной ассоциативной коры и являлась важным входом в лобную долю коры. Возможно, префронтальная кора активирует механизм подкрепления, если оценивает поведение как стремление приблизить орга­низм к поставленной цели. Префронтальная кора, с одной стороны, является мишенью дофаминергических нейронов, с другой — контролирует их.

Таким образом, в организме существует система подкрепления, направ­ленная на выполнение и все более частое повторение действия, некогда при-

водящего к ее возбуждению. Описаны структуры, ее составляющие, и об­ласти коры, которые контролируются ею.

Наличие системы подкрепления в природе приводит к тому, что живот­ное и человек обучаются быстрее и эффективнее приспосабливаться к ок­ружающей среде через аппарат эмоционального удовлетворения. Функци­онирование этой системы оправдано в естественных условиях, когда под­крепляющий механизм усиливает деятельное поведение. Например, дли­тельный процесс поисков пищи и ее добывания в конце концов завершает­ся насыщением и последующей приятной расслабленностью, чем и под­крепляется эффективный вариант действий. Выживание в природе возмож­но лишь при наличии постоянной активности.

В настоящее время ситуация радикально изменилась, поскольку человек может возбуждать механизм подкрепления, не предпринимая усилий по раз­витию и усовершенствованию собственных умений и навыков. Длительный мобилизующий поиск пищи подменяется несколькими шагами к холодиль­нику. Систему подкрепления можно активировать, закуривая сигарету, вы­пивая алкоголь или употребляя наркотик. На этом и основано формирова­ние аддикций: привычки к наркотикам, алкоголю, курению, азартным и компьютерным играм и т. д. Остановимся кратко на каждой из них.

Наши рекомендации