Участие дофамина в пластических перестройках при инструментальном обусловливании
Как и классический условный рефлекс, инструментальное обусловливание на физиологическом уровне представляет собой пластические изменения синапсов нейронов, активированных в процессе обучения. В мозге голод-
ной крысы, нажимающей на педаль для получения пищи, возбуждение нейронных цепей, ответственных за этот тип поведения (нажатие на педаль), ведет к усилению связей с нейронами зрительной коры, обнаруживающими пищу. В дальнейшем подкрепляющий стимул (пища) возбуждает механизм подкрепления, тот, в свою очередь, обеспечивает связь между нейронами, обнаружившими пищу, и моторными нейронами, активация которых ведет к получению пищи путем включения соответствующих синапсов.
Таким образом, различие между классическим условным рефлексом и инструментальным обусловливанием состоит в том, что инструментальное обусловливание требует системы подкрепления. Уже отмечалось, что пластические изменения в процессе условнорефлекторного обучения обеспечиваются активацией NMDA-рецепторов. Их возбуждение усиливает взаимодействие между синапсами, активированными условными и безусловными стимулами. Не исключено, что может существовать еще другой механизм, ответственный за пластические перестройки. Классический условный рефлекс включает два взаимодействующих элемента: условный стимул и безусловную реакцию. Инструментальное обусловливание обеспечивается взаимодействием трех элементов: стимула, поведенческого ответа и подкрепления. На нейрональ-ном уровне в настоящее время оно представляется следующим образом.
Внешний стимул возбуждает сенсорные нейроны. В тот момент, когда животное нажимает на педаль, активируются моторные нейроны. Если за этим следует подкрепление, то оно модулирует взаимодействие первых двух элементов оперантного обусловливания. Подкрепляющий механизм усиливает секрецию нейромедиатора в тех областях коры головного мозга, где происходят си-наптические изменения под воздействием предшествующего возбуждения. Таким образом, он модулирует активность двух первых элементов инструментального обусловливания и обеспечивает формирование связей между ними.
Доказано, что именно дофамин выполняет модулирующую функцию (Stein, Beluzzi, 1989). Это подтверждает запись активности нейронов области СА1 гиппокампа, имеющих дофаминергические рецепторы. При подкреплении (не позднее, чем через полсекунды) введением дофамина или его агониста с помощью микропипетки любого спонтанного возбуждения нейронов области СА1 гиппокампа вероятность их повторного возбуждения нарастает. Этого не наблюдалось, если вместо дофамина вводили физиологический раствор. Можно предположить, что дофамин изменяет функционирование работающих синапсов. Поскольку роль гиппокампа в формировании следов памяти доказана, можно полагать, что воздействие на его нейроны через дофаминовые рецепторы со стороны прилежащего ядра являет- ^ ся частью механизма подкрепления.
То, что именно усиление секреции дофамина в прилежащем ядре лежит в основе подкрепления, показано многократно. В одном из экспериментов уровень дофамина в прилежащем ядре мозга крыс определяли методом микродиализа. Если самцов помещали в клетку, где прежде они осуществляли ^ копуляцию, то в прилежащем ядре фиксировалось нарастание уровня дофамина. Максимальная концентрация этого медиатора отмечалась в момент самой копуляции (Pfaus e. а., 1990).
Уже отмечались структуры, от которых прилежащее ядро получает входы. Но и сама эта область может воздействовать на многие структуры. Кроме гиппокампа, о влиянии на который говорилось выше, прилежащее ядро регулирует поведение и через бледный шар. Именно поэтому повреждение указанной структуры блокирует поведенческое возбуждение у крыс, вызванное введением непосредственно в прилежащее ядро кокаина или агонистов дофамина (Hubner, Koob, 1990). Прилежащее ядро ответственно за механизм подкрепления, однако оперантное обусловливание включает кроме подкрепления еще соответствующий стимул и определенное поведение. Следовательно, многие другие структуры мозга должны принимать участие в целом акте оперантного обусловливания.
Итак, оперантное обусловливание на физиологическом уровне представлено усилением связей между нейронами, выявляющими сигнал, за которым последует подкрепление, и нейронами, контролирующими поведенческую реакцию. К сожалению, данные о конкретных взаимосвязях при инструментальном обусловливании еще недостаточны.
Можно предполагать, тем не менее, что при этом типе обучения входы от перцептивных систем способны активировать нейронные цепи, отвечающие за движение. Центральными структурами, где происходит объединение активности этих входов и выходов, по-видимому, являются базальные ганглии и лобная кора. Доказательством этому служит то, что повреждение базальных ганглиев у человека и животных нарушает заученные ранее автоматические действия (Reading е. а., 1991). Базальные ганглии иннервиру-ются дофаминергическими нейронами черного вещества. Дегенерация волокон, связующих черное вещество и базальные ганглии, ведет к болезни Паркинсона. Какова роль этих волокон в формировании пластичности в процессе оперантного обусловливания, пока не ясно.
Окончательный контроль поведения происходит в префронтальной коре (моторная и премоторная области), которая также имеет дофаминергические входы от прилежащего ядра. Вполне возможно, что именно на ее нейронах происходят пластические модификации синапсов в процессе инструментального обусловливания. Повреждение префронтальной коры ведет к нарушению выработанного навыка (Passingham, 1988).
Оценка мозгового кровотока посредством ПЭТ-сканирования при инструментальном обусловливании у человека обнаружила нарастание метаболической активности в левой париетальной коре, премоторной коре и соответствующей моторной коре во время выполнения движения. Левополушарная активация в этом эксперименте объясняется использованием в задании правой руки. Область париетальной коры, в которой нарастала активность, получала информацию от сенсорной ассоциативной коры и являлась важным входом в лобную долю коры. Возможно, префронтальная кора активирует механизм подкрепления, если оценивает поведение как стремление приблизить организм к поставленной цели. Префронтальная кора, с одной стороны, является мишенью дофаминергических нейронов, с другой — контролирует их.
Таким образом, в организме существует система подкрепления, направленная на выполнение и все более частое повторение действия, некогда при-
водящего к ее возбуждению. Описаны структуры, ее составляющие, и области коры, которые контролируются ею.
Наличие системы подкрепления в природе приводит к тому, что животное и человек обучаются быстрее и эффективнее приспосабливаться к окружающей среде через аппарат эмоционального удовлетворения. Функционирование этой системы оправдано в естественных условиях, когда подкрепляющий механизм усиливает деятельное поведение. Например, длительный процесс поисков пищи и ее добывания в конце концов завершается насыщением и последующей приятной расслабленностью, чем и подкрепляется эффективный вариант действий. Выживание в природе возможно лишь при наличии постоянной активности.
В настоящее время ситуация радикально изменилась, поскольку человек может возбуждать механизм подкрепления, не предпринимая усилий по развитию и усовершенствованию собственных умений и навыков. Длительный мобилизующий поиск пищи подменяется несколькими шагами к холодильнику. Систему подкрепления можно активировать, закуривая сигарету, выпивая алкоголь или употребляя наркотик. На этом и основано формирование аддикций: привычки к наркотикам, алкоголю, курению, азартным и компьютерным играм и т. д. Остановимся кратко на каждой из них.