Бихевиоризм и когнитивная психология
Сама идея о том, что поведение определяется предыдущим опытом и не имеет непосредственной связи с мышлением, называется бихевиоризмом (от англ. behavior — поведение). Основателем бихевиоризма считается американский психолог Джон Уотсон. Уотсон вообще отрицал сознание как предмет научного исследования, сводя психические явления к различным формам поведения, понимаемого как совокупность реакций организма на стимулы из внешней среды. В феврале 1913 года Уотсон прочитал в Нью-Йорке знаменитую лекцию — «Психология с точки зрения бихевиориста». Он заявил: «Кажется, пришло время, когда психологи должны отбросить всякие ссылки на сознание, когда больше не нужно вводить себя в заблуждение, думая, что психическое состояние можно сделать объектом наблюдения. Мы так запутались в спекулятивных вопросах об элементах ума, о природе содержаний сознания (например, без-образного мышления, установок и положений сознания и т. п.), что я как ученый-экспериментатор чувствую, что есть что-то ложное в самих предпосылках и проблемах, которые из них вытекают» (под ред. П.Я. Гальперина, 1980). Интересно, но наиболее значимый вклад в фундамент бихевиоризма внес, пожалуй, Эдвард Торндайк который, себя бихевиористом не считал. Торндайк первый применил принцип «проб, ошибок и закрепления случайного успеха» к объяснению всех форм поведения животных и человека.
Но надежды на бихевиоризм не оправдались. Апеллируя к успеху как фактору закрепления поведения, бихевиористы призывали ориентироваться только на «чувственные стимулы», то есть на ощущения. Эмоции не признавались ими объективным явлением и поэтому не находили места в их философии. В результате, во второй половине двадцатого века бихевиоризм уступил место когнитивной психологии, которая сделала акцент на изучении информационных процессов. При этом когнитивная психология реабилитировала понятие психики, а в основу взяла ряд аксиоматических предпосылок:
· Представление о поэтапной переработке информации, то есть о том, что стимулы внешнего мира проходят внутри психики через ряд последовательных преобразований.
· Допущение об ограниченной емкости системы переработки информации. Именно ограниченность способности человека осваивать новую информацию и преобразовывать уже существующую заставляет искать наиболее эффективные и адекватные способы работы с ней.
· Постулат о кодировании информации в психике. Данный постулат фиксирует предположение о том, что физический мир отражается в психике в особой форме, которую нельзя свести к свойствам стимуляции.
Бихевиоризм и когнитивная психология обычно противопоставляются друг другу, так как проистекающие из них модели достаточно сильно разнятся. Но это не столько недостаток подходов, сколько ограниченность моделей, проявляющаяся, главным образом, в толковании понятия «успех». То, что мы попытаемся сделать далее, – это построить модель, которая все-таки позволит совместить оба этих подхода. Мы покажем, что они описывают один и тот же механизм, но только разглядывают его с разных сторон.
Три слепых мудреца захотели узнать, что есть слон. И им привели слона. Один из них протянул руку и коснулся его ноги.
- Я знаю, что это такое, – сказал он, – слон – это колонна.
Другой мудрец потрогал слона за бок и возразил:
- Нет, слон – это стена.
- Вы оба неправы, – сказал третий мудрец, державший слона за хвост. - Слон – это змея!
Эмоциональный компьютер
Начнем издалека. Представим себе, что ученые девятнадцатого века неким волшебным образом получили современный компьютер. Они стали бы изучать его работу, создали бы целую науку, описывающую свойства операционной системы и установленных программ. Затем они вскрыли бы этот компьютер и попытались описать его основные узлы, понять их назначение. Потом они стали бы измерять напряжение в различных точках. Возникли бы многообразные теории о циркулирующих внутри компьютера потоках информации. Кто-нибудь, рано или поздно, распилил бы одну из микросхем и сформулировал учение о его «кремниевой основе». Возникло бы множество наук, каждая из которых описывала бы свою уникальную область. Но самое важное, что сложность устройства современного компьютера затруднила бы ученым понимание достаточно простых принципов, лежащих в основе любой вычислительной техники. Эти принципы называются архитектурой фон Неймана и практически не изменились с 1946 года, когда была опубликована статья «Предварительное рассмотрение логического конструирования электронного вычислительного устройства». И неважно, собран ли компьютер на лампах, транзисторах или микросхемах, базовые принципы остаются те же. Любой компьютер имеет память, систему команд, процессор, который умеет эти команды выполнять, программы, состоящие из последовательности команд и устройства ввода-вывода, позволяющие взаимодействовать с внешним миром. Остальные «навороты», возникшие в результате эволюции вычислительной техники, хотя и многократно увеличивают возможности компьютера, не отменяют эти принципы.
Изучение человеческого мозга во многом напоминает изучение сложной системы без понимания ее основных «конструкторских идей». Мы знаем многое о его внутренней структуре, глубоко изучены процессы, протекающие в нейронах, но для многих исследователей обилие разнообразных знаний заслоняет понимание достаточно простых принципов, лежащих в самой основе.
Для иллюстрации того базового принципа, что отвечает за формирование человеческого поведения, покажем, как может выглядеть простейший мозг, например, для робота с лампочками (Рисунок 10).
Рисунок 10. Простейший мозг для робота, способного радоваться и страдать
Обычно нейронные сети конструируют используя формальные нейроны, которые имеют несколько входов и один выход. Эти нейроны выполняют функцию взвешенного суммирования сигналов входов. Они активируются, если сумма превышает определенное пороговое значение. Чтобы упростить схему, мы воспользуемся более сложными нестандартными нейронами. Будем считать, что их связи обеспечивают передачу информации в обе стороны, а то, как они ее обрабатывают, определяется типом нейрона. Из схемы видно, что она состоит из нейронов шести различных типов. Опишем особенности каждого из них:
· Датчики - нейроны, которые получают информацию об окружающем мире и находятся в состоянии активности, пока присутствует то раздражение, на которое они реагируют.
· Исполнительные нейроны — они активируются в том случае, если сумма сигналов входов превышает некое пороговое значение. Активировавшись, исполнительные нейроны приводят в действие связанные с ними исполнительные устройства. Сигналы, приходящие на входы исполнительных нейронов, могут быть активирующие или тормозящие.
· Безусловные рефлексы — нейроны, связи которых заданы изначально. Эти связи образуют матрицу рефлексов. Сами нейроны активируются при возникновении строго определенной картины активности датчиков. Нейроны рефлексов дают либо активирующий, либо тормозящий сигнал исполнительным нейронам.
· Рефлексы оценочного восприятия — нейроны, которые работают так же, как и нейроны безусловных рефлексов, с той лишь разницей, что их сигналы поступают на нейроны состояния «хорошо – плохо».
· Состояние «хорошо – плохо» — нейроны, которые суммируют поступившие сигналы и хранят значение с текущей суммой. Именно им соответствует синяя и красная лампочки робота, именно они описывают картину состояния «хорошо – плохо».
· Память — нейроны, которые могут находиться в трех режимах.
o Режим 1. Изначальный. Все нейроны памяти девственно-чисты и не оказывают влияния на работу системы.
o Режим 2. По некому принципу нейроны памяти фиксируют картину активности других нейронов, связанных с ними (датчиков и исполнительных нейронов). Они запоминают ситуацию и совершенное действие. При этом они также запоминают, как это действие изменило состояние «хорошо – плохо».
o Режим 3. Запомнив свою картину, нейрон памяти переходит в новое состояние. В этом состоянии нейрон активируется, если «узнаёт» картину, которая соответствовала моменту запоминания, при этом он подает сигналы на исполнительные нейроны, которые были активны в момент запоминания. Сигналы могут быть активирующие или тормозящие. Это определяется тем, положительное или отрицательное изменение состояния запомнил нейрон.
Устройство с таким мозгом, которое, кстати, несложно реализовать на практике, отчасти ведет себя как живой организм. Сначала его поведение полностью определяется рефлексами и представляет собой реакцию на состояние датчиков. В рефлексы прошиты образы, узнавание которых вызывает ответные реакции. По мере накопления опыта возникает способность узнавать новые изначально неизвестные образы и реагировать на них. В условиях, когда датчиков, отображающих внешний мир, не так много, в памяти могут фиксироваться противоречивые воспоминания. При одной и той же картине одни и те же действия могут вести к разным результатам. Это означает, что либо из-за недостаточности информации были отождествлены две разные внешние ситуации, либо само явление носит случайный характер. Но в любом случае устройство начинает следовать такому поведению, которое с наибольшей вероятностью сулит положительное изменение состояния «хорошо – плохо».
Уместный вопрос: как задать изначальные безусловные рефлексы и рефлексы оценочного восприятия? Природа ответила на этот вопрос, запустив процесс естественного отбора и свойственный ему метод проб и ошибок. Для робота можно попытаться задать рефлексы экспертно, руководствуясь определенной логикой. А можно попытаться повторить путь природы, но тогда придется задать среду, естественный отбор и условия выживания и наследования.
Вся описанная конструкция – это одна из разновидностей персептрона. Персептрон — это нейронная сеть, состоящая из входных (S), ассоциативных (A) и реагирующих элементов (R), с переменной матрицей взаимодействия, определяемой последовательностью прошлых состояний активности сети. Термин был введен Фрэнком Розенблаттом в 1957 году. Ему же принадлежит первая реализация в виде электронной машины «Марк-1» в 1960 году. Персептрон стал одной из первых моделей нейросетей, а «Марк-1» — первым в мире нейрокомпьютером (Rosenblatt, 1962).
Рисунок 11. Персептрон Розенблатта
Сам принцип, когда новый опыт изменяет структуру нейронной сети, называется «обучением с подкреплением». Для персептрона необходимо задать систему управления подкреплением. Задача этой системы - оценить успешность взаимодействия устройства со средой и на основе полученных знаний изменить веса ассоциативных элементов таким образом, чтобы повысить шансы устройства на последующий успех. Что считать успехом – это тот вопрос, который всецело зависит от системы управления подкреплением и соответственно тех задач, для решения которых она создается. В нашем случае система подкрепления — это внешняя среда, оценочное восприятие и характер его участия в формировании памяти.
Разработкой систем, которые действуют по принципу эмоционального управления, успешно занимается Александр Жданов. Описание теории и примеры работающих систем можно найти в его книге «Автономный искусственный интеллект» (Жданов, 2009), которую могу порекомендовать каждому, кто хочет найти строгое формализованное изложение. В свои модели Жданов закладывает те же эмоциональные принципы, что описываем мы в этой книге. В его интерпретации обобщенная схема мозга робота выглядит следующим образом:
Рисунок 12. Адаптивное управление по Жданову
Виртуальный опыт
Приобретать опыт можно не только совершая поступки. Когда мы представляем себе что-либо, мы даем эмоциональную оценку своим фантазиям. И тут же запоминаем этот «виртуальный» опыт, и он моментально начинает управлять нашим поведением наравне с опытом реальным.
Гарвардский невролог Альваро Паскуаль-Леоне в 90-х годах XX века провел серию экспериментов, результаты которых наделали много шума. Он обучал две группы людей играть на пианино. При этом одна группа действительно занималась игрой, а вторая проводила большую часть отведенного времени в «психической тренировке», представляя, как они играют. Оказалось, что обе группы добились одинаковых успехов в игре. Более того, изменения моторных областей коры мозга у людей, выполнявших упражнения в уме, походили по размеру на соответствующие изменения у тех, кто по-настоящему занимался на клавиатуре.
Рисунок 13. Динамика изменения моторной зоны, связанной со средним пальцем. Верхний ряд – реальные упражнения, нижний ряд – мысленные
Получение виртуального опыта через оценку своих же фантазий - это то, чем мы занимаемся постоянно. Когда мы думаем о каком-либо поступке, у нас в воображении проносится картина будущего результата. Эта картина получает эмоциональную оценку, и тут же формируется воспоминание о виртуальном опыте. Далее, в зависимости от знака эмоциональной оценки, память либо будет «толкать» нас на совершение представленного действия, либо наоборот, будет ему «препятствовать». Кстати, именно такое понимание того, как соотносятся фантазии и поведение, примеряет бихевиоризм и когнитивную психологию, так как, с одной стороны, констатирует бессознательную основу всех поступков, а с другой стороны - показывает, как когнитивные процессы меняют память, и, соответственно, влияют на поведение.
Этот несложный принцип «виртуального моделирования» позволяет объяснить три фундаментальных свойства мозга.
Выбор
Когда присутствуют близкие альтернативы, а нашего опыта оказывается недостаточно, для того чтобы перевесила одна из них, мы попадаем в затруднительное положение. Память оказывается не в состоянии сформировать поведение, отдав предпочтение одной из альтернатив.
Аристотель в своих трудах сформулировал вопрос: как осел, которому предоставлены два одинаковых угощения, может сделать выбор? Много позже философ Жан Буридан затронул подобную тему, рассуждая о моральном детерминизме. Буридан утверждал, что, столкнувшись с выбором, человек должен выбирать сторону большего добра. Благодаря Лейбницу стала широко известна утрированная версия этих рассуждений про осла и два одинаково хороших стога сена. В этой версии утверждалось, что осел непременно умрет от голода, так как будет не в состоянии сделать выбор между стогами. Именно это рассуждение известно сейчас под названием: «парадокс буриданова осла».
Осел, загубленный Буриданом
Оказавшись на месте буриданова осла, мы начинаем фантазировать. Мы представляем возможные поступки и их результаты и даем им эмоциональную оценку. Мы накапливаем «виртуальный опыт» до тех пор, пока сумма воспоминаний не побудит нас к определенному выбору. Для нас это обычно выглядит как поступок, совершенный в результате размышлений. Если мы начинаем анализировать причины такого поступка, то уверенно говорим, что мысль, возникшая в результате анализа ситуации, толкнула нас на его совершение. Это соответствует следующему алгоритму действий:
Рисунок 14. Простой, понятный, но неверный алгоритм
Так вот, нам стоит признать, что этот алгоритм не корректен. Мы делаем вывод о том, что поступок стал следствием работы некого механизма «сравнения и выбора», на основании того, что поступок совершается после того, как мы представили его и дали эмоциональную оценку результату. Все та же логическая ловушка «после того, следовательно, вследствие того».
Правильнее изобразить процедуру выбора следующим образом:
Рисунок 15. Три стадии выбора
Здесь память не только хранилище информации, но и инструмент, который в соответствии с принципами «эмоционального компьютера», управляет поведением.
Планирование
Все мы знаем, что можно запрограммировать компьютер для совершения определенной последовательности операций. Мы знаем, что можно написать инструкцию, следуя которой человек добьется поставленной цели. Представление о некой программе действий невольно переносится на рассуждения о том, как мозг осуществляет планирование. Возникает желание описать механизм планирования, который разбивает глобальную проблему на последовательность более простых задач, а затем составляет план решения каждой из них. При этом возникает некая программа действий, которая и принимается к исполнению.
Все становится значительно проще, если взглянуть на планирование с другой стороны и применить идею виртуального опыта. Когда человек составляет программу действий, он просто моделирует в воображении предстоящие поступки и формирует виртуальный опыт, который впоследствии будет руководить его поведением. Любое спланированное действие в действительности является действием «виртуально пережитым», результат которого эмоционально оценен и признан позитивным. Совершая спланированную операцию, мы действуем под управлением памяти, которая уже содержит «виртуальный опыт». Это можно изобразить так:
Рисунок 16. Планирование - поступок
При реализации спланированных поступков мы можем столкнуться с тем, что реальный результат будет расходиться с тем, который рисовали наши фантазии. Это заставит нас заново заняться моделированием, которое создаст новый, более адекватный виртуальный опыт. Если проанализировать поведение человека с позиций виртуального моделирования, то придется констатировать, что это, пожалуй, основной процесс, которому подчинено мышление и который, собственно, и объясняет его смысл. Сильное утверждение, правда?
Виртуальное моделирование многое объясняет в причинах человеческих ошибок. Хорошо, если наше представление о мире достаточно адекватно и фантазии близки к реальности. В противном случае легко может сформироваться самое удивительное поведение, например построенное на том, как мы себя «накрутили».
Вспомните фильм Георгия Данелии «Орел и решка».
Друзья стоят у дома бывшего одноклассника и обсуждают, как лучше попросить у него деньги на операцию для Лены.
— Я на всё пойду.
— А он тебе скажет: вставай на колени!
— Ну и встану!
— А он тебе скажет: пей воду из унитаза! Станешь?
Подъезжает новая иномарка, из нее выходит богатый одноклассник Чагина:
— Чагин? Какая встреча! А ты разве не на Севере? Ну что, ребята, заходите, если временем располагаете, отметим встречу.
— Да пошел ты! Сам пей воду из унитаза!