Гибридные сетевые модели
Сетевой механизм в современных когнитивных моделях применяется в двух основных вариантах: слабом и сильном. В слабом варианте сеть рассматривается только как механизм распространения активации, переходящей с одних содержаний памяти на другие. Сеть при таком подходе является механизмом, осуществляющим, если воспользоваться старой метафорой И.П. Павлова, «движение светлого пятна сознания по коре больших полушарий». Модели, использующие такое понимание сети, являются гибридными: в дополнение к сетевому они предполагают существование и другого механизма, обычно так называемых систем продукций.
В сильном варианте сеть выступает универсальным механизмом выполнения когнитивных операций – опознания, категоризации, логического вывода и т.д. Модели, в которых сеть рассматривается подобным образом, получили название коннекционистских.
Среди гибридных наибольшую известность получила модель Дж. Андерсон, которая в ходе совершенствования приобрела три формы и три названия: исходная ACTE (Anderson, 1976) превратилась в ACT* (Anderson, 1983), которая затем была преобразована в ACT-R (adaptive control of thought-rational, Anderson, 2003, Anderson et al., 2004). В основе всех трех моделей, однако, лежат общие идеи.
Когнитивные операции в модели Дж. Андерсона осуществляют так называемые «продукции» (productions), т.е. правила, состоящие из условия и действия, в которых при совпадении условия с содержанием рабочей памяти исполняется то, что заложено в части действие. Операции осуществляются над декларативными знаниями, хранящимися в долговременной памяти. Декларативные знания могут быть активированы (в модели ACTE – по принципу «все или ничего», в последующих моделях – градуально), активированные в данный момент времени знания составляют содержание рабочей памяти, или, в более классических, менталистских терминах, сознания.
Когнитивная архитектура ACT-R состоит из нескольких частей (модулей):
1. Перцептивно-моторный модуль, для идентификации объектов и контроля движений.
2. Модуль памяти, состоящий из а) декларативной памяти, в которой информация хранится в виде чанков (см.: Miller, 1956) и б) процедурной памяти, представленной так называемыми «продукциями» (productions) – «правилами вывода».
3. Модуль целей, который осуществляет контроль за целями и намерениями, а также координацию работы процедурной памяти.
Правила вывода (продукции) осуществляют основные операции над содержанием модулей, однако это может происходить только через «буферы». Каждому модулю соответствует свой буфер, в который попадает в достаточной степени активированные элементы. Одно из ограничений на переработку информации в модели ACT-R (по типу «бутылочного горлышка») состоит в том, что размер буфера ограничен лишь одной единицей знания (одним чанком информации). Таким образом, например, из декларативной памяти в каждый момент времени может быть извлечен только один элемент. Второе ограничение на последовательную переработку информации заключается в том, что в каждом цикле может сработать только одна продукция, в модулях же переработка информации может осуществляться параллельно.
Две системы – декларативная и процедурная память – являются, по словам самого Дж. Андерсона, «когнитивным ядром» модели ACT-R.
Собственно сетевая теория Дж. Андерсона относится к декларативной памяти и к активационному принципу системы извлечения информации из нее. Элементами декларативной памяти являются чанки, в структуру которых входит отношение (слот) естьнек., кодирующее принадлежность чанка к той или иной категории, а также дополнительные отношения, описывающие содержание чанка. На рис. 2.12 показан чанк, кодирующий факт сложения 3 + 4 = 7.
Рис. 2.12. Пример сетевого изображения чанка (Anderson, Reder, Libier, 1996)
Процесс извлечения из памяти ответа на вопрос «сколько будет 3 + 4?» может быть описан с помощью работы системы процедурной памяти и, конкретно, с помощью следующего правила вывода (продукции):
ЕСЛИ | цель – ответить на вопрос «сколько будет 3 + 4?» |
и 3 + 4 = 7 | |
ТО | нужно ответить 7 |
Успешное извлечение правильного ответа зависит от того, будет ли чанк, соответствующий факту сложения 3 + 4 = 7 в достаточной степени активированным. Активация чанка в свою очередь зависит от того, насколько активированы источники активации (в данном случае, это элементы 3 и 4, активация которых представлена переменной Wj), насколько сильна связь источника активации с чанком, который должен быть извлечен (переменная Sj) и от базового уровня активации чанка (Bj). Математически это представлено в виде уравнения:
,
где Ai – это активация чанка i, Bi – его базовая активация, Wj – активация источников, Sji – сила связи между источником активации j и чанком i. Так как предполагается, что суммарная активация постоянна, то Wj оценивается как 1/n, где n – это количество источников активации. Параметр Sji зависит от количества связанных с элементом j фактов (т.н. «веером», в оригинале – “fan”): Sji = S – ln(fanj).
Пример того, что значит «рациональный анализ», постулируемый как лежащий в основе модели ACT-R, можно увидеть в том, каким образом вычисляется базовый уровень активации элемента. Базовый уровень активации чанка описывается следующим уравнением:
,
где tj – это время, прошедшее с момента j-го обращения к чанку, а d – параметр угасания, который принято оценивать равным 0.5.
Из этого уравнения следует, что, чем больше времени проходит с момента последнего обращения к элементу, тем ниже становятся его шансы быть извлеченным снова, но чем больше было обращений к элементу в целом, и чем меньше прошло времени с момента последнего, тем больше вероятность повторного извлечения элемента.
Такой способ вычисления базового уровня активации был получен путем рационального анализа глобальной проблемы извлечения информации, которая формулируется следующим образом: как, имея определенный запрос, обеспечить оптимальное извлечение информации, подразумевающее извлечение максимального количества релевантных элементов и минимальное – нерелевантных (Anderson, 1989). Эта проблема, частный случай которой – функционирование человеческой памяти, является проблемой извлечения информации вообще и оптимального поведения системы, сталкивающегося c подобного рода задачей. В уравнении базовой активации чанка отражается результат анализа того, как предшествующие запросы к элементу должны предсказывать потребность в нем в настоящий момент.
Активация чанка определяет: 1. вероятность извлечения этого чанка из памяти и 2. скорость извлечения чанка (т.е. время реакции).
Элемент будет извлечен из памяти только в том случае, если его активация достигнет определенного порога. Обычно несколько элементов «соревнуются» за то, чтобы быть извлеченными, и лишь один из них, обладающий большей активацией, уровень которой превышает пороговое значение, извлекается из памяти. Если ни один из элементов не активирован достаточно сильно, то по прошествии определенного времени система извлечения сообщает об ошибке, либо, если, например, стоит задача опознания стимула, срабатывает «продукция», согласно которой нужно дать ответ «нет». Эта модель получила название «модели ожидания» (waiting model) и позволяет объяснить, к примеру, тот факт, что в экспериментах на время реакции ответы «да» обычно быстрее ответов «нет».
Время, необходимое для извлечения чанка из памяти описывается уравнением:
,
где Ti – время извлечения (время реакции), а F – шкалирующий параметр, приводящий полученные значения к единицам времени реакции.
Из данного уравнения следует, что чем меньше активация элемента, тем больше время его извлечения из памяти.
Эффект веера (fan-effect) – классический пример, с помощью которого можно проиллюстрировать приложение модели ACT-R к объяснению и предсказанию психологических феноменов. Его обнаружил Дж. Андерсон, проводя эксперименты под руководством Г. Бауэра (Anderson, 1974). Эффект веера – это увеличение времени реакции на стимул за счет увеличения количества элементов, связанных с ним.
В одном из экспериментов испытуемым предлагали заучивать предложения относительно персонажей и их местонахождения. Предложения были подобраны так, чтобы персонажи и места имели разное количество фактов с ними связанных. Например:
(1) доктор в банке (1-1)
(2) пожарник в парке (1-2)
(3) адвокат в церкви (2-1)
(4) адвокат в парке (2-2)
Из приведенного примера видно, что персонаж «доктор» встречается только в одном из предложений, а персонаж «адвокат» – двух. Подобным образом можно определить количество ассоциированных фактов для всех персонажей и местонахождений.
После того, как испытуемые заучивали эти факты, им предъявлялась другая серия предложений, среди которых были как те, которые они заучивали (например, «адвокат в церкви»), так и те, которых в первоначальном списке не было (например, «адвокат в банке»). Испытуемым нужно было узнать, какие из предложений они заучивали, а какие – нет. Оказалось, что время реакции при опознании предложения зависит от количества фактов, ассоциированных с элементами этого предложения: при увеличении числа фактов, скорость опознания снижается. Например, предложение «доктор в банке», опознается существенно быстрее, чем «адвокат в парке».
С точки зрения уравнения , основной параметр, который варьировался в эксперименте – это Sji. При увеличении «веера» элемента (т.е. количества связей с другими элементами), его сила связи с другими элементами ослабляется (согласно формуле Sji = S – ln(fanj)), следовательно, уменьшается активация, поступающая от него чанку, требующему извлечения, и в итоге увеличивается время извлечения.
Покажем, каким образом гибридная модель Дж. Андерсона может сочетаться с двухполюсной концепцией творчества. Фактически работа системы продукций осуществляет то, что Я.А. Пономарев относил к логическому полюсу. Продукции работают строго детерминистически, осуществляя трансформацию исходной модели события в новый вариант. Модель событий при этом образована совокупностью декларативных знаний, активированных в данный момент времени в рабочей памяти.
В то же время процесс распространения активации может быть кандидатом на объяснение ряда процессов, связанных с тем, что Я.А. Пономарев называл интуицией. В самом деле, согласно теории Я.А. Пономарева, роль интуиции заключается в том, чтобы снабжать наш логический аппарат, то есть создаваемые модели действительности, информацией о свойствах объектов. Именно это и делает семантическая сеть, движение активации по которой приводит к вхождению в рабочую память (=умственную модель) элементов знания, хранящихся в долговременной памяти. Другими словами, механизм интуиции можно представить как систему связей между информацией в нашей долговременной памяти, которая формируется независимо от наших сознательных усилий и позволяет в нужный момент актуализировать нужное содержание.
В модели Дж. Андерсона отсутствует представление о различии интуитивного и логического режимов функционирования когнитивной системы. Однако такое представление совместимо с моделью, если предположить возможность различных состояний сети. В логическом состоянии активация сети включает немногочисленные элементы, которые в соответствии с веерным эффектом при этом могут быть активированы в большей степени. Высокая степень активации элементов позволяет осуществлять с ними логические операции, однако при этом невысоким оказывается количество элементов, включенных в решение.