Сервоконтроль мышечных сокращений 5 страница
Рис. XV-5. Схема, показывающая возможные взаимосвязи между механизмами вознаграждения и наказания, составленная на основе экспериментов Маргулиса, Стайна и др. (1967, 1968) по химической стимуляции. Стимулы вознаграждения «запускают» поведение, освобождая его от тормозящих механизмов с помощью перивентрикулярной системы (ПВС), причем имеет место следующая последовательность явлений: 1) Активация медиального пе-реднемозгового пучка (МПП) с помощью стимулов, предварительно ассоциированных с наградой (или избежанием наказания) приводит к высвобождению норадреналина в амигдале и других подавляющих зонах переднего мозга (ПЗМ). 2) Тормозное действие норадреналина подавляет активность, сокращая тем самым опосредованное холинэргином возбуждение медиального таламуса и гипоталамуса (МТ и МГ). 3) Ослабление холинэргической синапти-ческой передачи в МТ и МГ уменьшает активность перивентику-лярной системы и таким образом снижает ее тормозное влияние на моторные ядра ствола мозга (Stein, 1968).
собных к модификации интегративных процессов найдена благодаря открытию системы адренэргических афферентов, берущих свое начало в стволе мозга и достигающих апимальных дендритов. коры больших полушарий.
Факты, на которых основываются гипотезы о сущности процесса индукции, получены почти исключительно в опытах на животных. Однако недавний обзор проблемы мозговых поражений у человека, вызывающих серьезные нарушения процессов памяти, неожиданно подтвердил существование механизма, подобного тому, который здесь описан. Ограниченные поражения коры больших полушарий (включая гиппокамп) или базальных ганглиев не всегда коррелируют с нарушениями памяти. Однаког когда патологический процесс затрагивает структуры ствола мозга, у больных наблюдается «неспособность к образованию.
Рис. XV-6. Сравнение транскортикальной негативной вариации (TNV) — в лобной, прецентральной и постцентральной областях коры обезьяны-ре-зус во время выполнения различных заданий на ожидание. В ситуации предъявления двух сигнальных стимулов, требующих двух ответов, обезьяна должна нажимать на рычаг в пределах 400 мсек после включения светового стимула, держать рычаг опущенным в течение двух серунд и отпускать его в пределах 400 мсек после включения звука. В ситуации предъявления одного сигнального стимула и двух ответов обезьяна должна была спонтанно начинать опускание рычага без стимула, держать рычаг опущенным в течение двух секунд и быстро отпускать его при включении звука. В ситуации отсроченных реакций свет и звук предъявлялись с интервалом в 2 сек; обезьяна должна была воздерживаться от ответа до тех пор, пока не появится звук. Каждая запись — усредненные компьютером 40—50 ответов. В качестве подкрепления обезьяны получали за каждый правильный ответ маленькие кусочки пищи. Ср. с рис. XV-7 (Donchin et al.,
1971).
новых следов памяти, то есть антероградная амнезия (когда продолжительное заучивание не помогает)», несмотря на «сохранность активного состояния внимания, уровня бодрствования-мозга» и «нормальную способность мыслить, решать задачи и т. д.»; в таких случаях при выздоровлении интеллектуальная деятельность лишь «немного ухудшается по сравнению с нремор-бидным уровнем, несмотря на грубые нарушения памяти». Анатомически «ядра, разрушенные поражением, во всех случаях располагаются по средней линии, а именно в 2—3 мм от эпендимы. Иными словами, их расположение в зоне третьего желудочка (и сильвиева водопровода) оказывается более важным как фактор, определяющий их чувствительность, чем все другие свойства этих ядер» (Adams, 1969, р. 98—102).
Нейрофизиологи также внесли известный вклад в изучение мозговых механизмов, определяющих процессы индукции как у человека, так и у животных. Несколько лет назад Грей Уолтер (Walter et al., 1964; Walter, 1967) проанализировал медленно протекающие изменения электрической активности мозга в различных ситуациях. Он обнаружил отрицательное отклонение электрического потенциала при действии одного сигнала, подготавливающего организм к Ответу на следующий, ожидаемый стимул. В наших экспериментах (Donchin et al., 1971; рис. XV-6 и XV-7) подобные отрицательные отклонения вызывались с помощью разнообразных подготовительных состояний ожидания и место возникновения изменений потенциала зависело от типа задания, требующего этого подготовительного состояния, например: если обезьяна или человек готовится, ничего не делая, к~ выполнению ответа, максимальная CNV (контингентная негативная вариация) появляется в лобной коре; если требуется подготовиться к моторному ответу, отрицательный потенциал появляется прежде всего в моторной коре и предшествует осуществлению движения; если требуется выполнить длительное ответное действие, например продолжительный подготовительный нажим на рычаг, максимальный отрицательный потенциал возникает в со-матосенсорной коре. Когда же наконец появляется ожидаемый второй стимул, отрицательный потенциал завершается резким положительным отклонением. В других экспериментах в ситуациях выработки оперантных условных рефлексов эти завершающие позитивные электрические потенциалы были связаны с появлением подкрепляющего агента (Clemente et al., 1964; Grandstaff, 1969; Lindsley, 1969). Таким образом, CNV с ее завершающим быстрым положительным потенциалом сигнализирует об ожидании-и его завершении, о подготовительных фоновых процессах, определяющих судьбу стимула, которые обсуждались в гл. XIV.
Непосредственный эффект может быть получен также с помощью отрицательной (катодной) и положительной (анодной) электрической стимуляции коры больших полушарий во время*
ЗИ
Рис. XV-7. Сравнение контингентных негативных отклонений (CNV) в различных участках мозга у человека в 5 различных экспериментах на время реакции. Во всех опытах предъявлялись 2 зрительных стимула с интервалом в 1,5 сек. В экспериментах А—В испытуемый должен был нажимать на кнопку большим пальцем ведущей руки в ответ иа второй стимул. г
В экспериментах Г и Д от испытуемого требовалось нажимать на кнопку сразу же после включения первого стимула, держать ее нажатой в течение интервала между стимулами и отпускать при появлении второго^ стимула. В качестве обратной связи использовался красный или зеленый свет, который зажигался после каждого правильного или ошибочного ответа. В экспериментах В — Д испытуемые должны были реагировать в пределах 350 мсек. В этих условиях ограниченного времени время реакции сокращалось настолько, что испытуемые допускали до 25% ошибок. Область отрицательных колебаний оценивалась методом суммирования всех отрицательных отклонений (относительно исходной средней линии), возникающих в течение двухсекундного интервала, следующего за включением первого стимула. Электронегативные мозговые волны оценивались, усреднялись и интегрировались с помощью компьютера системы LINC-8.
научения (Stamm, 1961; Morrell, 1961). Отрицательная стимуляция повышает скорость научения, положительная оказывает про-
•тивоположное влияние.
Все эти эксперименты дают убедительное доказательство того, что изменения электрического потенциала возникают в мозгу и
.до и во время подкрепления. Однако мы фактически ничего не
знаем о тех механизмах, которые вызывают эти изменения электрического потенциала. Столь же мало знаем мы и о нейрохимических процессах, сопровождающих эти электрические изменения. Возможно, что CNV отражает или мобилизует «холинэргиче-скую компетентность», а положительные потенциалы возникаюг вследствие активации адренэргических путей или вызывает эту активацию. Тот факт, что электрические изменения связаны с подкреплением, открывает пути для изучения данной проблемы на поведенческом, гистологическом и химическом уровнях — пути, которые в течение ряда лет были полностью закрыты. Понимание подкрепления как процесса индукции выдвигает гипотезы, которые могут быть проверены в биологических исследованиях и помогут разгадать ту загадку, над которой полвека безуспешно бились бихевиористы.
РЕГИСТРАЦИЯ ПОДКРЕПЛЕНИЯ
Вспомним еще раз эксперименты с угашением (гл. III, XI), Регистрируя ряд физиологических индикаторов, мы видим, что-организм отвечает на новый стимул ориентировочной реакцией. Эта реакция угасает при повторном предъявлении стимула. Вспомним также, что после удаления миндалевидного ядра физиологические индикаторы ориентировочного рефлекса, такие, как кожногальваническая реакция (КГР), изменение частоты сердцебиений, дыхания, не обнаруживаются, несмотря на то, что-в других условиях эти физиологические ответы остаются сохранными. Как это ни парадоксально, поведенческое выражение ориентировочной реакции в этих случаях не только сохраняется, но и не угасает. Я интерпретирую этот факт таким образом, что после амигдалэктомии ориентировочный процесс не регистрируется в мозгу так, как это происходит в норме. В ситуации выработки условных рефлексов также отсутствует регистрация этих показателей, как это было обнаружено в опытах с обезьянами, перенесшими подобную операцию (Bagshow and Coppock, 1968; рис. XV-8). Если у нормальных животных наблюдается постепенное увеличение числа электрофизиологических ответов, возникающих во время предъявления стимула, и удлинение периода, во время которого появляются предвосхищающие ответы, то у оперированных животных подобных предвосхищающих КГР и увеличения их числа не наблюдается. Эти результаты говорят о том, что миндалевидное ядро интимным образом связано с организацией процессов во времени, обеспечивая процессы, участвующие в ответе на повторные события, иначе говоря, процессы серийной регистрации в памяти значимых событий. В нормальном организме существует как бы «внутреннее эхо» событий, без которого соответствующая регистрация не происходит.
Таблица XV-1
Пробы | КГР | 5—10 сек включ. | ю—15 сек включ. | 5—10 сек выкл. | 10—15 сек выкл. |
первые 40 | нормальные с удалением амигдалы | 3,7 3,2 | 7,0** 3,3 | 3,9 3,9 | 2.5 2,0 |
вторые 40 | нормальные с удалением амигдалы | 5,7** 2,7 | 8,8** 4,8 | 6,2 3,5 | 4,5 4,3 |
«со 80 | нормальные с удалением амигдалы | 9,3 5,8 | 14,5* 8,2 | 10,3 7.3 | 7,0 6,3 |
* = р < 0,08 ** = р < 0,05
Рис. XV-8. Среднее числа кожногальванических реакций, возникающих за 10-секундный период между включением света и его выключением в первых 40 и во вторых 40 пробах по каждой группе обезьян. Нормальные контрольные животные научаются предвосхищать выключение света, а у животных с удаленным миндалевидным ядром эта способность нарушается (Bagshaw and
Coppock, 1968).
То, что миндалевидное ядро участвует в процессе усвоения опыта, подтверждает и поведение животных (Douglas and Pribram, 1966). В простых задачах на различение часто повторяющихся объектов эти затруднения в регистрации событий почти не заметны. Однако, если порядок подкрепления изменяется таким образом (Barrett, 1969), что начинает подкрепляться ранее не подкреплявшийся стимул (переделка дифференцировки) или вводится новый стимул, как в том эксперименте, когда обезьяна должна была использовать опыт, полученный в другой, сходной, но не идентичной ситуации, животные, перенесшие амигдалэкто-мию, не могут решить задачу (Schwartzbaum and Pribram, 1960; рис. XV-9; Bagshow, Pribram, 1965). В таких опытах обезьяны,
Таблица XV-2-
Влияние удаления ампгдалы на перенос навыка иа новоег но связанное с прежним задание» (см. объяснение к рис. XI-3). Обезьяны после удаления ампгдалы обучаются, выполнению второго задания, как совершенно нового, тогда как нормальные контрольные животные действуют в этих условиях на основе своего прошлого опыта (Schwartzbanm, Pribram, 1960)
Дни | Число перенесенных ответов в опыте на перенос | |||||||||
Нормальные | С удалением амигдалы | |||||||||
ш | Медиана | Медиана | ||||||||
Всего | И | 5 11 | 6 6 | 11,0 | 2 3 5 | 2 2 4 | 4 2 6 | 5,5 |
подвергшиеся амигдалэктомии, обнаруживают повышенную реактивность на новизну (по сравнению с контрольными животными) и эта реактивность сохраняется длительное время после того, как нормальные животные уже привыкли к ситуации. Эти результаты, а также результаты, полученные при изучении физиологических индикаторов ориентировочного рефлекса, говорят о том, что миндалевидное ядро обычно контролирует «контрастное усиление» нервных процессов, нервные механизмы латерального-торможения во входных каналах, принимающих информацию (что происходит всегда, если работает много нейронных аппаратов). Действие той системы, частью которой является амигда-лярный комплекс, состоит в подавлении эффекта разбаланси-ровки, возникающего при быстром изменении ситуации. Эти изменения ситуации приводят к смене режима работы: самоподавление возбуждения сменяется латеральным торможением в том широко распространенном в нервной системе реципрокном содружестве, которое составляет нейронный тормозный механизм— своего рода «заслонку» в системах «входа» (рис. XV-9).. Короче говоря, наличие нормально функционирующего миндалевидного ядра, по-видимому, вводит в действие «внутреннее эхо», что и приводит к регистрации соответствующих, то есть совпадающих с контекстом, событий; это происходит с помощью подавления эффекта воздействия каждого нового стимула, вызывающего значительную разбалансировку организма.
Сам факт регистрации событий посредством своего рода «внутреннего эха», удлиняющего время воздействия на мозг совпадающих событий, наводит на мысль о нейронном механизме-индукции. Работу амигдалярной системы можно понимать как усиление процесса индукции посредством предохраняющей интерференции (Pribram, Douglas and Pribram, 1969) и, таким
Рис. XV-9. Модель коркового контроля над афферентными подавляющими •и тормозными процессами (в лобно-височную систему включается и миндалевидное ядро).
•образом, предоставление достаточного времени для того, чтобы «внутреннее эхо» могло проявиться. Только тогда, когда эти процессы интерференции контролируются, и может осуществляться завершение поведенческого акта и поведение непрерывно регулируется.
УПРАВЛЕНИЕ ПРАВИЛЬНЫМИ И ОШИБОЧНЫМИ ОТВЕТАМИ
Помимо механизма регистрации, существует еще один важ-яейший механизм, обеспечивающий длительное управление поведением, который мы называем завершением действия (commitment). Этот более тонкий процесс относится к тем явлениям, которые математические психологи называют «негативными случаями». Этот процесс следует за самой ранней фазой процесса регистрации и характеризуется началом активного игнорирования организмом тех явлений, которые уже происходили однажды, во теперь больше не подкрепляются. Имеются надежные доказательства того, что в этом процессе участвует гиппокамп, часть переднего мозга, примыкающая к миндалевидному ядру. Так, например, мы показали, что, если в ситуации различения число не-подкрепляемых (то есть негативных) стимулов варьирует от одного до четырех, выполнение задания нормальными животными почти не изменяется. Однако после удаления гиппокампа обезьяны значительно дольше обучаются заданию, в котором предъ-
являются четыре неподкрепляемых стимула, и скорость их научения пропорциональна числу подобных неподкрепляемых агентов (Douglas et al., 1969; рис. XV-10). Затем нормальные животные переходят ко второй фазе обучения: они учатся игнорировать новые неподкрепляемые стимулы. У обезьян, перенесших операцию удаления гиппокампа, механизм этой второй фазы нарушается; они не способны оценивать свои ошибки, если таковые делаются вследствие неподкрепления. Эта неспособность к оценке ошибок особенно заметно проявляется в тех ситуациях, когда
1 2 4
Отрицательные стимулы
Рис. XV-10. График результатов экспериментов с изменением количества отрицательных стимулов в задачах на различение (Douglas et al., 1969).
требуется подавить предварительно заученные формы поведения (Douglas, 1967, Kimble, 1969). Однако изучение такого подавления выдвигает свои проблемы, которые составляют содержание следующей главы.
Механизм, обеспечивающий активное игнорирование ошибок, несомненно, действует в более широком диапазоне ситуаций, чем те, которые изучаются в лабораторных условиях. Во всех подобных ситуациях должна совершаться быстрая оценка соответствия наличных стимулов прежним результатам поведения (прежним подкреплениям). Структура коры гиппокампа, столь сходная во многих отношениях со структурой мозжечка, анатомически очень подходит для этой цели (рис. XV-11). Мгновенный подсчет вероятности ошибки или рассогласования (основанный на оценке текущих состояний гомеостазиса и влияния на него
Рис. XV-11. Цитоархитектоника гиппокампальной извилины:
зубчатая извилина и гиппокамп. Верхний рисунок из работы
Кахала (1911), нижний — из работы Лоренте де Но (1949).
результатов выполнения последней или нескольких последних задач) может, следовательно, служить в качестве контекста (фона), по отношению к которому и определяется это соответствие, и таким образом может быть оценена правильность ответа. С этой точки зрения гиппокамп можно рассматривать как механизм регуляции подкрепления и выполнения задачи, аналогичный мозжечку.
Теперь обратимся к третьей группе проблем, связанных с модификацией поведения: модификации в процессе выполнения задания. В гл. XIV рассматривалась компетентность организма в процессе научения. В настоящей главе мы уточнили нервные механизмы процессов подкрепления, обеспечивающие завершение действия, и рассмотрели мозговые механизмы, участвующие в завершении задачи. Однако завершение задачи еще не означает достижение результата. В следующей главе мы покажем, как завершенные действия превращаются в акт поведения.
РЕЗЮМЕ
Длительные изменения компетентности могут возникать благодаря процессу, сходному с тем, который стимулирует эмбриональные ткани к дифференциации. Характерные черты эмбриональной индукции и поведенческих процессов, связанных с подкреплением, удивительно сходны. Факты показывают, что адренэргические химические процессы индукции стимулируют образование РНК и синтез протеина в механизме соединений весьма разветвленной нервной системы. Механизм индукции нуждается в защите от вмешательства на всех стадиях развития, иначе не будет получен нужный эффект. Большое число мозговых процессов обеспечивает завершение серии непрерывно подкрепляемых звеньев поведенческого акта после того, как они уже введены в действие.
Глава XVI
ДОСТИЖЕНИЯ РЕЗУЛЬТАТА
ТЕОРИЯ ВЫПОЛНЕНИЯ ДЕЙСТВИЯ: ЗНАЧИМОЕ ПОВЕДЕНИЕ
В 50-х и 60-х годах XX в. классическая теория научения получила существенное развитие в результате экспериментов на животных; согласно этой теории, прочность реакции, то есть вероятность ее повторения, должна быть прямо пропорциональна силе подкрепления и его близости к сигналу и обратно пропорциональна тем усилиям, которые требуются, чтобы получить вознаграждение. Однако в некоторых случаях этого не наблюдается.
«За последнее время было собрано значительное число экспериментальных данных, говорящих о том, что эти общие предположения, лежащие в основе теории научения, не получили адекватного подтверждения в изменениях интенсивности ответа. В действительности оказалось, что в соответствующих условиях изменение вознаграждения, времени его отставле-ния и усилий, требующихся для получения вознаграждения, может дать даже противоположные результаты по сравнению с теми, которые ожидаются на основании этих предположений...» (Lawrence, Festinger, 1962, p. 6.)
С этим парадоксом часто сталкиваются те, кто работает в области физиологии. Поражение вентромедиальной зоны гипоталамуса, приводящее к повышенной реактивности, не стимулирует животное «длительно работать за пищу», напротив, такие животные дают меньше реакций, чем контрольные в тех же самых условиях опыта (лишение пищи). После всестороннего изучения условий, которые вызывают такое расхождение результатов, эти факты получили рациональное объяснение при различении двух систем: систем «запуска» и «остановки», мотивации и эмоций.
Изучение условий, приводящих к угашению поведенческих реакций, в этих случаях уменьшает трудности, с которыми сталкивается теория научения. Согласно этой теории, выполнение действия должно отражать «усилие», затрачиваемое организмом, когда он чему-то обучается. Скорость научения как мера «усилия» прямо пропорциональна легкости задания и числу и вре-
меннйй близости подкреплений. Поэтому интенсивность ответа — как показатель скорости научения — должна прямо отражаться на скорости угашения данной реакции в новой ситуации. В действительности же происходит обратное. Чем скорее вырабатывается навык, тем быстрее наступает угашение: скорость научения обратно пропорциональна стойкости к угашению.
Эксперименты показывают, что стойкость к угашению не просто связана с неспособностью обучаться новому, неспособностью вырабатывать новые дифференцировки, неэффективностью усвоения информации или образованием конфликтующих ответов. Разные авторы по-разному интерпретировали эти факты. Например, Д. Лоуренс и Л. Фестингер (1962) предполагали, что информация, необходимая для осуществления «конфликтных», «рассогласованных», или «диссоциированных», ответов, вызывает более стойкий навык, чем это можно было ожидать. А. Эмзель (1958) подчеркнул состояние фрустрации, которое переживает организм в подобных «рассогласованных» ситуациях. Большинство экспериментов и споров было связано с изучением состояния, которое возникает в подобных ситуациях, вызывающих рассогласование и фрустрацию. Так, было установлено, что рассогласование и фрустрация возникают в том случае, когда результат действия не приводит к таким последствиям, которые в достаточной мере его «оправдывают». Однако если вся информация, предшествующая действию, была бы налицо и был бы свободный выбор, действие вообще не осуществилось бы. Иначе говоря, рассогласование и фрустрация возникают только тогда, когда результаты поведения не совпадают с ожидаемыми, то есть когда организм не может регулировать свое поведение. Таким образом, поведение становится выражением эмоциональпого процесса, а не регулируется — через мотивационные каналы — его результатами. Но исчерпали ли мы тем самым полностью проблему?
Хорошо известно, что у морфинистов часто сила их влечения, стремления к наркотику пропорциональна величине затраты той «энергии», которая требуется для получения наркотика. Действительно, в большинстве случаев больные, у которых наблюдались симптомы отказа от наркотика, испытывают понятное отвращение к нему. В экспериментах с обезьянами-резусами обнаруживается сходная взаимосвязь между влечением и режимом подкрепления у животных (Clark and Polish, 1960; Clark, Schuster and Brady, (1961). Конечно, существенную роль играют индивидуальные различия, однако законы, регулирующие потребление морфия (например, действующие в Англии), определяются прежде всего соотношением «энергия — влечение»; в Англии наркоманы получают наркотики по медицинским показаниям и поэтому проявляют мало поведенческих нарушений. Вследствие этого контрабанда наркотиками не имела успеха и
проблема наркомании была сведена к минимуму. (К сожалению, в последнее время картина несколько изменилась из-за появления нового типа наркотиков. Тем не менее эта проблема не приобрела таких размеров, как в США.)
Эти наблюдения приводят нас к тому же самому, до сих пор не разрешенному вопросу, а именно: может ли тот факт, что поведение находится под контролем эмоциональных процессов, быть единственным объяснением стойкости к угашению? Какие другие объяснения здесь возможны?
Обратимся к теории информации, которую подтверждают некоторые весьма интересные эксперименты, показывающие, как организм привыкает к наркотикам или как у него вырабатывается влечение к ним. В большинстве случаев организм способен осуществить ряд альтернативных ответных реакций. Когда поступающая информация уменьшает число таких ответов, говорят, что информация исчерпана. Именно объем информации определяет сокращение числа известных альтернатив, количество неопределенности, которое организм может освоить в процессе выбора. Как мы уже отмечали в гл. XI, теория информации связывает, таким образом, количество информации с количеством неопределенности. Термин «информация» имеет отношение к будущему (какое количество информации может быть получено?), тогда как термин «неопределенность» имеет отношение к прошлому (насколько уменьшилась неопределенность в результате действий?). Когда организм решает уже знакомую «му задачу, его действия не уменьшают эту неопределенность. Тем не менее регуляция поведения каким-то образом продолжается. Подобная ситуация наблюдается тогда, когда поведение контролируется центральным гомеостатическим механизмом. Так, у животных, испытавших когда-то голод, жажду или сексуальное влечение, действия, направленные на удовлетворение этих потребностей, имеют тенденцию к продолжению. Влечения и аффекты этих животных обнаруживают повторный и циклический характер. Каким же образом эти гомеостатические механизмы осуществляют контроль над поведением?
Ответ предполагает, что действия регулируются тем значением, которое эти действия имеют для организма. Изменение значения тех факторов, которые управляют поведением — в обычном смысле этого слова, — конечно же, обеспечивается информацией. Однако, согласно более узкому пониманию теории информации, этот процесс аналогичен процессу настройки сервомеханизма, поскольку он устанавливает ценность поведенческого акта, который стабилизирует этот процесс. Точный смысл слова «ценность» идентичен тому смыслу, который обычно придается «тому слову в социальных науках (см., например, Zimbardos, 1969). На различии между «информацией» и «ценностью» мы остановимся несколько позднее.
Рис. XVI-1. Схема научения как процесса обратной связи и
выполнения как опережающего процесса. Концепция
Т — О — Т — Е.
Р. Уолен (1961) провел следующий эксперимент с крысами, продемонстрировавший разницу между информацией и ценностью. Он показал, что у самца выбор между двумя коридорами лабиринта зависит от завершения его контактов с сексуально доступной самкой, но скорость бега в лабиринте продолжает варьировать в прямой зависимости от числа подобных контактов, несмотря на то, что животное не получает никакой новой информации о местонахождении самки после первых нескольких проб. Спепс (1956) получил сходные результаты, используя в качестве подкрепления кусочки пищи.
Результаты Уолена и Спенса показывают, что, как только начинается действие, подкрепляющие агенты обнаруживают интересные свойства: увеличение числа подкреплений в определенных пределах ведет к равномерному увеличению скорости выполнения задания. Таким образом, ценность поведения определяют подкрепляющие агенты, благодаря им корригируется поведение. Следовательно, результаты поведения могут совпадать с установкой организма, с его влечениями или же расходиться с ними. Это означает, что поведение регулируется, скорее, опережающим процессом, а не процессом обратной связи (рис. XVI-1).
ПАРАДОКС СИСТЕМЫ «СРЕДСТВА — ЦЕЛИ»
Тот фактор, который определяет, контролируется ли поведение процессами обратной связи или опережающими процессами, прямо вытекает из анализа отношения «средства — цель» и их
32а
парадоксального изменения. Дж. Мейс (1962) указывал на те факторы, которые вызывают такое изменение отношений.
«Что происходит, когда у человека или у животного нет необходимости работать, чтобы поддерживать свою жизнь?.. Простейший случай — жизиь домашнего кота — является ярким примером изобильной жизни, более обеспеченной, чем жизнь лошади или коровы. Все основные жизненные потребности домашнего кота полностью удовлетворяются прежде, чем они проявятся. Он защищен от опасностей и непогоды. Пища и питье даются ему прежде, чем он проголодается или захочет пить. Что же ему остается делать? Чем заполнить свое время?
Мы могли бы ожидать, что получив пнщу, не приложив к этому ни малейшего труда, кот свернется в клубок на своей подушке и будет спать до тех пор, пока неотчетливые внутренние ощущения не дадут ему информацию о потребности в следующей порции даровой пищи. Однако он вовсе не спит. Он бродит по саду и лесу, ловит птенцов и мышей. Он наслаждается жизнью на свой собственный лад. Тот факт, что жизнь может доставлять удовольствие — и даже большое — многим живым существам при наличии в изобилии домашней пищи, указывает на радикальные изменения, происходящие в работе аппаратов жизнедеятельности на определенной стадии эволюционного процесса. Это и есть изменение отношений между средствами и целями в поведении. В природных условиях кот должен охотиться, чтобы жить. В состоянии изобилия он живет для того, чтобы охотиться. То же происходит и с людьми. Когда у людей нет необходимости работать, чтобы жить, у них в общем остается только два дела. Они могут «играть» и они могут заниматься искусством. Таковы два способа получать удовольствие от жизни. Правда, многие люди работают потому, что они очень любят работать, однако в этом случае слово «работа» меняет свое значение. Работа становится формой «игры». «Игра» — это деятельность, в которой доставляет удовольствие сам процесс — безотносительно к пользе или какому-либо результату. «Работа» же — это деятельность, при которой усилия направлены на производство чего-то полезного самым простым и легким способом. Отсюда и вытекает значение эргономики и изучения труда с целью уменьшения затрат и сбережения времени. В игре деятельность часто направлена на достижение бессмысленной цели трудным путем. Так, например, игрок в гольф, используя особые приспособления, направляет маленький мяч в небольшое отверстие с далекого расстояния, преодолевая умышленно созданные препятствия для того, чтобы как можно больше усложнить операцию. Это и создает обратные отношения в системе «средства — цели». «Цель» — загнать мяч в отверстие — является средством для новой цели, реальной цели — получения удовольствия от самого процесса преодоления трудностей» (Масе, 1962, р. 10, 11).