Теория игр и реципрокный альтруизм

Если бы случилось осуждать Дарвина за то, что он не создал и не развил теорию реципрокного альтруизма, то одним из доводов в его защиту был бы тот факт, что он - выходец из интеллектуально "неразвитой" культуры. В викторианской Англии не было еще двух инструментов, вместе образующих уникальное по своим возможностям аналитическое средство познания - теории игр и компьютера.
Теория игр была разработана в 1920-30-х годах, как средство изучения принятия решений. Она стала популярной в экономике и других социальных науках, но страдает от репутации несколько слишком, как бы сказать, умненькой. Теоретики игр ловко умудряются сделать изучение человеческого поведения четким и ясным, но платят высокую цену с точки зрения реализма. Они порой полагают, что все, к чему люди стремятся в жизни, может быть в аккурат сведено к единой психологической валюте - к удовольствию, счастью или "полезности", и что цели эти, полагают они далее, преследуются с непоколебимой рациональностью. Любой эволюционный психолог может сказать вам, что эти допущения ложны. Люди - не вычислительные машины, они - животные, находящиеся под властью отчасти и сознательных мотивов, но также и других разнообразных сил. И долгое счастье, каким бы привлекательным оно им не казалось, это, на самом деле, совсем не то, что им предназначено копить и приумножать.
С другой стороны, люди созданы как подобие компьютеров в ходе в высшей степени рационального, холодного и беспристрастного процесса. И эта машина действительно предназначает им копить единую валюту, но совсем другую - итоговое распространение генов, совокупную приспособленность.
Конечно, подобная программа не всегда срабатывает. По разным причинам отдельные организмы часто бывают неуспешными в передаче генов. (Некоторые просто обязаны терпеть неудачу - в этом гарантия неотвратимости эволюции). Кроме того, в случае человеческих существ работа по их "разработке" была проведена совершенно в иной социальной среде, чем нынешняя. Мы живем в больших городах и пригородах, смотрим телевизор и пьем пиво, будучи и поныне раздираемы чувствами, предназначенными для распространения наших генов в маленькой популяции охотников и собирателей. Неудивительно, что часто складывается впечатление, что люди не очень-то успешно преследуют какую-либо конкретную цель, будь то счастье, совокупная приспособленность или что бы то ни было еще.
В таком случае, применяя свои подходы к человеческой эволюции, теоретики игр, видимо, могут пожелать следовать нескольким простым правилам. Прежде всего, объект игры должен стремиться к максимальному генетическому приумножению. Во-вторых, контекст игры должен отражать реалии среды родовых отношений, вчерне напоминающей общество охотников и собирателей. В-третьих, после нахождения оптимальной стратегии эксперимент еще не закончен. Последний шаг - собственно выигрыш - заключается в разгадке того, какие чувства привели бы человеческие существа к следованию данной стратегии. Эти чувства теоретически должны быть частью человеческой природы, они должны были эволюционно развиться в поколениях и поколениях эволюционной игры.
По предложению Вильяма Гамильтона (William Hamilton), Триверс использовал классическую игру, называемую "дилеммой узника". Двух партнеров по преступлению (подельников) допрашивают по отдельности, и они оказываются перед трудным решением. Государству недостает доказательств, чтобы осудить их за тяжкое преступление, которое они совершили, но имеется достаточно доказательств, чтобы осудить обоих на меньший срок, скажем, на год заключения для каждого. Прокурор, желая более сурового приговора, оказывает давление на каждого по отдельности, чтобы тот признался сам и показал на другого. Он говорит каждому: если ты признаешься, а твой подельник нет, то тебя я освобожу, а твои показания использую, чтобы посадить второго на 10 лет. Оборотная сторона предложения заключается для тебя в угрозе того, что если ты не признаешься, а твой подельник сделает это, то в тюрьму на 10 лет пойдешь уже ты. А если ты признаешься, и окажется, что твой подельник признался тоже, я посажу вас обоих, но только на три года.
Если бы вы были в шкуре одного из заключенных и взвесили все варианты выбора один за другим, вы бы почти наверняка решили признаться и "подставить" своего подельника. Предположим для начала, что ваш подельник подставил вас. Тогда вам лучше подставить и его: вы получаете три года тюрьмы в противоположность 10-ти, которые вы бы получили, если бы молчали, в то время как он признался. Теперь предположим, что он не подставил вас. Вы все равно выигрываете, подставляя его: признавшись, когда он молчит, вы получаете свободу, а если тоже промолчите, получите один год. Таким образом, логика выглядит неопровержимой: предай своего партнера!
Однако, если оба партнера последуют этой почти неопровержимой логике и предадут один другого, они закончат тремя годами тюрьмы, тогда как оба могли отделаться одним годом, если бы сохранили верность друг другу и держали рот на замке. Если бы им было позволено пообщаться и достичь согласия - тогда могла бы возникнуть кооперация, и оба бы выиграли. Но им это не позволено, а потому - как же кооперация может возникнуть?
Этот вопрос приблизительно аналогичен вопросу о том, как же немые животные, не способные давать обещаний о возмещении и, коли на то пошло, не понимающие самой сути возмещений, могли эволюционировать таким образом, чтобы стать взаимно альтруистичными. Предательство своего подельника, в то время как он сохраняет верность, подобно тому, как если бы животное, получающее выгоду от альтруистического поступка, никогда бы не делало одолжений взамен. Взаимное предательство подобно тому, как если бы никакое животное не ставило одолжение другому на первое место; хотя оба могли бы выиграть от реципрокного альтруизма, никто не пошел бы на риск погореть. Верность друг другу подобна единичному успешному циклу реципрокного альтруизма - одолжение делают и получают ответное. Но снова возникает вопрос: зачем делать одолжение, если нет гарантии получения ответного?
Соответствие между моделью и реальностью не полное. В случае реципрокного альтруизма имеется задержка во времени между актом альтруизма и ответом на него, тогда как игроки в дилемме узника действуют одновременно. Но это различие не имеет большого значения. По причине того, что заключенные не могут общаться по поводу своих одновременно принимаемых решений, каждый оказывается в ситуации, с которой сталкиваются потенциально альтруистичные животные, неуверенные в том, будет ли некая дружественная инициатива отвечена тем же. Кроме того, если вы и дальше, игра за игрой, будете стравливать тех же самых игроков друг с другом в "повторной дилемме узника", то каждый из них может обратиться к прошлому поведению другого, решая, как действовать по отношению к нему в дальнейшем. Таким образом, каждый игрок может пожинать в будущем то, что он посеял в прошлом - совсем как в случае реципрокного альтруизма. В конечном счете, соответствие между моделью и реальностью вполне хорошее. Логика, которая должна привести к кооперации в повторной дилемме узника, довольно точно соответствует логике, которая должна привести к реципрокному альтруизму в природе. Суть этой логики в обоих случаях - ненулевая сумма игры.





Ненулевая сумма игры

Представьте, что вы шимпанзе, который только что убил молодую обезьянку и дает мясо приятелю-шимпанзе, которому до сего момента еды не хватало. Скажем, вы даете ему пять унций, и давайте назовем это потерей для вас пяти баллов. Теперь очень важно то, что приобретение другого шимпанзе больше, чем ваша потеря. У него, как-никак, был период острой нужды, поэтому действительная ценность пищи для него - в понятиях вклада в генетическое приумножение - необычайно высока. В самом деле, если бы он был человеком и думал о своих обязательствах или был вынужден подписать кабальный контракт, он мог бы рассудительно согласиться расплатиться за пять унций мяса, скажем, шестью унциями сразу же после получки в следующую пятницу. Выходит, он приобрел шесть баллов в этом обмене, хотя вам это стоило только пять.
Эта асимметрия и есть то, что создает ненулевую сумму игры. Выигрыш одного игрока не уравновешивается потерей другого. Важной особенностью ненулевой суммы является то, что благодаря кооперации, или реципрокному обмену, оба игрока могут остаться в выигрыше. Если другой шимпанзе расплатится с вами в тот момент, когда мясо в изобилии у него и в скудном количестве у вас, тогда он жертвует пятью баллами, а вы получаете шесть. Вы оба вышли из обмена с прибавкой в один балл. Серия теннисных сетов, подач мяча в бейсболе, пораженных лунок в гольфе, в конечном счете, дают только одного победителя. Дилемма узника, будучи игрой с ненулевой суммой, совсем другая. Оба игрока могут выиграть, если они кооперируются. Если пещерный человек A и пещерный человек B объединяются, чтобы добыть дичь, которую один человек убить не в состоянии, то семьи обоих пещерных людей получают много еды, а если нет такой кооперации, то ни одна из семей не получает ничего (стоит упомянуть и более буквальные варианты "ненулевой суммы", исчисляемые не в условных (голодному один и тот же кусок хлеба важнее, чем сытому), а абсолютных единицах. К примеру - вы, имея преимущественное право проезда перекрёстка, и находясь в автомобиле один, тем не менее пропускаете переполненный автобус с сотней пассажиров. Вы теряете при этом, допустим полминуты, и четверть минуты теряет автомобиль сзади вас, которого вы невольно вынудили притормозить. Автобус за счёт этого выигрывает минуту. Стало быть 100 человек выигрывают все вместе 100 минут; ненулевая сумма составит 99.25 минут! Именно столько времени всё общество выиграет от жертвы двумя автомобилями трёх четвертей минуты - А.П.).
Разделение труда - обычный источник ненулевой суммы. Вы становитесь специалистом по выделке и шитью шкур и даете мне одежду, я вырезаю по дереву и даю вам копья. Ключевым моментом здесь, как и в примере с шимпанзе, да и в большинстве случаев ненулевой суммы является то, что излишек чего-либо, имеющийся у одного животного, может стать редким и ценнейшим благом для другого. Такое случается постоянно. Дарвин, вспоминая обмен товарами с индейцами Огненной Земли, писал о том, как "обе стороны смеялись, удивлялись и глазели друг на друга; мы, жалея их за то, что они отдают нам хорошую рыбу и крабов за тряпки и т.п.; а они - радуясь случаю найти людей настолько глупых, чтобы менять такие изумительные украшения на хороший ужин".
Судя по многим обществам охотников и собирателей, разделение экономического труда не было слишком впечатляющим в условиях родового строя. Самым обычным предметом обмена, почти наверняка была информация. Знание о том, где был найден большой запас еды, или где была встречена ядовитая змея, может быть вопросом жизни или смерти. А знание о том, кто с кем спит, кто на кого сердится, кто кого обманул и т.д., может обеспечить социальное маневрирование для достижения сексуальных и других жизненных ресурсов. В самом деле, все сорта баек, к которым люди во всех культурах имеют явно врожденную тягу - сказки о триумфе, трагедиях, процветании, несчастье, необычайной преданности, подлом предательстве и т.д. - хорошо соответствуют тем сортам информации, которые благоприятствует приспособленности. Торговля байками (точнее не скажешь) - одно из основных занятий среди друзей и может быть одной из основных причин существования самой дружбы.
В отличие от еды, копий или шкур информацией делятся без действительного принуждения - факт, который может привести к радикально ненулевой сумме такого обмена. Конечно, иногда информация может представлять ценность, только если ее скрывают, но чаще это не так. Один биограф Дарвина писал, что после научных дискуссий между Дарвином и его другом Джозефом Хукером (Joseph Hooker), "каждый соперничал с другим, заявляя, что то полезное, что он в результате получил ... намного перевешивает все то, что он был в состоянии дать взамен".
Ненулевая сумма сама по себе недостаточна для объяснения эволюции реципрокного альтруизма. Даже в игре с ненулевой суммой кооперация не обязательно имеет смысл. В примере с обменом пищей, хотя вы выигрываете один балл в результате единичного цикла реципрокного альтруизма, вы можете выиграть шесть баллов мошенничеством - принимая от щедрот другого и ничего не возвращая. Итак, урок, кажется, заключается в следующем: если вы можете прожить свою жизнь, эксплуатируя людей - непременно делайте это, ибо ценность кооперации бледнеет в сравнении с этим. Более того, если вы не можете найти, кого эксплуатировать, кооперация все же может не быть лучшей стратегией. Если вы окружены людьми, которые сами стремятся эксплуатировать вас, тогда взаимная эксплуатация - это способ компенсации ваших потерь. Действительно ли ненулевая сумма игры подпитывает эволюцию взаимного альтруизма, очень сильно зависит от преобладающего социального окружения. Дилемма узника должна дать больше, чем просто иллюстрация ненулевой суммы игры, если здесь она действительно полезна.
Проверка теорий, без сомнений, является главной проблемой для биологов-эволюционистов. Химики и физики проверяют теории с помощью тщательно контролируемых экспериментов, которые либо дают результаты, соответствующие предсказаниям и тем самым подтверждают теорию, либо нет. Иногда и эволюционные биологи могут сделать такое. Как мы видели, исследователи заставляли голодать матерей древесных крыс (точнее, флоридских лесных хомяков, Neotoma floridana - М.П.), чтобы проверить, будут ли они, в соответствии с предсказанием, действовать в поддержку дочерей. Но биологи не могут экспериментировать с людьми так же, как с древесными крысами. И они не могут провести решающий эксперимент - отмотать пленку назад и воспроизвести эволюцию.
Однако во всё большей степени биологи могут проигрывать аппроксимирующие модели эволюции. Когда Триверс в 1971 году выдвинул теорию реципрокного альтруизма, компьютеры еще оставались экзотическими машинами, бывшими в ходу лишь у специалистов, а ПК и вовсе не существовал. Хотя Триверс поставил дилемму узника на хорошую аналитическую основу, он и не заговаривал о том, чтобы действительно оживить ее, воссоздав внутри компьютера зоологический вид, особи которого регулярно вставали бы перед дилеммой и могли бы жить или умирать из-за нее, позволяя тем самым естественному отбору идти своим путем.
В конце 1970-х Роберт Аксельрод (Robert Axelrod), американский ученый-политолог, придумал такой компьютерный мир и затем приступил к его заселению. Без упоминаний о естественном отборе, вначале не интересовавшем его, он предложил специалистам по теории игр представить компьютерную программу, воплощающую стратегию решения повторной дилеммы узника, т.е., сформулировать правило, при помощи которого программа решает при каждой встрече с другой программой, кооперироваться ли с ней. Затем он щелкнул выключателем и предоставил возможность программам смешаться в единой толпе. Контекст этого соревнования отлично отражал социальный контекст человеческой и до-человеческой эволюции. Это было довольно небольшое общество - несколько десятков регулярно взаимодействующих индивидов. Каждая программа могла "помнить", кооперировалась ли с ней каждая другая программа при предыдущих встречах и соответственно этому подстраивать свое собственное поведение.
После того, как каждая программа встретилась 200 раз с каждой другой, Аксельрод суммировал баллы и объявил победителя. Затем он провел соревнование во втором поколении после систематизированной выбраковки: каждая программа была представлена пропорционально ее успеху в первом поколении - выживал сильнейший. И так игра продолжалась, поколение за поколением. Если теория реципрокного альтруизма верна, можно было бы ожидать его "эволюции" внутри компьютера Аксельрода и постепенного возобладания в популяции.
Так и случилось. Программа-победитель, созданная канадским теоретиком игр Анатолем Рапопортом (Anatol Rapoport), когда-то написавшим книгу "Дилемма узника", называлась "TIT FOR TAT", т.е. "ТО ЗА ТО". (Близкие по смыслу русские эквиваленты - "око за око, зуб за зуб", "что посеешь, то пожнешь", "ты - мне, я - тебе" - М.П.). ТО ЗА ТО управлялась простейшим из правил, и программа была самой короткой из представленных - без преувеличения, длиной всего в 5 строчек. (Поэтому, если бы стратегии не были разработаны, а появлялись в результате случайных компьютерных мутаций, она бы, вероятно, возникла одной из первых). ТО ЗА ТО воплощала именно то, что означает ее имя. При первой встрече с любой программой она начинала сотрудничать. Затем она воспроизводила все то, что сделала другая программа при предыдущей встрече. Один хороший ход заслуживал подобного ответного, равно как и плохой.
Свойства этой стратегии почти так же просты, как и сама стратегия. Если какая-либо программа демонстрирует тенденцию к сотрудничеству, ТО ЗА ТО немедленно завязывает дружбу, и оба пожинают плоды кооперации. Если же программа проявляет склонность к обману, ТО ЗА ТО сокращает потери благодаря тому, что воздерживается от кооперации до тех пор, пока программа не исправится, и тем избегает дорогой платы за наивность. Таким образом, ТО ЗА ТО никогда не становится жертвой повторно, в отличие от неразборчивых в стремлении к кооперации программ. В то же время, ТО ЗА ТО избегает судьбы неразборчивых антикооперационных программ, пытающихся эксплуатировать дружественные к ним программы и оказывающихся в итоге связанными дорогостоящими цепями взаимного предательства с программами, которые желают кооперации лишь на основе взаимности. ТО ЗА ТО обычно без сомнений отказывается от больших одномоментных выгод, которые могут быть получены путем эксплуатации. Стратегии же, нацеленные на эксплуатацию посредством постоянного или периодического "неожиданного" мошенничества, по мере того, как длится игра, постепенно пролетают. Эти программы лишаются добрых по отношению к ним, поэтому лишаются как больших выгод эксплуатации, так и более скромных выгод взаимного сотрудничества. Откровенно действующая по обстоятельствам ТО ЗА ТО оказалась, в конце концов, вполне самодостаточной, обойдя настойчиво подлые, настойчиво милые, равно как и разнообразные "умные" программы, чьи изощренные правила сделали их труднопонимаемыми для других.

Наши рекомендации