Теория игр и институциональная экономика
Для многих социально-экономических процессов и явлений характерна взаимозависимость, множественность и многоаспектность интересов. В таких ситуациях значение целевой функции для каждого субъекта интересов зависит и от решений, принимаемых остальными, зависит от их стратегий. При этом возникают конфликты интересов, которые должны быть устранены. Примерами таких ситуаций являются монополистические рыночные структуры, а также институциональная экономика. Институты можно определять как правила игры.
Игрой называется ситуация, характеризующаяся: 1) наличием множества агентов (игроков), у каждого из которых имеется множество альтернативных линий поведения или стратегий; 2) наличием исходов, зависящих от комбинаций действий игроков и определяющих предпочтения игроков на множестве этих комбинаций; 3) тем, что каждый игрок знает, каковы эти предпочтения у всех других игроков, и знает, что они известны всем остальным.
Описание конкретной игры включает перечень её участников, их возможные действия (ходы или стратегии), набор функций выигрыша (платежи, выплаты) для каждого игрока обычно в виде платежной матрицы
(матрицы выигрышей). Это так называемая игра с полной информацией в нормальной форме (нормальная игра).
Различаются игры с двумя, тремя и более участниками. По свойствам функции выигрыша или степени гармонии (взаимодействия) различаются игры с нулевой суммой, с постоянной разницей, а также кооперативные и некооперативные игры.
Игры с нулевой суммой (антагонистические), когда выигрыш одного игрока равен проигрышу другого. Здесь налицо прямой конфликт интересов. Предпочтения игроков в отношении стратегии противоположны и нет никаких причин для сотрудничества (кооперативных действий).
Игры с постоянной разностью, в которых игроки и выигрывают и проигрывают одновременно, требуют совместных действий. В зависимости от возможности предварительных переговоров между игроками различают кооперативные и некооперативные игры. В кооперативной игре до её начала образуются коалиции и принимаются взаимообязывающие соглашения о стратегии, направленность на максимизацию общего выигрыша , который затем распределяется между участниками. В некооперативных играх игроки не могут координировать свои стратегии, не создают коалиции и стараются максимизировать также свой индивидуальный выигрыш.
Важным элементом игры является структура информации. В играх с полной информацией предполагается, что общеизвестны множество стратегий игроков, их функции выигрыша. В играх с асимметричной информацией – а они наиболее распространены и отражают экономические реальности - какая-то часть информации считается общедоступной, известны также вероятные значения каких-то показателей, но часть информации о предыдущих действиях, о функции выплат, о функции издержек и целевой стратегии конкурентов неполна или неизвестна ЛПР (лицам, принимающим решения) данной фирмы.
Различают также однопериодные (статические) игры, где игроки сталкиваются однократно, их стратегия задана начальными условиями и не меняется (они характерны для дуополии), и многопериодные (динамические) игры, где «время и история игры имеют значение», стратегия меняется. В динамичных играх игроки могут вести предварительные переговоры для «корректирования стратегии». Стратегический ход в динамической игре – это действие, которое влияет на выбор соперника в сторону, благоприятную для данного игрока, воздействуя на ожидания соперника относительно его действий. Средства такого воздействия - правдоподобные (это очень важно!)
обязательства, угрозы, обещания, «инвестиции в дезинформацию» (ложные сигналы, блефы и т.д.)
Основные правила и этапы построения моделей игр (Шаститко,2002. А. Сергеев , 2006):
1. Идентификация ЛПР, т.е. игроков (потребитель, предприниматель, политик)
2. Определение действий (ходов), которые совершают игроки и которые составляют их стратегию.
3. Способность создания коалиций – групп игроков, которые могут давать заслуживающие доверия обещания для реализации согласованных стратегий.
4. Конструирование нормальной игры на основе информации о выигрышах – составление матрицы игры.
5. Установление объёма информации о возможных стратегиях, которой обладают игроки.
Решением игры является определение набора равновесных стратегий. Из
возможных во взаимодействиях игроков равновесий выделяются: а) равновесие доминирующих стратегий; б) равновесие Нэша.
Доминирующей стратегиейназывается такой план действий, который обеспечивает участнику максимальную полезность вне зависимости от действий других участников. Соответственно равновесием доминирующих стратегий будет пересечение доминирующих стратегий всех игроков.
Равновесием Нэшаназывается выбор рациональных стратегий при взаимодействии множества игроков, который будет устойчивым, но не обязательно наилучшим (парето - оптимальным). Это равновесие представляет собой ситуацию , в которой стратегия каждого из игроков является наиболее выгодным ответом на действия других игроков. В случае игры с двумя участниками (к которой в принципе можно свести игру любой степени сложности) пара стратегии ( , ) называется равновесием Нэша (некооперативным равновесием) тогда, когда каждая из них «есть наилучший ответ на другую, т.е. максимизирует полезность U ( , ) , , максимизирует полезность V ( , ), где U ( , ) и V ( , ) означают платежи (выигрыши) А и В соответственно, если выбрана пара стратегии ( , ).
Равновесие Нэша обеспечивает каждого игрока максимальным выигрышем в зависимости от действий другого игрока. В данном случае имеем некооперативную игру между А и В с нулевой суммой: U ( , ) =- V ( , ) и решение игры , (седловая точка) задает max U на множестве и min U на множестве . Д. Нэш в знаменитой теореме о торге (1950) доказал, что существует такая область (точка) решений, когда ни один из игроков не может улучшить своё благосостояние и находится в состоянии паретооптимального равновесия. Свой вывод он строит на основе принятия ряда аксиом (аксиоматический торг): монотонность по допустимому множеству полезностей и составу участников, независимость от масштаба и внешних альтернатив.
Равновесие Нэша явилось одним из фундаментальных положений теории игр, а специалисты (например, нобелевский лауреат по экономике 2007 г. Р. Майерсон) сопоставляют его роль в развитии современной экономической науки с ролью для развития биологии и генетики открытия двойной спирали молекулы ДНК (кстати, почти в одно время с работами Нэша 1950-1951 г.г.) Судьба Д.Нэша была драматичной (она показана в оскароносной голливудской ленте 2001 г. с Р.Кроу в главной роли – «Beautiful mind» или Игры разума): блестящий математик-вундеркинд из Принстона в 1947-1952 г.г., затем длительная борьба с психологической болезнью, распадом личности, а в конце восстановление и мировое признание как нобелевского лауреата по экономике 1994 года.
В теории игр важнейшие проблемы, теоремы, леммы иллюстрируются оригинальными задачами типа дележа агентами подарка из виски и джина, решения раввина о наследстве вдов, производстве кукурузы в имении и т.д. Но самой знаменитой стала «дилемма заключенных» (А. Таккер, 1955), с помощью которой показывается, что доминирующая стратегия, диктуемая принципом обеспеченного успеха и нацеленная на наилучший результат независимо от стратегии партнера-конкурента, оказывается худшей по сравнению с кооперативным выбором.
Двое пойманы с крадеными вещами и подозреваются в краже со взломом. Но для приговора за кражу со взломом нет пока оснований, т.к. они не признаются. Им можно вынести приговор за хранение краденого (полгода тюрьмы).
Их помещают в разные камеры, чтобы они не общались и шериф разъясняет им «права»: если оба признаются, то за кражу со взломом получат 2 года тюрьмы. Если оба не признаются, то получат по полгода за хранение краденого. Если один признается, то не будет наказан, в то время, как непризнающийся получит 5 лет тюрьмы.
Доминирующая стратегия каждого из заключенных – признаться в надежде, что можно получить максимум 2 года при признании партнера или свободу при его непризнании. Но, руководствуясь этой стратегией обеспечения успеха, оба они оказываются в худшем положении, чем при непризнании - тогда получили бы только по полгода.
В нормальном виде такая игра представляется в матричной форме 2x2 со строками и столбцами «признание» и «отказ» соответственно первого и второго заключенного.
Второй заключенный | |||
признание | отказ | ||
Первый заключённый | признание | 2;2 | 0;5 |
отказ | 5;0 | 0,5; 0,5 |
Рис. 1.2 Матрица «дилеммы заключённых»
Видим, что ориентация только на личную выгоду (здесь минимальное заключение) является далеко неэффективным. Рациональные индивиды, преследующие собственный интерес, приходят к решению, которое хуже паретооптимального, т.е. к такому решению, когда стороны приобретают меньший выигрыш по сравнению с тем, который они получили бы при кооперативном (согласованном) поведении. Причина в том, что один из игроков опасается ещё большего срока, если другой игрок не захочет сотрудничать Парадокс «дилеммы заключённых» состоит в том, что индивидуальное максимизирующее поведение приводит к неоптимальному совокупному результату, который понимается как сумма функций полезности игроков. Это ситуация нарушения принципа «невидимой руки» А.Смита: рационально ведущие себя агенты попадают в «ловушку» неэффективных решений с точки зрения как индивидуального, так и общественного благосостояния.
Обобщённая для случая многих игроков «дилемма заключённых» становится вариантом так называемой «общинной трагедии»: в интересах каждого крестьянина добавит ещё одну корову к своему стаду, пасущемуся на общественном пастбище. Но в результате пастбище будет перегружено и удои каждой коровы и общий надой сократятся – проиграют все. Чрезмерные уловы каждой страны, занимающейся коммерческим рыболовством в какой-то зоне Мирового океана, - по существу «общинная трагедия». Или дилемма безопасности (гонки вооружений): государства стремятся обеспечить свою безопасность, угрожая безопасности других и планеты в целом.
Интересно, что «дилемма заключенных» и её обобщение «трагедия общины» (для повторяющейся игры) обеспечивает строгое обоснование категорического императива Канта (золотого правила христианства): «поступай так, как ты желаешь, чтобы поступали по отношению к тебе другие». Это правило отражает такую форму рациональности, которая принимает во внимание то обстоятельство, что эффективность стратегии может критически зависеть от того, насколько другие ее принимают, и то, что первоначально успешная стратегия может нанести поражение себе самой, поскольку её успех заставляет других её имитировать. Таким образом, «изменники» в «дилемме заключённых» могу вначале иметь успех в популяции тех, кто придерживается кооперативной стратегии. Но если этот успех ведёт к увеличению числа первых и уменьшению числа вторых, то он обращается в неудачу. Подобное рассуждение имеет очевидное отношение ко многим формам человеческих конфликтов.[6]