Тема 3. ТЕОРИЯ ИГР И МОДЕЛИРОВАНИЕ ВЗАИМОДЕЙСТВИЙ
Лекция №5. ОСНОВНЫЕ ПОНЯТИЯ ТЕОРИИ ИГР
Определив предмет институционализма как анализ взаимодействия индивидов и структур, его обеспечивающих, необходимо обратиться к вопросу о методе. Математический аппарат, традиционно используемый экономистами (дифференциальное исчисление), вряд ли приемлем в качестве базового метода в анализе взаимодействий. Главным образом потому, что использование этого аппарата обосновывается рядом утверждений из "жесткого ядра" неоклассики, с которыми соглашаются далеко не все институционалисты: полной рациональностью индивидов; существованием, единственностью и Парето-оптимальностью равновесия; экзогенным характером предпочтений, описываемых ординалистской теорией предельной полезности.
Формальные модели в институциональной экономике строятся с помощью теории игр, развитие которой берет отсчет с момента появления книги Дж. фон Неймана и О. Моргенштерна "Теория игр и экономическое поведение" (1944). Во-первых, теория игр занимается анализом ситуаций, в которых поведение индивидов взаимообусловлено: решение каждого из них оказывает влияние на результат взаимодействия и, следовательно, на решения остальных индивидов. Решая вопрос о своих действиях, индивид вынужден ставить себя на место контрагентов. Во-вторых, теория игр не требует полной рациональности индивидов, в ней используется целый ряд моделей индивидов, от индивида как совершенного калькулятора до индивида как робота. В-третьих, теория игр не предполагает существования, единственности и Парето-оптимальности равновесия во взаимодействиях. Эти причины и обусловливают наш интерес к формальным моделям институтов, построенным с помощью теории игр. Обратимся к их анализу более подробно.
Первое уточнение касается кооперативных и некооперативных игр. В кооперативных играх возможны обмен информации между участниками и формирование коалиций. В некооперативных играх, о которых и пойдет в основном речь, исходным пунктом в анализе является индивидуальный участник, причем обмен информации между участниками и формирование коалиций исключены. Далее, игра может быть представлена либо в стратегической (матричной), либо в развернутой форме1. Например, вернемся к упомянутой в предыдущих лекциях "дилемме заключенных" (рис. 5.1).
Рис. 5.1
Первые цифры в описании результатов взаимодействия отражают полезность первого участника, вторые – второго: U1 (признавать, при условии, что второй не признает) = 3. Напомним, что здесь речь идет о "полезности" различных сроков осуждения, которая обратно пропорциональна их величине.
Типы равновесий
В каждом взаимодействии могут существовать различные виды равновесий: равновесие доминирующих стратегий, равновесие по Нэшу, равновесие по Штакельбергу и равновесие по Парето. Доминирующей стратегией называется такой план действий, который обеспечивает участнику максимальную полезность вне зависимости от действий другого участника. Соответственно, равновесием доминирующих стратегий будет пересечение доминирующих стратегий обоих участников игры. Равновесие по Нэшу – ситуация, в которой стратегия каждого из игроков является лучшим ответом на действия другого игрока. Иными словами, это равновесие обеспечивает игрока максимумом полезности в зависимости от действий другого игрока. Равновесие по Штакельбергу возникает тогда, когда существует временной лаг в принятии решений участниками игры: один из них принимает решения, уже зная, как поступил другой. Таким образом, равновесие по Штакельбергу соответствует максимуму полезности игроков в условиях неодновременности принятия ими решений. В отличие от равновесия доминирующих стратегий и равновесия по Нэшу этот вид равновесия существует всегда. Наконец, равновесие по Парето существует при условии, что нельзя увеличить полезность обоих игроков одновременно. Рассмотрим на одном из примеров технологию поиска равновесий всех четырех видов.
Доминирующая стратегия –такой план действий, который обеспечивает участнику максимальную полезность вне зависимости от действий другого участника,
Равновесие по Нэшу– ситуация, в которой ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, меняя свой план действий.
Равновесие по Штакельбергу– ситуация, когда ни один из игроков не может увеличить свой выигрыш в одностороннем порядке, а решения принимаются сначала одним игроком и становятся известными второму игроку.
Равновесие по Парето– ситуация, когда нельзя улучшить положение ни одного из игроков, не ухудшая при этом положения другого.
Пусть фирма А стремится нарушить монополию фирмы Б на выпуск определенного продукта. Фирма А решает, стоит ли ей входить на рынок, а фирма Б – стоит ли ей снижать выпуск в том случае, если А все же решает входить2. В случае неизменного выпуска на фирме Б обе фирмы в проигрыше, если же фирма Б решает снизить выпуск, то она "делится" своей прибылью с А.
• Равновесие доминирующих стратегий. Фирма А сравнивает свой выигрыш при обоих вариантах развития событий (-3 и 0, если Б решает развязать ценовую войну) и (4 и 0, если Б решает снизить выпуск). У нее нет стратегии, обеспечивающей максимальный выигрыш вне зависимости от действий Б: 0 > -3 "не входить на рынок", если Б оставляет выпуск на прежнем уровне, 4 > 0 "входить", если Б снижает выпуск (см. сплошные стрелки). Хотя у фирмы А нет доминирующей стратегии, у Б такая стратегия есть. Она заинтересована снижать выпуск вне зависимости от действий А (4 > -2, 10 10, см. пунктирные стрелки). Следовательно, равновесие доминирующих стратегий отсутствует.
• Равновесие по Нэшу. Лучший ответ фирмы А на решение фирмы Б оставить выпуск прежним – не входить, а на решение снизить выпуск – входить. Лучший ответ фирмы Б на решение фирмы А войти на рынок – снизить выпуск, при решении не входить – обе стратегии равнозначны. Поэтому два равновесия по Нэшу (N1, N2) находятся в точках (4, 4) и (0, 10) – А входит, а Б снижает выпуск, или А не входит, а Б не снижает выпуск. Убедиться в этом достаточно легко, так как в этих точках никто из участников не заинтересован в изменении своей стратегии.
• Равновесие по Штакельбергу. Предположим, первой принимает решение фирма А. Если она выбирает входить на рынок, то в конечном счете окажется в точке (4, 4): выбор фирмы Б однозначен в этой ситуации, 4 > -2. Если она решает воздержаться от входа на рынок, то итогом будут две точки (0, 10): предпочтения фирмы Б допускают оба варианта. Зная это, фирма А максимизирует свой выигрыш в точках (4, 4) и (0, 10), сравнивая 4 и 0. Предпочтения однозначны, и первое равновесие по Штакельбергу StAбудет находиться в точке (4, 4). Аналогичным образом, равновесие по Штакельбергу StБ, когда первой принимает решение фирма Б, будет находиться в точке (0, 10).
• Равновесие по Парето. Чтобы определить оптимум по Парето, мы должны последовательно перебрать все четыре исхода игры, отвечая на вопрос: "Обеспечивает ли переход к любому другому исходу игры увеличение полезности одновременно для обоих участников?" Например, из исхода (-3, -2) мы можем перейти к любому другому исходу, выполняя указанное условие. Только из исхода (4, 4) мы не можем двинуться дальше, не уменьшая при этом полезности ни одного из игроков, это и будет равновесием по Парето, Р.
Классификация моделей
Теперь рассмотрим несколько базовых для теории игр моделей. Эти модели отличаются количеством точек равновесия по Нэшу и их совпадением или несовпадением с точками равновесия по Штакельбергу и по Парето. В общем виде типология моделей для двух участников, используемых в теории игр, будет выглядеть следующим образом3:
N St | |||
- | I. N1 = St1 = St2 = P N2 | II. N = St1 = St2 = P | |
III. N = St1 = St2 P | |||
IV. N1 = St1= P1 (N2 = St2 = P2) | V. N = St1 + P1 (St2 = P2) | VII. St1 = P1 (St2 = P2) | |
VI. N = St1 , (St2 = P) | VIII. St1 = P St2 |
Модель I касается выбора двумя студентами места встречи: каждого из них при желании можно найти либо в библиотеке, либо в буфете. Предполагается, что встреча в буфете обеспечит обоим студентам большую полезность, они смогут сопроводить ее чашкой кофе или кружкой пива:
Эта игра особенно интересна в связи с тем, что с ее помощью иллюстрируется идея "фокальной точки"4 – спонтанно выбираемого обоими студентами места встречи. Если оба хорошо знают друг друга, то им не составит особого труда предположить место, где они смогут найти друг друга. По всей вероятности "фокальной точкой" чаще всего будет буфет.
Модель II иллюстрируется ситуацией "конфликта между супругами в жесткой форме". Супруги решают, каким образом провести вечер, выбирая между двумя альтернативами – идти на концерт или на футбольный матч. Индивидуальные предпочтения очевидны: жена предпочитает концерт, муж – матч, и при этом супруги достаточно низко оценивают удовольствие от совместно проведенного вечера:
Игра интересна тем, что здесь у обоих участников есть доминирующая стратегия (х), идти на концерт – для супруги, идти на матч – для супруга.
Следующая модель III – уже обсуждавшаяся "дилемма заключенных":
Модель IV является вариацией по поводу конфликта между супругами, но на этот раз в мягкой форме. Единственное отличие от конфликта в жесткой форме – супруги высоко оценивают удовольствие от совместно проведенного вечера:
"Проблема разоружения" иллюстрирует модель V. Страна А решает вопрос, развязывать ли войну в отношении страны Б или нет, страна же Б выбирает, вооружаться ли ей или разоружаться. Проблема в том, что разоруженная страна Б станет легкой добычей для агрессора А, а вооруженная сможет адекватно ответить на агрессию:
Ситуация тяжелого морального выбора, связанного с принятием решения о просмотре эротического фильма "9 1/2 недель", является иллюстрацией модели VI. Первый потенциальный зритель будет сожалеть, если ему не удастся увидеть фильм, но если он его все же начинает смотреть, то ему становится стыдно. Для второго зрителя, ханжи, просмотр фильма следует запретить всем, но если уж его смотреть, то только ему одному.
Модель VII может быть представлена в форме следующей игры. Каждый игрок в начале игры имеет 2 дол. и кладет половину этой суммы в коробку. Затем коробка передается первому игроку, который может либо оставить ее себе, либо выбросить в колодец. Второй участник должен предсказать поведение первого, и если ему это удается, то он получает 1 дол. (который оставался у первого). Если же ему не удается угадать, то он отдает первому игроку остававшийся у него доллар. Кроме того, если коробку не бросают в колодец, то игроки делят между собой находящуюся в ней сумму.
Наконец, взаимоотношения государства и инвестора описываются моделью VIII. У инвестора есть два варианта действий – инвестировать в стране или не инвестировать. Государство же может устанавливать высокое налогообложение доходов от инвестиций или отменить налоги вообще.
Выводы.Рассмотренные модели позволяют увидеть и проанализировать проблемы, возникающие в ходе взаимодействий индивидов5:
• Проблема координации возникает в случае существования двух точек равновесия по Нэшу (модели I, IV). Решение проблемы координации связано с введением дополнительных институциональных условий, существования "фокальных точек" или соглашений. Например, согласование супругами своих действий существенно облегчается при наличии соглашения о приоритете интересов супруги.
• Проблема совместимости характерна для ситуаций, когда равновесие по Нэшу отсутствует (модели VII, VIII). Индивиды не могут согласовать свои действия, если институты не ограничивают и не "направляют" выбор стратегий. Например, введение во взаимоотношения государства и инвестора фактора репутации государства позволяет остановиться на исходе (2, 3).
• Проблема кооперации – равновесие по Нэшу существует, оно единственно, но Парето-неоптимально (модель III – "дилемма заключенных"). И в этой ситуации введение институционального ограничения, нормы "не признавать вину никогда", как мы уже видели на примере итальянской мафии, обеспечивает достижение оптимального по Парето результата.
• Проблема справедливости становится актуальной, если единственное равновесие по Нэшу характеризуется асимметричным, несправедливым распределением выигрыша между участниками взаимодействия (модели V, VI). Одним из вариантов решения проблемы несправедливости будет переход к повторяющимся играм и возникновение норм на основе "смешанных" стратегий, когда в момент времени t0индивид выбирает стратегию А, а в момент времени t1 – стратегию Б и т. д.