О бесконечных антагонистических играх
Можно рассматривать бесконечные антагонистические игры, которые отличаются от матричных тем, что в них один или оба игрока имеют бесконечное множество стратегий.(например задачи поиска). Как правило, предполагается, что функция выигрыша ограничена. При этом схема исследования остается прежней, но с использованием более сложного аппарата. Принципом оптимального поведения игроков, как и ранее, является принцип равновесия. Понятия ситуации равновесия, седловых точек и оптимальных стратегий обобщаются.
Определение. Ситуация в антагонистической игре называется ситуацией e-равновесия,если для любых стратегий i и j игроков 1 и 2 соответственно выполняется неравенство
Точка называется e-седловой точкой, а стратегии называются e-оптимальными стратегиями игроков 1 и 2 соответственно.
Для таких игр остаются справедливыми утверждения относительно смешанных стратегий и доминирования стратегий.
ЗАДАЧИ И УПРАЖНЕНИЯ 1.
Решить матричную игру (то есть найти цену игры и оптимальные стратегии игроков):
1) 2) 3) 4) 5)
6) 7) 8) 9)
10) 11) 12)
13) Решить игру «чет-нечет»
14) Решить приведенную выше инспекционную игру для n=3, m=1 и для n=3, m=2.
Игры с непротивоположными интересами
Реальные задачи принятия решения в условиях конфликта характеризуются большим числом участников и, как следствие этого, неантагонистичностью конфликтной ситуации. Если говорить о конфликте двух лиц и его моделях, то можно заметить, что он также не исчерпывается только антагонистическим случаем. Интересы игроков могут не совпадать, но не быть обязательно противоположными. Это, в частности, может приводить к ситуациям, взаимовыгодным обоим игрокам (в антагонистическом конфликте это невозможно), что делает осмысленным кооперирование (выбор согласованного решения), приводящее к увеличению выигрыша обоих игроков. Однако возможны такие конфликты, когда кооперация или соглашение невозможны по правилам игры. Поэтому в неантагонистических играх различают бескоалиционное поведение, когда соглашения между игроками запрещены правилами, и кооперативное поведение игроков, когда разрешается кооперация типа выбора совместных стратегий и совершения побочных платежей. Рассмотрим первый случай.
Бескоалиционные игры.
Принципиальное отличие игр с непротивоположными интересами от антагонистических игр заключается в том, что сумма выигрышей игроков не равна нулю. Каждый игрок имеет свою функцию выигрыша, определенную на множестве исходов игры. Если игроков в игре всего 2, а множества чистых стратегий конечны, то игра называется биматричной.
Пример 1. («Семейный спор»). Муж (игрок 1) и жена (игрок 2) могут выбрать одно из вечерних развлечений: футбольный матч или театр. Если они не сойдутся во мнениях, то остаются дома. Муж предпочитает футбол, жена – театр. Однако обоим гораздо важнее провести вечер вместе, нежели разделиться. Их функции предпочтений (выигрыша) могут быть представлены двумя матрицами (откуда и происходит название этого класса игр). Пусть первая стратегия у обоих игроков – футбол, вторая – театр. Тогда:
(3.1)
Биматричную игру обычно представляют в более компактной форме, совмещая две матрицы в одной. В каждой клетке такой матрицы записывают два числа: сначала выигрыш первого игрока, затем второго. Таким образом, (3.1) можно переписать в виде:
Пример 2 (Перекресток). Два водителя одновременно выезжают на перекресток. Если ни один из них не остановится, то они столкнутся. Однако каждый предпочитает проехать первым, нежели пропустить партнера. Формализация этого конфликта представлена матрицей:
Пример 3 («Дилемма заключенного». Классическая формулировка дилеммы сводится примерно к следующему. Двоих подозреваемых сажают в разные камеры, не давая общаться друг с другом, и требуют от них признания в совершении тяжкого преступления. В случае, если оба не признаются, у следствия достаточно улик по другим пунктам обвинения, чтобы отправить обоих за решетку на 2 года. Если, однако, признается только один из заключенных, то с него снимаются все обвинения и он отпускается на свободу. Непризнавшийся в этом случае получает 10 лет тюрьмы. Если признаются оба, то оба получают по 5 лет тюрьмы. Оба заключенных в курсе этих правил игры.
признаваться | не признаваться | |
признаваться | -5, -5 | 0, -10 |
не признаваться | -10, 0 | -2, -2 |
Парадокс ситуации в том, что стратегия «признаваться» доминирует стратегию «не признаваться». Действительно, каждый игрок может рассуждать следующим образом. Предположим, мой партнер решил признаться. Каково лучшее решение с моей стороны в этом случае? Если я не признаюсь, то получу 10 лет, если признаюсь, то только 5. Лучше признаваться. Предположим теперь, что мой партнер решил не признаваться. Каково лучшее решение с моей стороны в этом случае? Если я не признаюсь, то получу 2 года, если признаюсь, то выйду на свободу. Опять лучшим для меня является признание. Таким образом, что бы не предпринял мой партнер, для меня будет лучше признаться. Если, однако, оба признаются, то оба получат по 5 лет, в то время как обоюдное непризнание было бы выгоднее обоим (по 2 года).
Структура игры «дилемма заключенного» (коротко ДЗ) весьма характерна для моделирования взаимодействия двух игроков в самых разных областях человеческой деятельности. Политическое/экономическое взаимодействие государств часто описывается в терминах конфликт (К) и сотрудничество (С). Ниже будет приведена матрица ДЗ, содержащая именно такие обозначения стратегий. Числа в ней отличаются от чисел матрицы ДЗ, приведенной выше, однако структура отношений предпочтения является точно такой же. В силу этого и стратегическое решение игры оказывается тем же. Предположим, что взаимодействие двух стран, включает такие аспекты, как экспорт страной 1 в страну 2 стали и импорт куриных окорочков. Ситация status quo представляет собой взаимовыгодное сотрудничество (С,С).
конфликт | сотрудничество | |
конфликт | 0, 0 | 10, -5 |
сотрудничество | -5, 10 | 5, 5 |
Предположим, страна 2 решила получить односторонние преимущества в торговом балансе и приняла меры, препятствующие импорту стали. В результате возникает ситуация (С,К), которая неприемлема для страны 1. В качестве ответной меры страна 1 налагает запрет на ввоз окорочков. В результате возникает ситуация (К,К), которая менее выгодна обеим сторонам, чем ситуация status quo.