Занятие 7. Тема 3. Антагонистические игры.
Рассмотрим важный частный случай игр двух лиц – так называемые игры с нулевой суммой. Игры с нулевой суммой имеют вид , т.е. игроки 1 и 2 являются строгими антагонистами. Обозначим такую игру через , где - платеж, который игрок 1 максимизирует, а игрок 2 минимизирует.
Тогда осторожные стратегии могут быть заданы так:
;
.
Числа и являются соответственно максимальным гарантированным выигрышем игрока 1 (верхней ценой игры) и минимальным гарантированным проигрышем игрока 2 (нижней ценой игры). Они связаны неравенством
(3)
Для доказательства (3) фиксируем произвольные , и заметим, что
,
откуда следует
Если выполнено равенство , то говорят, что есть цена (значение) игры . Если (3) строгое неравенство, то говорят, что игра не имеет цены.
Теорема. Пусть - игра двух лиц с нулевой суммой. Если игра имеет цену, то она несущественна. Обратно, предположим, что , компактны, непрерывна; тогда, если несущественна, то она имеет цену.
Доказательство. Пусть имеет цену, и пусть исход таков, что
,
(4)
Поскольку (3) в силу существования цены обращается в равенство, то эти два неравенства на самом деле тоже равенства, и первое утверждение доказано.
Предположим теперь, что (3) – строгое неравенство. В силу предположений о компактности и непрерывности леммы 3 можно выбрать пару . Эта пара удовлетворяет системе (4), в которой хотя бы одно из неравенств строгое, и поэтому игра не может быть несущественной.
Для несущественных игр с нулевой суммой пара оптимальных стратегий является Седловой парой.
Определение. Седловая пара в игре двух лиц с нулевой суммой есть такая пара , что
Обозначим через S множество Седловых пар (возможно, пустое).
Теорема . Пусть - игра двух лиц с нулевой суммой. Если G имеет цену, то исход игры является парой оптимальных стратегий тогда и только тогда, когда он является седловой парой: Если G не имеет цены, то нет и седловой пары.
Доказательство. Предположим сначала, что игра имеет цену, тогда по теореме 1 она несущественна. По свойству 3 теоремы 1 получаем включение
Обратно, выберем седловую пару . Из определения 9.9
В силу (3) эти четыре неравенства обращаются в равенства, значит, хi – осторожная стратегия игрока i (i=1,2).
Теоремы показывают, что наличие или отсутствие цели игры является ключевой характеристикой игры с нулевой суммой. Если игра обладает ценой, то оптимальные стратегии существуют и определяются эквивалентно двумя способами: изолированно (как осторожные стратегии) и одновременно обоими игроками (как седловые пары).
Пример Пусть у обоих игроков имеется по три стратегии. Функция задается 3х3-матрицей, в которой строки соответствуют элементам множества Х1, а столбцы – элементом множества Х2. Рассмотрим следующую функцию выигрыша:
-2 | -3 | ||||
+ | -1 | -1 | |||
-3 | -2 | ||||
+ | + | ||||
У игрока 1 одна оптимальная стратегия (+), а у игрока 2 их две. Цена игры равна -1.
Пример. «раз-два-три». Игроки одновременно выбирают одну из трех стратегий «раз», «два» или «три». Выигрыш первого игрока положителен, если он правильно угадал выбор второго игрока, и нуль в противном случае. Выигрыши задаются матрицей:
раз | |||
два | |||
три | |||
раз | два | три |
Гарантированный выигрыш игрока 1 равен 0, и любая его стратегия является осторожной, так как гарантирует только 0.
Гарантированный проигрыш игрока 2 равен 1, и у него единственная осторожная стратегия «раз» (поскольку «два» и «три» могут дать проигрыш в размере 2 или 3).
Таким образом, цена игры здесь отсутствует.
Осторожное поведение игроков основано на предположении об их «полной изолированности», согласно которому каждый игрок ориентируется только на свою собственную функцию выигрыша и не обращает внимания на функции выигрыша остальных игроков.