Матричная игра с нулевой суммой как модель сотрудничества и конкуренции
Пусть игроки – Первый и Второй, играют в матричную игру с матрицей . Пусть стратегия Первого есть
, а Второго –
. Тогда выигрыш Первого есть случайная величина (с.в.)
с рядом распределения:
W(P,Q) | a11 | ... | aij | ... | amn | ||||
p1q1 | ... | piqj | ... | pmqn |
Математическое ожидание этой с.в., т.е. есть средний выигрыш Первого. Пусть
есть дисперсия этой с.в. Естественно назвать среднее квадратическое отклонение с.в.
, т.е.
риском для Первого при игре со стратегиями
. Поскольку выигрыш Первого есть проигрыш для Второго, то
есть случайный проигрыш Второго и
вполне естественно можно назвать риском игры с такими стратегиями и для Второго.
Предположим сначала, что игроки озабочены только максимизацией среднего дохода за партию игры – обычная цель в таких играх. Тогда игроки будут играть со своими оптимальными стратегиями: – Первый игрок и
– Второй.
Математическое ожидание с. в. называется ценой игры, обозначим ее
.
Вычислим дисперсию выигрыша Первого при оптимальных стратегиях игроков.
.
Так как .
Заметим теперь, что если Первый играет со стратегией , а Второй отвечает
-й чистой стратегией, то выигрыш первого есть с.в. с рядом распределения:
W(P*,j) | a1j | ... | aij | ... | amj | ||||
p1* | ... | pi* | ... | pm* |
Если есть оптимальная стратегия Первого, а
, то из теории матричных игр с нулевой суммой известно, что выигрыш Первого при таких стратегиях по-прежнему равен цене игры
, а дисперсия выигрыша Первого при этом равна
.
Теперь можно сделать следующий вывод:
Чуть-чуть отойдя от своей оптимальной стратегии (смотрите ниже Пример) и таким образом почти не уменьшив свой выигрыш, Первый может значительно уменьшить свой риск. При этом уменьшается и риск Второго, что отвечает и его интересам.
Чисто математически можно сказать, что в описанной ситуации риск выигрыша Первого не зависит от его стратегии непрерывно.
Рассмотрим подробно пример матричной игры с матрицей . Как известно, общий случай в окрестности оптимальных стратегий игроков сводится к анализу такой игры.
Пусть матрица игры есть . Графическое решение этой игры показано на рисунке.
На рисунке ищем верхнюю точку O нижней огибающей. Эта точка показывает цену игры и оптимальную стратегию первого игрока:
Таким образом, получаем: цена игры – V=-1,5; стратегия первого игрока (0,5; 0,5).
Рассмотрим стратегию 2-го игрока:
Так как прямые V1 и V2 находятся выше точки O, то вероятности 1-й и 2-й стратегий равны 0.
Оптимальные стратегии:
Пусть игроки играют в матричную игру со стратегиями P , Q. Тогда выигрыш 1-го игрока есть с.в. и ее СКО (Среднее Квадратическое Отклонение) называется риском игры со стратегиями P, Q, обозначается r[P,Q]. Пусть игроки играют в матричную игру 2х4. В общем случае, 2-й игрок при своей оптимальной стратегии два столбца выбирать не будет, следовательно, фактически игра свелась к матричной игре 2х2, обозначим оптимальные стратегии игроков в этой игре через P, Q. Найдем четыре риска r[P,1], r[P,2], r[1,Q], r[2,Q] и найдем из них наименьший, это значение и называется риском игры.
D1=0,5*16+0,5*1-2,25=6,25; r(P,1)=2,5;
D2=2,25; r(P,2)=1,5;
D3=3,75; r(1,Q) ≈1,94;
D4=3,75; r(2,Q) ≈1,94;
Минимальное значение r=1,5 можно назвать риском всей игры. Однако играть с таким риском можно лишь при согласии обеих сторон. Для анализируемой игры игроки для достижения такого риска должны играть так: первый играет со своей оптимальной стратегией, а второй должен использовать 2-ю чистую стратегию.