Матричная игра с нулевой суммой как модель сотрудничества и конкуренции
Пусть игроки – Первый и Второй, играют в матричную игру с матрицей . Пусть стратегия Первого есть , а Второго – . Тогда выигрыш Первого есть случайная величина (с.в.) с рядом распределения:
W(P,Q) | a11 | ... | aij | ... | amn | ||||
p1q1 | ... | piqj | ... | pmqn |
Математическое ожидание этой с.в., т.е. есть средний выигрыш Первого. Пусть есть дисперсия этой с.в. Естественно назвать среднее квадратическое отклонение с.в. , т.е. риском для Первого при игре со стратегиями . Поскольку выигрыш Первого есть проигрыш для Второго, то есть случайный проигрыш Второго и вполне естественно можно назвать риском игры с такими стратегиями и для Второго.
Предположим сначала, что игроки озабочены только максимизацией среднего дохода за партию игры – обычная цель в таких играх. Тогда игроки будут играть со своими оптимальными стратегиями: – Первый игрок и – Второй.
Математическое ожидание с. в. называется ценой игры, обозначим ее .
Вычислим дисперсию выигрыша Первого при оптимальных стратегиях игроков.
.
Так как .
Заметим теперь, что если Первый играет со стратегией , а Второй отвечает -й чистой стратегией, то выигрыш первого есть с.в. с рядом распределения:
W(P*,j) | a1j | ... | aij | ... | amj | ||||
p1* | ... | pi* | ... | pm* |
Если есть оптимальная стратегия Первого, а , то из теории матричных игр с нулевой суммой известно, что выигрыш Первого при таких стратегиях по-прежнему равен цене игры , а дисперсия выигрыша Первого при этом равна .
Теперь можно сделать следующий вывод:
Чуть-чуть отойдя от своей оптимальной стратегии (смотрите ниже Пример) и таким образом почти не уменьшив свой выигрыш, Первый может значительно уменьшить свой риск. При этом уменьшается и риск Второго, что отвечает и его интересам.
Чисто математически можно сказать, что в описанной ситуации риск выигрыша Первого не зависит от его стратегии непрерывно.
Рассмотрим подробно пример матричной игры с матрицей . Как известно, общий случай в окрестности оптимальных стратегий игроков сводится к анализу такой игры.
Пусть матрица игры есть . Графическое решение этой игры показано на рисунке.
На рисунке ищем верхнюю точку O нижней огибающей. Эта точка показывает цену игры и оптимальную стратегию первого игрока:
Таким образом, получаем: цена игры – V=-1,5; стратегия первого игрока (0,5; 0,5).
Рассмотрим стратегию 2-го игрока:
Так как прямые V1 и V2 находятся выше точки O, то вероятности 1-й и 2-й стратегий равны 0.
Оптимальные стратегии:
Пусть игроки играют в матричную игру со стратегиями P , Q. Тогда выигрыш 1-го игрока есть с.в. и ее СКО (Среднее Квадратическое Отклонение) называется риском игры со стратегиями P, Q, обозначается r[P,Q]. Пусть игроки играют в матричную игру 2х4. В общем случае, 2-й игрок при своей оптимальной стратегии два столбца выбирать не будет, следовательно, фактически игра свелась к матричной игре 2х2, обозначим оптимальные стратегии игроков в этой игре через P, Q. Найдем четыре риска r[P,1], r[P,2], r[1,Q], r[2,Q] и найдем из них наименьший, это значение и называется риском игры.
D1=0,5*16+0,5*1-2,25=6,25; r(P,1)=2,5;
D2=2,25; r(P,2)=1,5;
D3=3,75; r(1,Q) ≈1,94;
D4=3,75; r(2,Q) ≈1,94;
Минимальное значение r=1,5 можно назвать риском всей игры. Однако играть с таким риском можно лишь при согласии обеих сторон. Для анализируемой игры игроки для достижения такого риска должны играть так: первый играет со своей оптимальной стратегией, а второй должен использовать 2-ю чистую стратегию.