Матричная игра как модель конкуренции и сотрудничества.
Пусть игроки – Первый и Второй , играют в матричную игру с матрицей A=ai j . Пусть стратегия Первого есть Р , а Второго Q. Тогда выигрыш Первого ксть с.в. W(P,Q) c рядом распределения:
W(P,Q):
a1 1 | ... | ai j | ... | am n |
p1 *q1 | ... | pi *pj | ... | pm *qn |
Математическое ожидание этой с.в., т.е. есть средний выигрыш Первого. Пусть D[W(P,Q)] есть дисперсия этой с.в. Естественно назвать среднее квадратическое отклонение с.в. W(P,Q) т.е.
риском для Первого при игре со стратегиями P,Q. Поскольку выигрыш Первого есть проигрыш для Второго, то W(P,Q) есть случайный проигрыш Второго и r вполне естественно можно назвать риском игры с такими стратегиями: P*=(p1*, ...,pm*) –Первый игрок и
Q*=(q1 * , ...,qn *) –Второй.
Математическое ожидание с.в.W(P,Q)называется ценой игры, обозначим ее v.
Но что же назвать риском всей игры?
Вычислим дисперсию выигрыша Первого при оптимальных стратегиях игроков.
Так как , а через Tj сумма обозначена .
Заметим , что в сумме можно оставить лишь те
слагаемые, у которых qj *>0.
Заметим теперь, что если Первый играет со стратегией P*, а второй отвечает j-ой чистой стратегией, то выигрыш первого есть с.в. с рядом распределения:
W(P*,Q*):
a1 1 | ... | ai j | ... | am n |
p1 ` | ... | pi ` | ... | pm ` |
Если Р* есть оптимальная стратегия Первого, а qj *>0, то из теории матричных игр с нулевой суммой известно, что выигрыш Первого при таких стратегиях по-прежнему равен цене игры v, а дисперсия выигрыша Первого при этом равна ,то есть равна Tj -v2 . Таким образом , что происходит с риском выигрыша Первого, можно понять, сравнив дисперсию при оптимальных стратегиях и дисперсию Dj =Tj - v2 или величины и D'=Tj . Пусть mT = min{Tj :q*j > 0}. Как легко понять, если среди {Tj :qj* >0} есть разные числа, то mT < D ’.
Теперь можно сделать следующий вывод: чуть-чуть обойдя от своей оптимальной стратегии и таким образом почти не уменьшив свой выигрыш, Первый может значительно уменьшить свой риск. При этом уменьшается и риск Второго, что отвечает и его интересам.
Чисто математически можно сказать , что в описанной ситуации риск выигрыша Первого не зависит от его стратегии непрерывно.
Рассмотрим решение игры 2*4 с матрицей ai j . Обозначим искомую оптимальную стратегию Первого (x,1-x)—это вектор столбец, но для удобства записывают его в виде строки. Обозначим v(x,j) –средний выигрыш 1-го в расчете на партию, когда Первый использует стратегию (x,1-x), а Второй- j-ую чистую стратегию, j=1,...4. Возьмем на плоскости систему координат, по горизонтали вправо откладываем х, а вертикальной оси – значение функции v(x,j). Масштаб по осям сделаем разный – ведь графики нужны только над отрезком [0,1]. Функция v(x,j) j=1,...4 линейные, значит, их графики – прямые линии I, II, III, IV соответственно. Находим нижнюю огибающую семейства этих четырех прямых над отрезком [0,1]. Находим самую высшую точку этой кривой. Она и дает решение этой игры. Эта точка есть пересечение двух прямых, откуда находим ее координаты – (х0 , v). Теперь оптимальная стратегия Первого есть [x0 ,1-x0], цена игры есть v. Оптимальная стратегия Второго находится так: берем указанные две прямые и обозначаем y,1-y –вероятности выборы Вторым столбца. Их чисел x0 ,1-x0 находим строго положительное. Теперь математическое ожидание проигрыша Второго против чистой стратегии Первого есть цена игры.
Матрица игры
.
Седловой точки в матрице нет.
Чтобы найти V и Р приравняем уравнения II и III прямых:
2-ой игрок не выбирает I и IVстолбец
Дисперсия выигрыша Первого при оптимальных стратегиях игроков:
r ≈ 2,3
2,3
7/13
Рис.1
Как видно из рисунка 1, при отходе Первого от своей оптимальной стратегии вправо, т.е. при увеличении вероятности х выбора им 1-й строки Второй начинает отвечать 2-й чистой стратегией и риск Первого скачком увеличивается до r1 (2) ≈2,4, а при отходе Первого от своей оптимальной стратегии влево второй переходит на свою 1-ю чистую стратегию и риск Первого скачком снижается до r1(1 )≈2,1.
2,3
24/39
Рис.2
Аналогичное верно и в отношении Второго. Примерная, но достаточно точная зависимость риска Второго в малой окрестности его оптимальной стратегии показана на рис.2. Как видно из рисунка 2, при отходе Второго от своей оптимальной стратегии вправо, т.е. при увеличении вероятности у выбора им 1-й строки Первый начинает отвечать 2-й чистой стратегией и риск Первого скачком уменьшается до r2 (2) ≈1,9, а при отходе Второго от своей оптимальной стратегии влево Первый переходит на свою 1-ю чистую стратегию и риск Второго скачком увеличивается до r2(1 ) ≈2,4.
Пусть r = min{r1(1), r1(2), r2(1), r2(2)}. Эту величину и можно назвать риском всей игры. Но играть с таким риском можно лишь при согласии обеих сторон. Для данной игры r* » 1,9, и игроки для достижения такого риска должны играть так: Первый играет со своей оптимальной стратегией Р* (7/13; 6/13), а Второй должен использовать 2-ю чистую стратегию.