Геометрическая интерпретация игры 2 х 2
Решение игры 2´2 допускает наглядную геометрическую интерпретацию.
Пусть игра задана платежной матрицей Р=(aij), i,j=1,2. На оси абсцисс отложим единичный отрезок А1А2. Левый конец отрезка - точка А1 (x=0) соответствует стратегии A1, правый стратегии A2. Все промежуточные точки х этого отрезка соответствуют некоторым смешанным стратегиям SA 1-го игрока, где р1=1-x, р2=x. На концах выбранного отрезка проведем прямые, перпендикулярные оси абсцисс, на них будем откладывать выигрыши при соответствующих чистых стратегиях А1 и А2. Если игрок B применяет стратегию B1, то выигрыш при использовании чистых стратегий A1 и A2 составляет соответственно a11 и a21. Отложим эти точки на прямых и соединим полученные точки прямой B1B1. Средний выигрыш n1, соответствующий смешанной стратегии SA, определяется по формуле математического ожидания и равен ординате точки M1, лежащей на прямой B1B1 (рис. 1).
Таким образом, если игрок А применяет смешанную стратегию, то его выигрышу соответствует некоторая точка М, лежащая на этой прямой.
Аналогично можно построить отрезок B2B2, соответствующий стратегии B2 игрока B (рис. 2). При этом средний выигрыш - ордината точки M2.
В соответствии с принципом минимакса оптимальная стратегия S*A такова, что минимальный выигрыш игрока А (при наихудшем поведении игрока В) обращается в максимум. Ординаты точек, лежащих на ломаной B1KB2 (рис. 3), показывают минимальный выигрыш игрока А при использовании им любой смешанной стратегии (на участке В1К – против стратегии В1, на участке КВ2 - против стратегии В2). Т.о., ломаная B1KB2 является нижней границей выигрыша, получаемого игроком A. Оптимальную стратегию S*A=(р*1,р*2) определяет точка K с координатами (x,y), в которой минимальный выигрыш достигает максимума, ее ордината равна цене игры: y= v, абсцисса х= р*1.
Чтобы найти координаты точки К, найдем уравнения прямых В1В1 и В2В2, на пересечении которых она лежит. Прямая В1В1 проходит через точки (0,а11) и (1,а12), подставив эти точки поочередно в общий вид уравнения прямой y=kx+b, получим ее уравнение y=k1x+b1. Аналогично, прямая В2В2 проходит через точки (0,а21) и (1,а22), получим ее уравнение y=k2x+b2. Решив систему получим координаты точки К х и y. Тогда, р*1=х , р*2=1-х и
v =y.
Используя геометрическую интерпретацию, можно найти решение игр 2´n. Каждой из n стратегий игрока B соответствует прямая. Построив эти прямые, находят нижнюю границу выигрыша. Точка K, лежащая на нижней границе, для которой величина выигрыша наибольшая, определяет цену игры и ее решение. При этом определяются активные стратегии игрока B (соответствующие им прямые пересекаются в точке K); из геометрических соображений можно найти значения qj , соответствующие активным стратегиям игрока B.
Аналогично может быть решена игра m´2, только в этом случае строят верхнюю границу выигрыша и на ней определяют минимум.
Следует отметить, что геометрические построения имеет смысл использовать для определения активных стратегий игроков. Затем решение игры можно получить с помощью формул (3) – (5), или соответствующие значения SA, SB и v находят из геометрических соображений. Формулы (3) – (5) можно использовать, так как из соответствующей матрицы исключаются все стратегии, кроме активных, и она содержит две строки и два столбца.
Пример 4. Предприятие может выпускать два вида продукции А1 и А2, получая при этом прибыль, зависящую от спроса, который может быть в одном из 4-х состояний В1, В2, В3, в4. Дана матрица
A = , элементы которой aij характеризуют прибыль, которую получит предприятие при выпуске i-ой продукции с j-м состоянием спроса .
Определить оптимальные пропорции в выпускаемой продукции, гарантирующие среднюю величину прибыли при любом состоянии спроса, считая его неопределенным.
Решение. Задача сводится к игровой модели, в которой игра предприятия А против спроса В задана платежной матрицей А.
Определяем верхнюю и нижнюю цены игры и проверяем, имеет ли игра седловую точку.
Нижняя цена игры .
Верхняя ценя игры . Седловая точка отсутствует. Решение игры S*A= (р1*,р2*), S*B= (q1*, q2*, q3*, q4*) и n следует искать в смешанных стратегиях.
Откладываем на оси абсцисс (рис.4) единичный отрезок А1А2 . На левой вертикальной оси откладываем отрезки а11=2, а12=4, а13=1.5, а14=3, соответствующие стратегиям В1, В2, В3, В4. На правой вертикальной оси откладываем отрезки а21=4, а22=3, а23=2, а24=1, соответствующие тем же стратегиям В1, В2, В3, В4. Ломаная B3KB4 соответствует нижней границе выигрыша. Активные стратегии игрока B – третья и четвертая, тогда q1*=0, q2*=0. Следовательно платежную матрицу можно упростить: A = .
Ломаная B3KB4 является нижней границей выигрыша, получаемого игроком A. Оптимальную стратегию S*A=(р*1,р*2) определяют точка K с координатами (x,y). Ее ордината y равна цене игры: y= v, абсцисса х= р*1.
Чтобы найти координаты точки К, найдем уравнения прямых В3В3 и В4В4, на пересечении которых она лежит. Прямая В3В3 проходит через точки (0;1) и (1;2), подставив эти точки поочередно в общий вид уравнения прямой y=kx+b, получим ее уравнение y=0.5x+1.5. Аналогично, прямая В4В4 проходит через точки (0;3) и (1;1), получим ее уравнение y=-2x+3. Решив систему получим координаты точки К х=0.6 и y=1.8. Тогда, р*2=х=0.6 , р*1=1-х=0.4 и v =y=1.8.
Следовательно, S*A = (0,4; 0,6), т.е. игрок A применяет стратегию A1 c вероятностью 0,4, а стратегию A2 – с вероятностью 0,6. При этом его выигрыш в среднем составит v=1,8 ед.
Оптимальные стратегии игрока В найдем с помощью формул (3)-(5). Запишем систему уравнений Т.к. цена игры нами уже найдена v=1,8, то систему можно упростить: Решив систему, получаем оптимальную стратегию спроса В S*B= (0, 0, 0.8,0.2)
С экономической точки зрения можно сделать вывод, что предприятие должно выпустить 40% продукции А1 и 60% продукции А2. А оптимальный спрос в 80% находится в состоянии В3 и в 20% - в состоянии В4.
Пример 5. Найти решение игры, заданной матрицей A = .
Решение. Матрица имеет размерность 2´4. На рис. 5 построены прямые, соответствующие стратегиям игрока A. Жирной линией на рис. 5 изображена верхняя граница выигрыша игрока A.
Найдя верхнюю и нижнюю цену игры, определяем, что игра без седловой точки.
Точка K определяет цену игры. Активными стратегиями для игрока A являются первая и четвертая. Следовательно, платежную матрицу можно упростить: A = . Стратегию S*B= (q1, q2 ) и цену игры v находим геометрическим способом, найдя уравнения прямых А1А1 и А4А4 ( см. пример 4) и определив координаты точки К. Получаем S*B =(3/8; 5/8); v=27/8. Стратегию S*A=(р*1,р*2, р*3, р*4)= (р*1, 0, 0, р*4) найдем по формулам (3)-(5) : S*A =(7/8;0; 0; 1/8).