Решение игры в общем виде. Сведение задачи по теории игр к паре взаимодвойственных задач линейного программирования
Если игра т х п не имеет оптимального решения непосредственно в чистых стратегиях, то оптимальное решение необходимо искать в области смешанных стратегий. Игрок А обладает стратегиями А1, А2,…, Аm, а игрок В – стратегиями B1, B2,…, Bn. Необходимо определить оптимальные стратегии и , где - вероятности применения соответствующих чистых стратегий Аi, Bj. При этом и .
Если игрок А применяет смешанную стратегию против любой чистой стратегии Вj игрока В, то он получает средний выигрыш (математическое ожидание выигрыша):
Для оптимальной стратегии все средние выигрыши не меньше выигрыша игры v, поэтому получаем систему неравенств:
a11p1+ a21p2+…+ am1pm ≥ v
a12p1+ a22p2+…+ am2pm ≥ v
………………………………
a1np1+ a2np2+…+ amnpm ≥ v
Если каждое неравенство разделить на число v>0 (v>0 можно добиться, сделав все элементы aij ≥ 0) и введя новые переменные:
x1=p1/v, x2=p2/v, …., xm=pm/v
предыдущая система примет вид:
a11x1+ a21x2+…+ am1xm ≥ 1
a12x1+ a22x2+…+ am2xm ≥ 1
………………………………
a1nx1+ a2nx2+…+ amnxm ≥ 1
Если нормировочное условие, выраженное равенством p1+ p2+…+ pm =1 разделить также на v, тополучим, что переменные x1+x2+…+xm=1/v. В силу того, что цель игрока А максимизировать свой выигрыш, т.е. максимизировать цену игры v, максимизация цены игры v эквивалентна минимизации величины 1/v. Поэтому задача в терминах линейного программирования может быть сформулирована следующим образом:
Найти минимум целевой функции Z = x1+x2+…+ xm при ограничениях. Тем самым получаем задачу линейного программирования, решая которую получим оптимальную стратегию и цену игры v=1/Z.
Для определения оптимальной стратегии игрока В следует учесть, что игрок стремится минимизировать гарантированный выигрыш, т.е. найти max 1/v. Переменные q1, q2,…, qn удовлетворяют неравенствам
a11q1+ a12q2+…+ a1nqn ≤ v
a21q1+ a22q2+…+ a2nqn ≤ v
………………………………
am1q1+ am2q2+…+ amnqn ≤ v
Если также как и в предыдущем случае ввести новые переменные:
y1=q1/v, y2=q2/v, …., yn=qn/v,
то предыдущая система примет вид:
a11y1+ a12y2+…+ a1nyn ≤ 1
a21y1+ a22y2+…+ a2nyn ≤ 1
……………………………
am1y1+ am2y2+…+ amnyn ≤ 1,
а задача сводится к задаче линейного программирования, в которой надо найти максимум целевой функции Z’ = y1+y2+…+ yn при заданных системой ограничениях.
Решение задачи линейного программирования определяет оптимальную стратегию . При этом цена игры
v = 1/max Z' = 1/min Z.
Пример . Найти решение игры со следующей платежной матрицей:
С=
Так как матрица не имеет седловой точки, то ее решение будем искать в смешанных стратегиях. Математические модели будут состоять из пары двойственных задач линейного программирования. Первая задача на нахождение минимума функции F(x) = x1+ x2+ x3
При следующих ограничениях:
2x1+4x2+ x3 ≥ 1
3x1+2x2+3x3 ≥ 1
x1+2x2+4x3 ≥ 1
xi ≥ 0, i=1,3
где , i=1,3
Вторая задача будет на нахождение максимума функции Z(y)=y1+y2+y3
При следующих ограничениях:
2y1+3y2+ y3 ≤ 1
4y1+2y2+ 2y3 ≤ 1
y1+3y2+ 4y3 ≤ 1
yi ≥ 0, i=1,3
где , i=1,3
Решение задач может быть выполнено симплекс-методом.
Задачи для самостоятельного решения.
Составив прямую и двойственную задачи линейного программирования решить задачи:
1. 2. 3.
4. 5. 6.
7. 8. 9.
10. 11. 12.