Решение матричных игр со смешанным расширением методами линейного программирования

Решение матричной игры со смешанным расширением – это определение оптимальных смешанных стратегий, то есть нахождение таких значений вероятностей выбора чистых стратегий для обоих игроков, при которых они достигают наибольшего выигрыша.

Для матричной игры, платёжная матрица которой показана на рис. 1.1, Vн ¹ Vв , определим такие значения вероятностей выбора стратегий для игрока 1 (p1, p2 ,…, pm) и для игрока 2 (q1, q2 ,…, qn), при которых игроки достигали бы своего максимально гарантированного выигрыша.

Если один из игроков придерживается своей оптимальной стратегии, то, по условию задачи, его выигрыш не может быть меньше цены игры V. Поэтому данная задача может быть представлена для игроков в виде следующих систем линейных неравенств:

Для первого игрока:

 
  Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Для второго игрока:

 
  Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Чтобы определить значение V, разделим обе части каждого из уравнений на V. Величину pi/V обозначим через xi, а qj/V – через yj.

 
  Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Для игрока 1 получим следующую систему неравенств, из которой найдём значение 1/v:

Для игрока 1 необходимо найти максимальную цену игры (V). Следовательно, значение 1/V должно стремиться к минимуму.

Целевая функция задачи будет иметь следующий вид:

min Z = min 1/V = min (x1 + x2 + … + xm)

Для игрока 2 получим следующую систему неравенств, из которой найдём значение 1/v:

 
  Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Для игрока 2 необходимо найти минимальную цену игры (V). Следовательно, значение 1/V должно стремиться к максимуму.

Целевая функция задачи будет иметь следующий вид:

max Z = max 1/V = max (y1 + y2 + … + yn)

Все переменные в данных системах линейных неравенств должны быть неотрицательными: xi = pi/V, а yi = qj/V. Значения pi и qj не могут быть отрицательными, так как являются значениями вероятностей выбора стратегий игроков. Поэтому необходимо, чтобы значение цены игры V не было отрицательным. Цена игры вычисляется на основе коэффициентов выигрышей платёжной матрицы. Поэтому, для того, чтобы гарантировать условие неотрицательности для всех переменных, необходимо, чтобы все коэффициенты матрицы были неотрицательными. Этого можно добиться, прибавив перед началом решения задачи к каждому коэффициенту матрицы число K, соответствующее модулю наименьшего отрицательного коэффициента матрицы. Тогда в ходе решения задачи будет определена не цена игры, а величина V* = V + K.

Для решения задач линейного программирования используется симплекс-метод. [1, 5].

В результате решения определяются значения целевых функций (для обоих игроков эти значения совпадают), а также значения переменных xi и yj .

Величина V* определяется по формуле: V* = 1/z

Значения вероятностей выбора стратегий определяются: для игрока 1: Pi = xi×V*: для игрока 2: qi = yi×V*.

Для определения цены игры V из величины V* необходимо вычесть число K.

Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru
Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Решение матричных игр со смешанным расширением методами линейного программирования - student2.ru

Наши рекомендации