Решение матричных игр в чистых стратегиях

Целью участников любой матричной игры является выбор наиболее выгодных стратегий, доставляющих игроку А максимальный выигрыш, а игрок В минимальный проигрыш. Стратегию игрока А называют оптимальной, если при ее применении выигрыш игрока А не уменьшается, какими бы стратегиями не пользовался игрок В. Оптимальный для игрока В называют стратегию, при использовании которой проигрыш игрока В не увеличивается, какие бы стратегии не применял игрок А.

При поиске оптимальных стратегий игроки опираются на основополагающий принцип теории игр – принцип осторожности.В соответствии с этим принципом каждый игрок, считает партнера по игре весьма разумным противником и выбирает свои действия в предположении, что соперник ни в коем случае не упустит ни единой возможности использовать любую его ошибку, любой промах в своих интересах.

Поэтому игроки должны быть предельно внимательны при выборе каждой своей чистой стратегии.

Предположим, что игроку А надлежит сделать свой выбор. Анализируя платежную матрицу (таблица 1, стр. 8), он для каждой чистой стратегии Аi (i= Решение матричных игр в чистых стратегиях - student2.ru ) сначала найдет минимальное значение Решение матричных игр в чистых стратегиях - student2.ru ожидаемого выигрыша: Решение матричных игр в чистых стратегиях - student2.ru (i= Решение матричных игр в чистых стратегиях - student2.ru ), Решение матричных игр в чистых стратегиях - student2.ru , Решение матричных игр в чистых стратегиях - student2.ru а затем из всех Решение матричных игр в чистых стратегиях - student2.ru выделит наибольше Решение матричных игр в чистых стратегиях - student2.ru и выберет соответствующую ему чистую стратегию Аi0. Это и будет наиболее предпочтительная (гарантирующая, «перестраховочная») в данных условиях стратегия игрока А. Ее называют максиминной, поскольку она отвечает величине Решение матричных игр в чистых стратегиях - student2.ru

Число Решение матричных игр в чистых стратегиях - student2.ru называется нижней чистой ценой игры (максимином). Оно показывает, какой минимальной выигрыш может получить игрок А, правильно применяя свои чистые стратегии при любых действиях игрока В. В свою очередь, игрок В, стремясь минимизировать проигрыш, при выборе наиболее предпочтительной стратегии, использует принцип осторожности по-своему: сначала он для каждой чистой стратегии Bj Решение матричных игр в чистых стратегиях - student2.ru , найдет максимально возможный проигрыш Решение матричных игр в чистых стратегиях - student2.ru Решение матричных игр в чистых стратегиях - student2.ru , затем среди βj выберет минимальное значение Решение матричных игр в чистых стратегиях - student2.ru , которому и будет соответствовать искомая чистая стратегия Вj0. Ее называют минимаксной, так как она соответствует величине Решение матричных игр в чистых стратегиях - student2.ru .

Число β называют верхний чистой ценой игры (минимаксом). Оно показывает, какой максимальный проигрыш может быть у игрока В при правильном выборе им чистых стратегий независимо от действий игрока А.

Таким образом, правильно используя чистые стратегии, игрок А обеспечивает себе выигрыш не меньше α, а игрок В в результате правильного применения своих чистых стратегий не позволит игроку А выиграть больше, чем β.

В матричной игре нижняя чистая цена игры не превосходит верхней чистой цены игры, т.е. α ≤ β. Это можно легко доказать.

По определению Решение матричных игр в чистых стратегиях - student2.ru Решение матричных игр в чистых стратегиях - student2.ru ; Решение матричных игр в чистых стратегиях - student2.ru Решение матричных игр в чистых стратегиях - student2.ru .

Объединив эти соотношения, получим:

Решение матричных игр в чистых стратегиях - student2.ru Решение матричных игр в чистых стратегиях - student2.ru Решение матричных игр в чистых стратегиях - student2.ru .

Отсюда Решение матричных игр в чистых стратегиях - student2.ru

Это неравенство справедливо для любых комбинаций i и j. Будет оно справедливо и для тех i и j, для которых max αi = α; min βj = β и при любых i и j получаем α≤β.

Если в матричной игре нижняя и верхняя чистая цена - совпадают, т.е. α = β то говорят, что эта игра имеет седловую точку в чистых стратегиях и чистую цену игры v = α = β

Обозначим через i и j номера чистых стратегий, при которых имеет место равенство α = β Пару чистых стратегий (Ai;Bj) игроков А и В, при которых достигается это равенство, называют седловой точкой матричной игры, а элемент Решение матричных игр в чистых стратегиях - student2.ru матрицы, стоящей на пересечении i-ой строки и j-го столбца называют седловым элементом платежной матрицы.

В развернутой форме признак матричной игры с седловой точкой запишется в виде: Решение матричных игр в чистых стратегиях - student2.ru = Решение матричных игр в чистых стратегиях - student2.ru = Решение матричных игр в чистых стратегиях - student2.ru

В игре с матрицей

  Ai Bj αi
B1 B2 В3 B4
A1
A2 -1 -3 -3
А3 -2 -5 -5
Решение матричных игр в чистых стратегиях - student2.ru j  

Решение матричных игр в чистых стратегиях - student2.ru =2, Решение матричных игр в чистых стратегиях - student2.ru

Т.е. V = α = β = 2, значит представленная игра с седловой точкой. В данном случае имеют две седловые точки (А1; В2) и (А1; В4).

Для игрока А максиминной является стратегия A10, для игрока В минимаксными будут стратегии B20 и B40. В платежной матрице содержится два седловых элемента а12=2 и а14= 2.

Из примера следует, что в матричной игре может быть несколько седловых точек (соответственно седловым элементам). Можно отметить

одно важное замечание: седловой элемент aij наименьшим в i-ой строке и наибольшей в j-том столбце.

Поэтому, если игрок В отклонится от своей минимаксной стратегии, его проигрыш может только увеличиться. Аналогично, отклонение игрока А от своей максимминной стратегии ведет к уменьшению его выигрыша. Таким образом, наиболее предпочтительные стратегии в игре с седловой точкой обладает свойством устойчивости, создают ситуацию равновесия.

Итак, если матричная игра имеет седловую точку, то она решается в чистых стратегиях; чистые стратегии, образующие седловую точку, и будут оптимальными, а решением игры является тройка {Ai;Bj; aij}. В нашем примере игра имеет два решения:

{А*1;В*2;2}и{А*1;В*4;2}.

Задача 3 имеет седловую точку:

Решение матричных игр в чистых стратегиях - student2.ru = max (-64;-62;-60) = -60

Решение матричных игр в чистых стратегиях - student2.ru = min (-45;-52,5;-60) = -60,

т.е. α = β = a33=-60.

Следовательно игра обладает cедловой точкой (A3030), и чистой ценой v = -60. Задачи 1, 2, 4 - не имеют седловой точки.

Поскольку данная игра является статистической (игрой с природой), то давать рекомендации игроку П (природа) по оптимальному поведению не имеет смысла, а вот сознательному игроку А (домовладельцу) рекомендовать следует чистую стратегию А3, т.е. запасти летом 8 т. угля.

Наши рекомендации