Решение матричных игр в смешанных стратегиях

Рассмотрим общий случай матричной игры представленной следующей платежной матрицей.

Таблица 2. Матрица игры в смешанных стратегиях.

  Ai Bj p i
B1 B2 Bn
A1 a 11 a 12 a 1n P1
A2 a 21 a 22 a 2n P2
Am a m1 a m2 a mn Pm
q j q 1 Решение матричных игр в смешанных стратегиях - student2.ru q 2 q n Решение матричных игр в смешанных стратегиях - student2.ru Решение матричных игр в смешанных стратегиях - student2.ru

Обозначим через P1,P2,...,Pm вероятности которые игрок А применяет

в ходе игры, используя свои чистые стратегии A1,A2, …, Am.

Т.к. в матрице представлен полный набор чистых стратегий игрока А, то для вероятностей Pi выполняются условия:

Решение матричных игр в смешанных стратегиях - student2.ru Решение матричных игр в смешанных стратегиях - student2.ru , Решение матричных игр в смешанных стратегиях - student2.ru

Упорядоченное множество Решение матричных игр в смешанных стратегиях - student2.ru ( Решение матричных игр в смешанных стратегиях - student2.ru , Решение матричных игр в смешанных стратегиях - student2.ru , …, Решение матричных игр в смешанных стратегиях - student2.ru ), элементы которого удовлетворяют приведенным условиям полностью определяют характер игры игрока А и называются его смешанной стратегией. Таким образом, смешанной стратегией игрока А является полный набор вероятностей применения его чистых стратегий. Механизм случайного выбора чистых стратегий, которым пользуется игрок А, обеспечивает ему бесконечное множество смешанных стратегий. Любая его чистая стратегия Ai может рассматриваться как частный случай смешанных стратегий, i-я компонента которой равна 1, а остальные равны 0, т.е. Решение матричных игр в смешанных стратегиях - student2.ru (0, …, 1, …, 0).Аналогично упорядоченное множество, Решение матричных игр в смешанных стратегиях - student2.ru элементы которого удовлетворяют

соотношениям Решение матричных игр в смешанных стратегиях - student2.ru Решение матричных игр в смешанных стратегиях - student2.ru Решение матричных игр в смешанных стратегиях - student2.ru называют смешанной стратегией игрока В. Игрок В, как и игрок А, располагают бесконечным множеством смешанных стратегий.

Пусть игроки А и В применяют смешанные стратегии Решение матричных игр в смешанных стратегиях - student2.ru . Это означает, что игрок А использует стратегии Ai с вероятностью pi, a игрок В- стратегию Bj с вероятностью qj. Поскольку игроки выбирает свои чистые стратегии случайно и независимо друг от друга, то вероятность выбора комбинации (Аij) будет равна произведению вероятностей pi и qj, т.е. pi * qj. При использовании смешанных стратегий игра приобретает случайный характер, случайной становится и величина выигрыша игрока А (проигрыш игрока В). В связи с этим можно вести речь лишь о средней величине (математическое ожидание) выигрыша (проигрыша). Эта величина является функцией от смешанных стратегий Решение матричных игр в смешанных стратегиях - student2.ru , и определяется по формуле:

Решение матричных игр в смешанных стратегиях - student2.ru ( Решение матричных игр в смешанных стратегиях - student2.ru ; Решение матричных игр в смешанных стратегиях - student2.ru )= Решение матричных игр в смешанных стратегиях - student2.ru

Эта функция называется платежной функцией игры с заданной матрицей (таблица 2). По аналогии с введенными понятиями нижней чистой цены и верхней чистой цены можно ввести понятие нижней и верхней цены применительно к смешанной стратегии, сохраняя для них те же обозначения Решение матричных игр в смешанных стратегиях - student2.ru и Решение матричных игр в смешанных стратегиях - student2.ru .

Однако, вместо выигрыша aij теперь надо иметь в виду средний выигрыш Решение матричных игр в смешанных стратегиях - student2.ru ( Решение матричных игр в смешанных стратегиях - student2.ru ; Решение матричных игр в смешанных стратегиях - student2.ru ), а вместо чистых стратегий с номерами i и j, следует подразумевать смешанные стратегии Решение матричных игр в смешанных стратегиях - student2.ru .

Нижней ценой игры будем называть число Решение матричных игр в смешанных стратегиях - student2.ru , определяемое по формуле:

Решение матричных игр в смешанных стратегиях - student2.ru , а верхней ценой игры – число Решение матричных игр в смешанных стратегиях - student2.ru , которое определяется по формуле: Решение матричных игр в смешанных стратегиях - student2.ru

Назовем оптимальными смешанные стратегии Решение матричных игр в смешанных стратегиях - student2.ru * и Решение матричных игр в смешанных стратегиях - student2.ru * игроков А и В, удовлетворяющие равенству

Решение матричных игр в смешанных стратегиях - student2.ru Решение матричных игр в смешанных стратегиях - student2.ru = Решение матричных игр в смешанных стратегиях - student2.ru

Величину Решение матричных игр в смешанных стратегиях - student2.ru называют ценой игры v = Решение матричных игр в смешанных стратегиях - student2.ru Или, р* и q* называются оптимальными смешанными стратегиями соответственно игроков А и В, если они образуют седловую точку для платежной функции

Решение матричных игр в смешанных стратегиях - student2.ru , т.е. удовлетворяют неравенству

Решение матричных игр в смешанных стратегиях - student2.ru

Из этого неравенства следует, что в седловой точке (p*;q*) платежная функция Решение матричных игр в смешанных стратегиях - student2.ru достигает максимум по смешанной стратегии Решение матричных игр в смешанных стратегиях - student2.ru *игрока А и минимума по смешанной стратегии Решение матричных игр в смешанных стратегиях - student2.ru *игрока В. Оказывается, если использовать смешанные стратегии, то для любой матричной игры можно найти оптимальные стратегии и цену игры.

Теорема1. В смешанных стратегиях любая конечная матричная игра имеет седловую точку.

Теорема 2. Для того чтобы смешанные стратегии Решение матричных игр в смешанных стратегиях - student2.ru * = ( Решение матричных игр в смешанных стратегиях - student2.ru *, Решение матричных игр в смешанных стратегиях - student2.ru *, .., Решение матричных игр в смешанных стратегиях - student2.ru *) и Решение матричных игр в смешанных стратегиях - student2.ru * = ( Решение матричных игр в смешанных стратегиях - student2.ru *, Решение матричных игр в смешанных стратегиях - student2.ru *, .., Решение матричных игр в смешанных стратегиях - student2.ru *) были оптимальными для игроков А и В в игре с матрицей (Aij)mn и ценой v, необходимо и достаточно чтобы выполнялись следующие неравенства:

Решение матричных игр в смешанных стратегиях - student2.ru

Решение матричных игр в смешанных стратегиях - student2.ru

Т.е. теорема утверждает, что если игрок А примет оптимальную смешанную стратегию Решение матричных игр в смешанных стратегиях - student2.ru , а игрок В - любую чистую стратегию Bj, то выигрыш игрока А будет не меньше цены игры v. Если игрок В использует оптимальную смешанную стратегию Решение матричных игр в смешанных стратегиях - student2.ru , а игрок А - любую чистую стратегию Ai, то проигрыш игрока В не превышает цены игры V.

Чистые стратегии игрока, входящие в его оптимальную смешанную стратегию с вероятностями, отличными от нуля, называются активными стратегиями игрока.

Теорема 3.Если один из игроков придерживается своей оптимальной смешанной стратегии, то его выигрыш остается неизменным и равным цене игры независимо от того, какую стратегию примет другой игрок, если только тот не выходит за пределы своих активных стратегий.

Можно доказать, что число активных стратегий игроков не превышает наименьшего из чисел m и n (m - число строк, n - число столбцов)

Решение игры можно существенно упростить, если своевременно выявить имеющиеся в платежной матрице доминирование одних стратегий над другими, что позволит предварительно сократить размеренность матрицы.

Если в платежной матрице элементы к-ой строки не меньше соответствующим элементов s-ой строки, т.е. akj ≥ asj (j= Решение матричных игр в смешанных стратегиях - student2.ru ), то выигрыш игрока А при стратегии Ак будет больше (не меньше), чем при стратегии As, какой бы стратегией Bj не воспользовался игрок В. Поэтому для игрока А стратегия Ак будет более выгодной, чем стратегия As.

В связи с этим говорят, что стратегия Ак доминирует над стратегией As, и называют стратегию Ак доминирующей, а стратегию As - доминируемой.

Аналогично, если элементы p-го столбца не превосходят

соответствующих элементов r-го столбца, т. е. Решение матричных игр в смешанных стратегиях - student2.ru Решение матричных игр в смешанных стратегиях - student2.ru , то

игроку В при любых условиях невыгодно применять стратегию Вr, так как в этом случае он будет проигрывать больше (не меньше), чем при стратегии Вp. Поэтому говорят, что стратегия Вp доминирует над стратегией Вr, и называют их соответственно доминирующей и доминируемой.

Частным случаем доминирования является дублирование стратегий. Упрощение платежных матриц за счет исключения заведомо невыгодных игрокам чистых стратегий оправдано ввиду справедливости следующей теоремы.

Теорема 4.Пусть Y - игра, в матрице которой к-ая стратегия, игрока А доминирует над s-ой, а Y'-игра, матрица которая получена из матрицы игры Y исключением s-й строки.

Тогда:

а) цена игры Y' равна цене игры Y;

б) оптимальная смешанная стратегия

q*= (q1*,...,qn*) игрока В в игре Y' является также его оптимальной смешанной стратегией и в игре Y;

в) если р* = (p1*,...,ps-1*,ps+1,---,pm) -оптимальная смешанная стратегия игрока А в игре Y', то его смешанная стратегия р* = (р1*,...,рs-1*,0,рs+1*,...,рm) является оптимальной в игре Y.

Из теоремы следует, что если стратегия Ак доминирует над стратегией As, то вероятность применения стратегии As в оптимальной смешанной стратегии р* игрока А равна нулю, а поэтому s-ую строку из платежной матрицы можно исключить.

Аналогично, если p-аястратегия Bpигрока В доминирует над г-ой стратегией Вг, то r-тый столбец из платежной матрицы можно исключить.

Пример. Выполним возможные упрощения платежной матрицы:

Решение матричных игр в смешанных стратегиях - student2.ru

Значения элементов 1-ой и 3-ей строк соответственно равны, поэтому одну из них (например, 3-ью) можно опустить. Элементы второй строки не превышают соответствующим элементам первой, поэтому ее опускаем и приходим к матрице: Решение матричных игр в смешанных стратегиях - student2.ru

Элементы второго и элементы третьего столбцов, превышают элементы четвертого, а элемент пятого превышает элементы второго.

Поэтому доминируемые первый, третий и пятый столбцы опускаем. В результате получим матрицу: Решение матричных игр в смешанных стратегиях - student2.ru

Если полученную матрицу вновь проанализировать с позиций игрока А, то дальнейшие упрощения сделать нельзя.

То есть не приступая к решению игры с исходной матрицей (а это громоздкая процедура), мы уже знаем, что в оптимальной смешанной стратегии р* игрока А компонента p2*p3* равны нулю, т.е. р* = (P1*;0;0;p4*), а для оптимальной смешанной стратегии q* игрока В имеются три нулевых компонента q1*,q3*,q5*, т.е. q* = (0;q2*;0;q3*;0).

Итак, вместо того чтобы искать решения игры с матрицей размерности 4*5, достаточно решить игру размерности 2*2.

В случае необходимости платежную матрицу можно подвергать и другим преобразованиям, не меняющим вероятности активных стратегий игроков. Это вытекает из следующей теоремы:

Теорема 5.Пусть Решение матричных игр в смешанных стратегиях - student2.ru и Решение матричных игр в смешанных стратегиях - student2.ru - оптимальные смешанные стратегии игроков А и В в игре Y с матрицей (Aij) m*n и ценой v.

Тогда Решение матричных игр в смешанных стратегиях - student2.ru и Решение матричных игр в смешанных стратегиях - student2.ru будут оптимальными в игре Y' с матрицей (baij+C)m*n (где b > 0) и ценой v = bv+C.

Пользуясь этой теоремой, можно упростить платежную матрицу, прибавляя например, ко всем элементам достаточно большое положительное число, в результате чего можно получить новую матрицу с положительными (неотрицательными) элементами.

Умножая элементы матрицы на подходящий положительный коэффициент (отличный от нуля), можно уменьшить /увеличить элементы новой матрицы, чтобыоблегчить дальнейшие вычисления. При этом вероятности активных стратегий меняться не будут.

Например, разделив элементы матрицы

Решение матричных игр в смешанных стратегиях - student2.ru на 100 (умножить на 0,01), а затем, прибавив к элементам новой матрицы число 3, получим матрицу

Решение матричных игр в смешанных стратегиях - student2.ru Т.е. элементы aij' преобразованной матрицы получены из элементов исходной матрицы aij по формуле aij'= 0,01aij+ 3

Полученная матрица называется стратегически эквивалентной.

Наши рекомендации