Чистые и смешанные стратегии

Если игра не имеет седловой точки, то возникают затруднения в определении цены игры и оптимальных стратегий игроков. Рассмотрим, например, игру, матрица которой дается табл. 9. В этой игре a=4 и b= 5. Следовательно, первый игрок может гарантировать себе выигрыш, равный 4, а второй может ограничить свой проигрыш величиной 5. Область между b и a является как бы ничейной, и каждый игрок может попытаться улучшить свой результат за счет этой области. Каковы же должны быть в этом случае оптимальные стратегии игроков?

Таблица 9

Чистые и смешанные стратегии - student2.ru

Если каждый из игроков применяет отмеченную звездочкой стратегию (х₂ и y_i), то выигрыш первого игрока и проигрыш второго будут равны 5. Это невыгодно второму игроку, так как первый выигрывает больше, чем он может себе гарантировать. Однако если второй игрок каким-либо образом раскроет замысел первого игрока о намерении применить стратегию х_a то он может применить стратегию у_a и уменьшить выигрыш первого до 4. Правда если первый игрок раскроет замысел второго применить стратегию у₂, то, используя стратегию х₁ он увеличит свой выигрыш до 6. Таким образом, возникает ситуация, когда каждый игрок должен хранить в секрете ту стратегию,которую он собирается применить. Однако, как это сделать? Ведь если партия играется многократно и второй игрок применяет все время стратегию y₂, то первый игрок скоро разгадает замысел второго и, применив стратегию x₁,будет иметь добавочный выигрыш. Очевидно, что второй игрок должен менять стратегию в каждой новой партии, но делать это он должен так, чтобы первый не догадался, какую стратегию применит он в каждом случае.

Секретность можно сохранить, если каждый раз выбирать стратегию случайным образом, используя для этого какой-либо механизм случайного выбора. Например, второй игрок может бросить монету и применить стратегию у₁, если выпадет герб, и у₂, если выпадет решетка. Такой способ действия лишает противника всякой возможности узнать наперед о действиях другой стороны.

При использовании механизма случайного выбора выигрыши и проигрыши игроков будут случайными величинами. Результат игры в этом случае можно оценить средней величиной проигрыша второго игрока. Так, если в игре с матрицей вида табл. 13 второй игрок использует стратегии Чистые и смешанные стратегии - student2.ru и у₂ случайным образом с вероятностями 0,5, 0,5, то средняя величина его проигрыша при стратегии первого игрока будет равна:

Чистые и смешанные стратегии - student2.ru

а при стратегии первого игрока Чистые и смешанные стратегии - student2.ru

Чистые и смешанные стратегии - student2.ru

Следовательно, второй игрок может ограничить свой средний проигрыш величиной 4,5 независимо от стратегии, применяемой первым игроком.

Таким образом, в ряде случаев оказывается целесообразным не намечать заранее стратегию, которая должна быть использована, а выбирать ту или иную стратегию случайным образом, основанным на использовании какого-либо механизма случайного выбора. Стратегию, основанную на случайном выборе, будем называть смешанной стратегией в отличие от рассмотренных ранее заранее намеченных стратегий, которые теперь будем называть чистыми стратегиями.

Пусть G=(X, Y, L) —игра. Пространства X={x₁,..., x_m} и Y={y₁ ,..., y_n}, содержащие перечни всех возможных стратегий игроков, называются пространствами чистых стратегий.

Для получения смешанной стратегии игрок должен использовать некоторый механизм случайного выбора (бросание монеты, бросание игральной кости и т. п.), имеющий число исходов, равное числу чистых стратегий игрока.

Предположим, что механизм случайного выбора первого игрока имеет m исходов, образующих множество R={r⁽¹⁾,..., r⁽^m⁾}. Обозначим через Чистые и смешанные стратегии - student2.ru вероятности, с которыми появляются отдельные исходы механизма случайного выбора.

Смешанная стратегия первого игрока состоит в том, что каждому исходу Чистые и смешанные стратегии - student2.ru назначается одна из чистых стратегий При этом величины будут представлять собой вероятности, с которыми используются чистые стратегии x₁, ..., x_m. Упорядоченное множество Чистые и смешанные стратегии - student2.ru , элементы которого удовлетворяют условиям

Чистые и смешанные стратегии - student2.ru

может теперь рассматриваться как распределение вероятностей Чистые и смешанные стратегии - student2.ru на пространстве X. Это распределение вероятностей полностью определяет характер игры первого игрока и называется его смешанной стратегией, соответствующей данному механизму случайного выбора.

Другой механизм случайного выбора дает другое распределение вероятностей.

В общем случае первый игрок может располагать бесконечным числом различных механизмов случайного выбора, определяющих всевозможные распределения вероятностей на пространстве своих чистых стратегий:

Чистые и смешанные стратегии - student2.ru

При этом множество

Чистые и смешанные стратегии - student2.ru

будет представлять собой пространство смешанных стратегий первого игрока.

Аналогично этому второй игрок может использовать свой механизм случайного выбора, определяющий вероятности Чистые и смешанные стратегии - student2.ru , с которыми будут использоваться чистые стратегии . При этом упорядоченное множество , элементы которого удовлетворяют соотношениям

Чистые и смешанные стратегии - student2.ru

представляет собой распределение вероятностей h(у) на пространстве Y и называется смешанной стратегией второго игрока.

Второй игрок, как и первый, может располагать бесконечным числом различных механизмов случайного выбора, определяющих различные распределения вероятностей на пространстве своих чистых стратегий:

Чистые и смешанные стратегии - student2.ru