Переход от игры в развернутой форме к игре в нормальной форме

Постановка игры в нормальной форме гораздо проще для изучения и формализации, чем игра в развернутой форме, поэтому ниже будут рассматриваться только решения игр в нормальной форме. Для игр же в развернутой форме построим формальную процедуру перехода от них к играм в нормальной форме.

Сначала введем для игры в развернутой форме понятие стратегии игрока.

Определение 3:Стратегией игрока для игры в развернутой форме называется функция, отображающая множество информационных состояний игрока на множество его ходов таким образом, что каждому информационному состоянию ставится в соответствие один из возможных в данном состоянии ходов.

Таким образом, стратегия определяет, какую альтернативу игрок должен выбирать в каждом из своих информационных состояний.

Множество стратегий каждого игрока будем обозначать X.

Элементы x декартова произведения множеств стратегий всех игроков будем называть профилями стратегий, а само декартово произведение будем обозначать X.

Для каждой вершины Q графа игры в развернутой форме и каждого профиля стратегий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru определим вероятность Переход от игры в развернутой форме к игре в нормальной форме - student2.ru реализации данного состояния Q при использовании игроками стратегий x с помощью рекуррентной процедуры, а именно:

– если Q – корневая вершина, то для произвольных x, Переход от игры в развернутой форме к игре в нормальной форме - student2.ru

– если вершина R предшествует вершине Q в графе игры, переход из R в Q определяется природой и происходит с вероятностью p, то Переход от игры в развернутой форме к игре в нормальной форме - student2.ru

– если вершина R предшествует Q в графе игры и переход из R в Q определяется одним из игроков, то Переход от игры в развернутой форме к игре в нормальной форме - student2.ru в случае, если данный переход содержится в профиле стратегий игроков, в противном случае Переход от игры в развернутой форме к игре в нормальной форме - student2.ru .

Таким способом для каждой терминальной вершины Переход от игры в развернутой форме к игре в нормальной форме - student2.ru можно определить соответствующие вероятности Переход от игры в развернутой форме к игре в нормальной форме - student2.ru попадания в них при условии использования игроками профиля стратегий x.

Теперь можно определить ожидаемые значения выигрышей игроков при использовании ими профиля x по формуле:

Переход от игры в развернутой форме к игре в нормальной форме - student2.ru , (1)

где Переход от игры в развернутой форме к игре в нормальной форме - student2.ru - терминальные вершины графа игры.

Теперь можно определить игру в нормальной форме, которая соответствует исходной игре в развернутой форме. Множество игроков новой игры совпадает с множеством игроков исходной игры, множествами действий будут определенные выше множества стратегий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru Переход от игры в развернутой форме к игре в нормальной форме - student2.ru , а функция выигрыша определяется формулой (1). Эта игра вполне эквивалентна в исследовании исходной игре в развернутой форме и, если определить, что для нормальной формы игры целесообразными является набор действий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru , тем самым полностью определяется и поведение игроков в исходной игре.

Отметим, что, поскольку выше было дано описание лишь дискретных игр в развернутой форме, то и получающиеся с помощью рассмотренной процедуры игры в нормальной форме также будут дискретными.

Пример. Рассмотрим следующую игру. Случайно выбирается некоторое число z из множества {1,2,3,4} . Каждое имеет вероятность 1/4 . Игрок А, не зная результата, выбирает целое число x , а игрок Б аналогично – число y. Выигрыш определяется следующим образом: |y-z|-|x-z|, (|x-z|-|y-z|) . Т.е. целью является выбор числа, наиболее близкого к z.

В этой игре каждый игрок реально имеет 4 стратегии {1,2,3,4}. (Остальные заведомо плохи.) Если, например, игрок А выбирает 1, а игрок Б выбирает 3, то выигрыш будет равен (2,-2) с вероятностью ¼, (0,0) с вероятностью ¼, (-2,2) с вероятностью ½. Ожидаемый выигрыш, таким образом, равен m(1,3)=(-1/2, 1/2). Подсчитывая все значения m(i,j)Б получим таблицу:

1 2 3 4
1 (0,0) (-1/2, 1/2) (-1/2, 1/2) (0,0)
2 (1/2, -1/2) (0,0) (0,0) (1/2, -1/2)
3 (1/2, -1/2) (0,0) (0,0) (1/2, -1/2)
4 (0,0) (-1/2, 1/2) (-1/2, 1/2) (0,0)

Таким образом, мы получили игру в нормальной форме.

Смешанные стратегии

При построении нормальной формы игры по ее развернутой форме, множества стратегий развернутой игры превращаются во множества действий игры в нормальной форме. Зачастую действие игрока в игре в нормальной форме также называют стратегией. Это не совсем верно. Обычно термин «стратегия» имеет более широкий смысл и используется для обозначения плана, который каждый игрок составляет до начала игры. Этот план описывает все действия, которые игрок будет предпринимать во всех возможных игровых состояниях. Стратегия игроков даже в игре в нормальной форме может быть более сложной, чем просто выбор одного из элементов множества действий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru (стратегия, состоящая в выборе действия из множества Переход от игры в развернутой форме к игре в нормальной форме - student2.ru , называется чистой стратегией).

Вспомним, что в играх в развернутой форме для тех ходов, которые делала природа, указывалась вероятность того или иного ее «хода». Аналогично и игроки могут не выбирать в каждой ситуации некоторое единственное действие, а выбирать одно из действий с некоторой вероятностью. Тогда выбор игрока будет описываться вероятностным распределением на множестве возможных в данной игровой ситуации действий, которое называется смешанной стратегией. Оказывается, что такое поведение в некоторых ситуациях может привести игрока к более выгодному распределению полезностей.

Определение 4: Смешанной стратегией Переход от игры в развернутой форме к игре в нормальной форме - student2.ru i-гo игрока Переход от игры в развернутой форме к игре в нормальной форме - student2.ru для игры в нормальной форме называется распределение вероятности на множестве действий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru с плотностью Переход от игры в развернутой форме к игре в нормальной форме - student2.ru , где Переход от игры в развернутой форме к игре в нормальной форме - student2.ru .

Определение 5: Вектор действий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru всех игроков, кроме i-гo, называется обстановкой игры для i-го игрока Переход от игры в развернутой форме к игре в нормальной форме - student2.ru .

Определение 6: Распределение вероятности (с плотностью Переход от игры в развернутой форме к игре в нормальной форме - student2.ru ) появления заданной обстановки при использовании игроками смешанных стратегий Переход от игры в развернутой форме к игре в нормальной форме - student2.ru называется обстановкой в смешанных стратегиях для i-гo игрока, Переход от игры в развернутой форме к игре в нормальной форме - student2.ru .

Ожидаемый выигрыш игроков при использовании ими смешанных стратегий будет вычисляться как математическое ожидание их функции выигрыша. Для дискретных игр

Переход от игры в развернутой форме к игре в нормальной форме - student2.ru

Смешанная стратегия для непрерывных игр представляет собой вероятностную меру на множестве чистых стратегий игрока. Ожидаемая полезность игроков при использовании ими смешанных стратегий будет интегралом функции полезности по декартову произведению этих вероятностных мер.

Дискретную игру, в которой игроки используют смешанные стратегии, можно привести к непрерывной игре, в которой игроки используют только чистые стратегии. Это достигается путем замены множества чистых стратегий игрока на множество его смешанных стратегий, а функции выигрыша – ее математическим ожиданием.

Тогда можно исследовать свойства новой игры в предположении, что игроки используют только чистые стратегии. Это, однако, не всегда бывает удобным, так как такой переход приводит к замене более простой, дискретной игры, более сложной – непрерывной

Приведем несколько свойств смешанных стратегий в дискретных играх.

Лемма 1. Ожидаемая полезность дискретной игры – непрерывная функция смешанных стратегий.

Теорема 2. Для произвольной обстановки в смешанных стратегиях найдется чистая стратегия, являющаяся «наилучшим ответом» на данную обстановку, то есть

Переход от игры в развернутой форме к игре в нормальной форме - student2.ru Переход от игры в развернутой форме к игре в нормальной форме - student2.ru

Более того, любая смешанная стратегия Переход от игры в развернутой форме к игре в нормальной форме - student2.ru ,которая содержит с ненулевой вероятностью чистую стратегию, не являющуюся лучшим ответом на обстановку Переход от игры в развернутой форме к игре в нормальной форме - student2.ru ,не будет и сама лучшим ответом на обстановку Переход от игры в развернутой форме к игре в нормальной форме - student2.ru

Доказательство. Множество смешанных стратегий - это компакт, в котором содержатся и чистые стратегии. Для игрока i зафиксируем обстановку в смешанных стратегиях Переход от игры в развернутой форме к игре в нормальной форме - student2.ru . Тогда ожидаемый выигрыш игрока i будет функцией только его смешанной стратегии Переход от игры в развернутой форме к игре в нормальной форме - student2.ru . Очевидно, существует смешанная стратегия Переход от игры в развернутой форме к игре в нормальной форме - student2.ru , при использовании которой ожидаемый выигрыш достигает максимума (значком Переход от игры в развернутой форме к игре в нормальной форме - student2.ru обозначается суммирование по всем элементам множества Переход от игры в развернутой форме к игре в нормальной форме - student2.ru ).

Для стратегии Переход от игры в развернутой форме к игре в нормальной форме - student2.ru ожидаемый выигрыш есть

Переход от игры в развернутой форме к игре в нормальной форме - student2.ru (2)

Так как Переход от игры в развернутой форме к игре в нормальной форме - student2.ru то Переход от игры в развернутой форме к игре в нормальной форме - student2.ru представляет собой взвешенную с весами Переход от игры в развернутой форме к игре в нормальной форме - student2.ru сумму величин

Переход от игры в развернутой форме к игре в нормальной форме - student2.ru Переход от игры в развернутой форме к игре в нормальной форме - student2.ru (3)

Взвешенная сумма (3) не может превышать своего максимального слагаемого, то есть существует чистая стратегия Переход от игры в развернутой форме к игре в нормальной форме - student2.ru для которой Переход от игры в развернутой форме к игре в нормальной форме - student2.ru Переход от игры в развернутой форме к игре в нормальной форме - student2.ru . Но в правой части этого неравенства стоит максимальный ожидаемый выигрыш, возможный при использовании смешанных стратегий. Значит, неравенство можно заменить равенством, а это, в свою очередь, значит, что максимальный ожидаемый выигрыш достигается на не которой чистой стратегии. Кроме того, если любой не максимальный элемент (3) входит в сумму (2) с ненулевым весом, то ожидаемая полезность будет строго меньше максимально возможной и смешанная стратегия не будет наилучшим ответом на обстановку Переход от игры в развернутой форме к игре в нормальной форме - student2.ru .

Смешанные стратегии – довольно хрупкая конструкция. Их использование в ряде практических задач неоднократно подвергалось критике. Один из аргументов против использования смешанных стратегий таков: «Применение смешанных стратегий подходит только для игр с большим числом повторений. Рассмотрим игру, которая должна быть сыграна лишь один раз. При использовании смешанных стратегий игрок должен выбирать свое решение на основании реализации случайного процесса, задаваемого распределением вероятности его смешанной стратегии. Однако эта реализация может дать стратегию, настолько «экзотическую», что ее применение в единичной игре будет малоэффективно, несмотря на теоретические обоснования эффективности такой смешанной стратегии в смысле среднего выигрыша на протяжении многих игр».

Поэтому, когда возможно, особенно при моделировании реальных систем, следует использовать только чистые стратегии.


Наши рекомендации