Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре.

Для каждой смешаннойстратегии Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru игрока Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru существует Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ;(4.1)

Для каждой смешаннойстратегии Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru игрока Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru существует Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru . (4.2)

Доказательство:

Для проведения доказательства введём понятие симплекса

Стандартным n-симплексом называется подмножество пространства Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru действительных чисел, определяемое как

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Его вершинами являются точки:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ,

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ,

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Сначала покажем, что симплекс является ограниченным замкнутым множеством, т.е. компактом.

Рассмотрим симплекс

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

в евклидовом пространстве Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru . Так как норма вектора Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru в пространстве Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru определяется следующим образом:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ,то для любой точки Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru симплекса Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru справедливо неравенство

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ,означающее ограниченность симплекса Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Пусть последовательность точек

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ,

сходится к точке Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru при Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru . Так как сходимость в Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru является покоординатной, то Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru означает, что Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru . Поскольку Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , то и Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Так как Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru для каждого k, то

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Таким образом, предельная точка Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru принадлежит симплексу Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , что доказывает его замкнутость.

Аналогично и симплекс Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru – компакт в пространстве Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Если зафиксировать произвольную смешанную стратегию Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , то функция выигрыша Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru будет функцией одного векторного аргумента Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , определённой на симплексе Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru . Из аналитического выражения

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

видно, что она непрерывна по аргументу Q на множестве Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , которое, как мы только что установили, является компактом, а непрерывная на компакте функция достигает своей нижней и верхней граней. Поэтому для любого Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru существует (4.1), т.е. для любого Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru найдётся хотя бы одна точка Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru такая, что

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Аналогично доказывается и существование (4.2).

Теорема доказана.

13. Теорема о существовании нижней и верхней цен игры в смешанных стратегиях.

Нижней ценой (или максимином)матричной игры в смешанных стратегиях называется величина Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Верхней ценой (или минимаксом)матричной игры в смешанных стратегиях называется величина Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Докажем существование нижней и верхней цен в смешанных стратегиях, т.е. достижимость максимума в (1) и минимума в (2). Необходимость этого доказательства возникает по причине бесконечности множеств SAв (1) и SBв (2).

Сначала докажем вспомогательные предложения.

Лемма 1.Соответствие, сопоставляющее каждой смешанной стратегии Р Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SAигрока А показатель ее эффективности α(Р),является числовой функцией, определенной на симплексе SA,аналитическое выражение которой задается равенством

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Аналогично, соответствиеβ(Q),задаваемое формулой Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

является числовой функцией, определенной на симплексеSBи ставящей в соответствие каждой смешанной стратегииQ Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SBигрока В показатель ее неэффективностиβ(Q).

Доказательство. Для каждой смешанной стратегии P Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SAв силу теоремы 1 - для каждой смешанной (в частности, чистой) стратегии Р Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SAигрока А существует (достигается)

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

для каждой смешанной (в частности, чистой) стратегии Q Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SBигрока В существует (достигается)

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru существует число Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru которое по определению минимума является единственным. Следовательно, α(Р)- числовая функция векторного аргумента Р, определенная на симплексе SA.

Аналогичной аргументацией обосновывается, что

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru является числовой функцией векторного аргумента Q, определенного на симплексе SB.

Лемма 2.Функцииα(Р) иβ(Q)непрерывны в своих областях определения SAиSB.

Оставим без доказательства. Теперь докажем следующую теорему.

Теорема 2.Для любой конечной матричной игры существуют нижняя и верхняя цены игры в смешанных стратегиях.Доказательство. Так как функция α(Р)по лемме 2 непрерывна на компакте SA, то она достигает на этом множестве своего максимума, т.е. существует нижняя цена игры в смешанных стратегиях: Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Аналогичным образом обосновывается существование и верхней цены игры в смешанных стратегиях:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Смешанная стратегия PО Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SA,максимизирующая показатель эффективности α(Р) (существование которой доказано в теореме 2), назовем максиминной смешанной стратегией игрока А. Таким образом, нижняя цена игры Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru есть (см. 1) показатель эффективности максиминной смешанной стратегии PО:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

В частном случае PОi0 является максиминной чистой стратегией игрока A.

Аналогично, смешанная стратегия QО Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SB(существование которой доказано в теореме 2), минимизирующая показатель неэффективности β(Q), назовем минимаксной смешанной стратегией игрока В.Показатель неэффективности минимаксной смешанной стратегии QОравен верхней цене игры Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru (см. 2)):

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Если QО=Bj0, то Bj0является минимаксной чистой стратегией.

14.Теорема о соотношении нижней и верхней цен игры в чистых и смешанных стратегиях.

Теорема.Нижняя цена игрыαи верхняя цена игрыβв чистых стратегиях, нижняя цена игры Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru и верхняя цена игры Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru в смешанных стратегиях удовлетворяют следующим неравенствам:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Доказательство. Начнем доказательство с левого неравенства (1).

По определению

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

нижней цены в смешанных стратегиях Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Здесь правая часть Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru не зависит от Р и потому это неравенство остается верным и для Р = Ai, i= 1, ..., m:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Так как полученное неравенство справедливо для всехi= 1, ..., m, то оно будет справедливым в частности для того номера i,который максимизирует показатель эффективности αi:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Итак, первое из неравенств (1) доказано.

Докажем второе неравенство Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ruТеорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru в (1). Для любых Р Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SAи Q Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SBпо

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru и Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

имеем:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Соотношение (2) означает, что в любой ситуации в смешанных стратегиях (Р, Q)выигрыш H(P, Q)игрока A не меньше показателя эффективности α(P)его стратегии Р и не больше показателя неэффективности стратегии Qпротивника В.

Так как (2) справедливо для любых Р Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SAи Q Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru SB, то из него следует, что

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Докажем последнее (правое) из неравенств (1). В силу определения

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

верхней цены игры в смешанных стратегиях

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

В частности, это неравенство справедливо и для чистых стратегий Q = Bj,j = 1, ..., п ,игрока В

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

и, следовательно, неравенство остается в силе и для того номера j,который минимизирует показатель неэффективности β(Bj) стратегии Вj, т.е.

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Итак, (1) доказано.

15. Основная теорема матричных игр Джона фон Неймана и седловая точка функции

Каждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий.

Применение оптимальной стратегии позволяет получить выиг­рыш, равный цене игры: Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru .

Применение первым игроком оптимальной стратегии Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru должно обеспечить ему при любых действиях второго игрока вы­игрыш не меньше цены игры. Поэтому выполняется соотношение

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Аналогично для второго игрока оптимальная стратегия Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru должна обеспечить при любых стратегиях первого игрока проиг­рыш, не превышающий цену игры, т.е. справедливо соотношение

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Если платежная матрица не содержит седловой точки, то зада­ча определения смешанной стратегии тем сложнее, чем больше размерность матрицы. Поэтому матрицы большой размерности це­лесообразно упростить, уменьшив их размерность путем вычерки­вания дублирующих (одинаковых) и не доминирующих стратегий.

Если Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , то такая игра называется иг­рой с седловой точкой, элемент матрицы Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , соответст­вующий паре оптимальных стратегий Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru называется сед­ловой точкой матрицы. Этот элемент является ценой игры.

16.Аналитическое решение игры 2×2 в смешанных стратегиях.

Рассмотрим игру 2х2.

Если такая игра имеет седловую точку, то оптимальное решение – это пара чистых стратегий, соответствующих этой точке. Для игры, в которой отсутствует седловая точка оптимальное решение игры существует и определяется парой смешанных стратегий (x1*,x*2) и (у1*2*).

(!!!это заменяем на следующее обозначение смешанных стратегий P0 =(p10;p20) andQ=(q10;q20), соответственно дальше меняем сами)

2) Для того, чтобы их найти, воспользуемся теоремой об активных стратегиях.

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Если первый игрок придерживается своей оптимальной смешанной стратегии, то его средний выигрыш будет равен цене игры v, какой бы активной стратегией не пользовался второй игрок. Для игры 2х2 любая чистая стратегия противника является активной, если отсутствует седловая точка. Поэтому средний выигрыш и первого и второго игрока будет равен цене игры.

3) Пусть игра задана матрицей

Средний выигрыш первого игрока, если он использует оптимальную смешанную стратегию х*=(x1*,x*2), а второй игрок – чистую стратегию, соответ.первому столбцу платежной матрицы, равен цене игры v:

a11x1*+a21x*2 = v.

Тот же средний выигрыш получает первый игрок, если второй игрок применяет стратегию, соответ.второму столбцу платежной матрицы, т.е. a12x1*+a22x*2 = v. Учитывая, что x1*+ x*2=1, получаем систему уравнений для определения оптимальной стратегии первого игрока и цены игры:

a11 x1*+a21 x*2 = v.

a12 x1*+a22 x*2 = v

x1*+ x*2=1

Решая эту систему, получим оптимальную стратегию

x1*= Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

x2*= Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

и цену игры v = Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

4) Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Для второго игрока

В=-АТ=

Применяя теорему об активных стратегиях при отыскании оптимальной смешанной стратегии второго игрока, получаем, что при любой чистой стратегии первого игрока средний проигрыш второго игрока равен v, т.е. a11 у1*+ a12 у2*=v.

Тогда оптимальная стратегия второго игрока определяется по формулам:

у1*= Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

у2*= Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

v’=-v

17. Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока A.

Итак, мы можем сформулировать общий алгоритм геометрического нахождения оптимальных стратегий игрока А, цены игры, нижней и верхней цены игры в чистых стратегиях, седловых точек матрицы и доминирующих стратегий игроков.

1. Берем горизонтальный отрезок [0,1].

2. В концах отрезка [0,1] проводим к нему 2 перпендикуляра: левый соответ. стратегии А1 и правый, соотв.стратегии А2.

3. На левом перпендикуляре от точки 0 его пересечения с отрезком [0,1] откладываем (как на вертикальной числовой оси) элементы a11 и a12 первой строки матрицы А

4. На правом перпендикуляре от точки 1 его пересечения с отрезком [0,1] (как на вертикальной числовой оси) элементы a21 и a22 второй строки матрицы А

5. Соединяем точки, изображающие элементы с одинаковыми вторыми индексами, т.е. эл-ты, стоящие в одном и том же столбце матрицы А: a11 с a21 и a12 с a22. В результате получаем отрезки a11a21 и a12a22.

6. Если отрезки a11a21 и a12a22 не убывающие, то стратегия А2 доминирует стратегию А1. Если отрезки a11a21 и a12a22 возрастающие, то стратегия А2 строго доминирует А1.

7. Если отрезок a11a21 лежит не ниже отрезка a12a22, то стратегия В2 доминирует стратегию В1. Если отрезок a11a21 лежит выше отрезка a12a22 и не пересекается с ним, то стратегия В2 строго доминирует стратегию В1

8. Находим нижнюю огибающую отрезков a11a21 и a12a22

9. Находим наивысшие точки нижней огибающей

10. Проектируем их ортогонально на горизонтальный отрезок [0,1]

11. Полученные проекции р0 определяют оптимальные стратегии Р0=(1-р00) игрока А.

12. Ордината наивысшей точки огибающей равна цене игры V

13. Верхний из двух концов нижней огибающей (лежащих на перпендикулярах) есть нижняя цена игры в чистых стратегиях Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

14. Нижний из двух верхних концов отрезков a11a21 и a12a22 есть верхняя цена игры в чистых стратегиях Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

15. Если элемент является нижним на перпендикуляре, где он лежит, и верхним концом отрезка a11a21 или a12a22 , на котором он лежит, то этот эл-т является седловой точкой. В этом случае чистая стратегия игрока В, номер которой совпадает со вторым индексом седловой точки, является оптимальной.

Мы дали геометрическую интерпретацию оптимальных стратегий игрока А. Если матрица игры содержит седловую точку, то автоматически выявляется и оптимальная стратегия игрока В. Но можно достаточно удовлетворительно проинтерпретировать геометрически оптимальную стратегию игрока В и в случае отсутствия седловых точек.

18. Геометрический метод нахождения цены игры 2×2 и оптимальных стратегий игрока B.

1. Берем горизонтальный отрезок [0,1].

2.В концах отрезка [0,1] проводим к нему 2 перпендикуляра: левый и правый

3.На левом перпендикуляре вертикальной числовой оси от точки 0 его пересечения с отрезком [0,1] откладываем все элементы матрицы А, за исключением а22

4.На правом перпендикуляре от точки 1 его пересечения с отрезком [0,1] откладываем (как на вертикальной числовой оси) все эл-ты матрицы А, за исключением а11

5.Каждый элемент на левом перпендикуляре соединим отрезком с каждым элементом на правом перпендикуляре, отличающимся от него только одним индексом. В результате получим отрезки a11a21 , a12a22, a11a12 и a21a22

6.Находим нижнюю огибающую отрезов a11a21 и a12a22.

7. Находим аивысшую точку N нижней огибающей.

8. Находим абсциссу р0 наивысшей точки нижней огибающей.

9. Смешанная стратегия Р0=(1-р0, р0) является оптимальной стратегией игрока А.

10. Находим верхнюю огибающую отрезков a11a12 и a21a22.

11. Находим наинизшую точку М верхней огибающей.

12. Находим абсциссу q0 наинизшей точки верхней огибающей.

13. Смешанная стратегия Q0=(1-q0,q0) является оптимальной стратегией игрока В.

14. Ордината наивысшей точки нижней огибающей равна ординате наинизшей точки верхней огибающей и представляет собой цену игры V.

15. Т.о. найдено геометрическими средствами решение игры {P0,Q0,V}

16. Верхний из концов нижней огибающей (лежащей на перпендикулярах) есть нижняя цена игры в чистых стратегиях Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

17. Нижний из концов верхней огибающей (лежащий на перпендикулярах) есть верхняя цена игры в чистых стратегиях Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

19.Геометрический метод нахождения цены игры 2×n и оптимальных стратегий игрока A.

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

20. Геометрический метод нахождения цены игры m×2 и оптимальных стратегий игрока B.

(!!! Помним про обозначения вероятностей чистых стратегий через p,q)

Решение игр размера 2xn или nx2 допускает наглядную геометрическую интерпретацию. Такие игры можно решать графически.

1)Дадим геометрическую интерпретацию игры
Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

На плоскости XY по оси абсцисс отложим единичный отрезок A1A2 (рисунок 5.1). Каждой точке отрезка поставим в соответствие некоторую смешанную стратегию U = (u1, u2). Причем расстояние от некоторой промежуточной точки U до правого конца этого отрезка – это вероятность u1 выбора стратегии A1, расстояние до левого конца - вероятность u2 выбора стратегии A2. Точка А1 соответствует чистой стратегии А1, точка А2 – чистой стратегии А2.

В точках А1 и А2 восстановим перпендикуляры и будем откладывать на них выигрыши игроков. На первом перпендикуляре (совпадающем с осью OY) покажем выигрыш игрока А при использовании стратегии А1, на втором – при использовании стратегии A2. Если игрок А применяет стратегию A1, то его выигрыш при стратегии B1 игрока B равен 2, а при стратегии B2 он равен 5. Числам 2 и 5 на оси OY соответствуют точки B1 и B2. Аналогично на втором перпендикуляре найдем точки B'1 и B'2 (выигрыши 6 и 4).

Соединяя между собой точки B1 и B'1, B2 и B'2, получим две прямые, расстояние от которых до оси OX определяет средний выигрыш при любом сочетании соответствующих стратегий.

Например, расстояние от любой точки отрезка B1B'1 до оси OX определяет средний выигрыш игрока A при любом сочетании стратегий A1 и A2 (с вероятностями u1 и u2) и стратегии B1 игрока B.

Рисунок 5.1 – Геометрическая интерпретация игры примера 5.3 (нахождение оптимальной стратегии игрока А)

Ординаты точек, принадлежащих ломаной B1MB'2 определяют минимальный выигрыш игрока A при использовании им любых смешанных стратегий. Эта минимальная величина является наибольшей в точке М, следовательно, этой точке соответствует оптимальная стратегия U* = ( Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru ), а ее ордината равна цене игры v.

Координаты точки M найдем, как координаты точки пересечения прямых B1B'1 и B2B'2.

Для этого необходимо знать уравнения прямых. Составить такие уравнения можно, используя формулу для уравнения прямой, проходящей через две точки:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru

Составим уравнения прямых для нашей задачи.

Прямая B1B'1:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru = Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru или y = 4x + 2.

Прямая B2B'2:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru = Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru или y = -x + 5.

Получим систему:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru y = 4x + 2, y = -x + 5.
 

Решим ее:

  4x + 2 = -x + 5, 5x = 3, x = 3/5, y = -3/5 + 5 = 22/5.

Таким образом, U* = (2/5, 3/5), v = 22/5.

Аналогично решается задача по нахождению оптимальной стратегии игрока B. Разница состоит в том, что находится точка, сводящая к минимуму средний проигрыш, поэтому на рисунке 5.2 рассматривается ломаная A2MA'1.

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru Рисунок 5.2 – Геометрическая интерпретация игры примера 5.3 (нахождение оптимальной стратегии игрока B)

Найдем координаты точки М.

Прямая A1A'1:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru = Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , откуда y = 3x + 2.

Прямая A2A'2:

Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru = Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru , откуда y = -2x + 6,
  3x + 2 = -2x + 6, 5x = 4, x = 4/5.

Таким образом, Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru = 1/5, Теорема о существовании показателей эффективности и неэффективности смешанных стратегий в антагонистической игре. - student2.ru = 4/5.

Наши рекомендации