Тема 2. Сильное и параметрическое равновесия Нэша.
Введение понятия сильного равновесия можно считать попыткой объединения концепций равновесия Нэша и равновесия Парето.
Определение 16: Для игры п лиц обозначим множество игроков через N={1,2, 3, ...,n}. Любое непустое подмножество S данного множества, включая и само N, называется коалицией.
Понятно, что для игры п лиц возможны 2n –1 коалиций. Множество всех возможных коалиций обозначим 2N . Обозначим (x*-S,xs) ситуацию, в которой игроки, не входящие в коалицию S N, используют стратегии хi* (I N\ S) a игроки из S используют стратегии xj (j ∈ S).
Определение 17: Ситуация х* называется сильно равновесной по Нэшу, если для любых коалиций S ⊂ N и любых xs ∈ найдется участник коалиции i ∈ S, такой, чтоKi(x*)>Ki(x-s*,xs).
Как видно из определения, сильное равновесие отличается от равновесия Нэша тем, что игроки не только по одиночке не могут увеличить свой выигрыш выходом из равновесия, но и произвольная их коалиция не может, отклоняясь от равновесия, увеличить этим одновременно выигрыш всех своих участников.
Довольно просто показать, что все сильные равновесия, если они существуют, оптимальны по Парето.
Тем не менее, при всех привлекательных чертах сильного равновесия Нэша, его использование ограничено тем, что даже в смешанных стратегиях оно существует не во всех играх.
«Параметрическое» равновесие Нэша
Для того чтобы вычислить равновесие Нэша, исследователь игры должен точно знать функции выигрыша игроков. В задачах управления часто встречается ситуация, когда на момент исследования игры функции выигрыша известны исследователю игры не полностью. Эта ситуация характерна для механизмов управления с сообщением информации.
Неточную информацию о функциях выигрыша игроков принято описывать с помощью понятия типа игрока. Рассмотрим следующую игру п лиц, в которой каждый из игроков имеет некоторый тип ri ∈ Ω, из множества Ωi, возможных типов данного игрока i. Будем считать, что все множества типов Ωi, компактны, i ∈ N. Функции выигрыша игроков Ki = Кi (х1,...хn,r1,...rп) зависят как от действий xt e Xt всех игроков, так и от их типов ri ∈ Ωi , i ∈ N.
Определение 18: Профилем типов игроков называется вектор r= (r1,r2,…,rn) ∈ Ω .
Определение 19: Набор функций x*(r) = (x*1(r),...,xn *(r)) будем называть равновесием Нэша (в чистых стратегиях) в игре с параметрически заданными функциями выигрыша,если для каждого фиксированного профиля r типов игроков для каждого игрока i ∈ N и для всех его стратегий хi ∈ Хi, справедливо неравенствоKi(x*(r),r) ≥ Ki(xi,x-i*(r),r).
Пример 15. «Простая задача распределения ресурса».
Рассмотрим организационную систему, состоящую из центра и двух агентов (игроков). Центр распределяет между игроками ресурс, для чего собирает от них заявки si ∈ [0; 1] (i = 1, 2) и выдает каждому игроку ресурс по формуле
xi =si – (11)
В этом механизме центр «недодает» игрокам ресурс относительно заявленных ими потребностей, причем, чем больше сообщенная общая потребность в ресурсе s1 +s2, тем существеннее становится «недодача».
Игроки имеют типы ri ∈ [0; 1]. Функции выигрыша игроков зависят от полученного ими ресурса и типа следующим образом:
Ki = 2xi – . (12)
Параметр ri ∈ [0; 1] можно интерпретировать как количество ресурса, оптимальное для игрока, так как именно при хi =ri , достигается максимум его выигрыша. Центр не знает типы {ri} игроков.
Стратегиями игроков в этой игре являются их заявки si на ресурс. Подставив (11) в (12), можно выразить функции выигрыша через стратегии, получив игру в нормальной форме. В этой игре функции выигрыша игроков зависят не только от их стратегий, но и от типов ri.
Задача исследователя заключается в том, чтобы предсказать, насколько это возможно, равновесные заявки игроков.
Можно показать, что в зависимости от типов r1 и r2игроков равновесие Нэша в этой игре будет задаваться заявками (s1*(.),s2*(.))=
= (13)
Равновесные заявки зависят от типов {r1} игроков. Если в дальнейшем исследователь получит точную информацию о типах игроков, то, подставив значения типов игроков в (13), сможет получить точное равновесие Нэша этой игры.
Однако полученный результат можно использовать и другим способом. Пусть исследователю известна та же информация, что и центру. Пусть игра разыграна один раз, и центр получил от игроков заявки (s1,s2). Тогда, зная (13), центр может узнать типы игроков. Так, например, если обе заявки меньше 1, центр может определить типы игроков по формуле:
r1 = 0.75 s1 – 0.25 s2, r2 = 0.75 s2 – 0.25 s1.
Если обе заявки равны 1, центр может сделать вывод, что типы обоих игроков превышают 0.5. Аналогично можно восстановить типы и для случаев, когда лишь одна из заявок равна 1. Таким образом, по результатам игры центр (а, значит, и исследователь) может с той или иной точностью восстановить типы игроков.
Пример.«Решение задачи «Экспертиза».
Приведем решение задачи примера 2.
Сообщение достоверной информации в механизмах планирования является равновесием в доминантных стратегиях для всех r ∈ Ω, если: ∀r ∈ Ω, ∀ i ∈ N, ∀ si ∈ Ωi, ∀ ∈ Ω-i, выполняется φi (πi (ri, ),ri) ≥ φi (πi (si, ),ri).
Для механизма экспертизы справедливо следующее утверждение: для каждого r ∈ [d,D]n равновесие Нэша s*(r) имеет следующую структуру:
1) si*=
2) если d < si*<D, то x* = ri.
Определим для каждого k = векторы сообщений:
s(k) =
и вычислим последовательность точек Wk = π(s(k)).
В [9] доказано, что всегда найдется такой номер k ∈ {0,...,n}, что либо rk ∈ [Wk ,Wk-1],либо rk > Wk-1.
Общий результат, характеризующий решение задачи экспертизы, гласит, что итоговое решение в равновесии имеет вид: х* = max min (rk, Wk-1).
Следовательно, для любой процедуры активной экспертизы найдется эквивалентный прямой механизм.
Тема 3. Антагонистические игры. Задачи и упражнения.
Упражнение 1.
Установить цену игры V и оптимальность смешанных стратегий Р° = (0,4; 0,6) и Q° = (0; 0; 0,6; 0,4) для игры с платежной матрицей 2x4
Bj Ai | B1 | B2 | B3 | B4 |
A1 | ||||
A2 |
Упражнение 2.
В условиях упражнения 1 установить оптимальность стратегий Р°= (0,4; 0,6) и Q°= (0; 0; 0,6; 0,4) .
Упражнение.3.
Для доказательства оптимальности стратегий Р° = (0,4; 0,6) и Q° = (0; 0; 0,6; 0,4) и определения цены игры в условиях упражнения 1 применить теорему 2.
Упражнение.4.
В условиях упражнения 3 показать, что выигрыш игрока А больше цены игры, если игрок А использует свою оптимальную смешанную стратегию Р°= (0,4; 0,6), а игрок В использует свои чистые стратегии B1 и В2 .Показать, что ни одна из активных стратегий обоих игроков не является оптимальной.
Упражнение.5.
Сформировать смешанную стратегию Qтаким образом, чтобы она представляла собой смесь активных стратегий В3и В4игрока Вв пропорциях 0,2 и 0,8 соответственно и проверить выполнение утверждения 2) теоремы 2.10.7 (о смесях активных стратегий) при условии, что игрок А применяет свою оптимальную стратегию Р° = (0,4; 0,6).
Вопросы для самоконтроля
1.Какая стратегия игрока А называется доминирующей (доминируемой)?
2. Какая стратегия игрока В называется доминирующей (доминируемой)?
3. В чем состоит отличие доминирующей стратегии от строго доминирующей?
4. Почему строку платежной матрицы, доминируемую некоторой выпуклой
комбинацией остальных ее строк, можно удалить?
5. Почему столбец платежной матрицы, доминируемый некоторой выпуклой
комбинацией остальных ее столбцов, можно удалить?
6. Дайте определение дублирующих стратегий игрока и объясните, почему
одну из дублирующих стратегий можно удалить?
Упражнение 1.
Удаляя доминируемые и дублирующие стратегии игроков, выполните редуцирование матрицы игры [5x5]
Ai Bj | B1 | B2 | B3 | B4 | B5 |
A1 | |||||
A2 | |||||
A3 | |||||
A4 | |||||
A5 |
к матрице [2x2].
Упражнение 2.
Удаляя доминируемые и дублирующие стратегии игроков, выполните редуцирование матрицы игры [4x4] «Антагонистическая конкуренция» (см. пример 2.4.1)
Ai Bj | B1 | B2 | B3 | B4 |
A1 | ||||
A2 | ||||
A3 | ||||
A4 |
К матрице [2x2].
Упражнение 3.
Используя предложение 1) теоремы 2.11.1, покажите, что матрицу игры [4x2]
Ai Bj | B1 | B2 |
A1 | ||
A2 | ||
A3 | ||
A4 | -1 |
Можно редуцировать к матрице [2x2].
Упражнение 4.
Используя предложение 3) теоремы 2.11.1, покажите, что матрицу игры [2x4]
Ai Bj | B1 | B2 | B3 | B4 |
A1 | ||||
A2 |
Можно редуцировать к матрице [2x2].
Ai Bj | B3 | B4 |
A1 | ||
A2 |
Упражнение 5
Редуцируйте матрицу игры [3x3]
Ai Bj | B1 | B2 | B3 |
A1 | |||
A2 | |||
A3 |
К матрице [2x2].
Тема 4. Игры с природой.
Критерии Байеса и Лапласа.
Вопросы для самоконтроля
1. Почему в игре с природой при редуцировании платежной матрицы уменьшают только число ее строк (стратегии игрока А), а число столбцов (стратегии природы) оставляют неизменным?
2. Дайте определение оптимальной по Байесу чистой стратегии относительно выигрышей.
3. Каким образом связаны показатели эффективности смешанной и чистой стратегий по Байесу относительно выигрышей ?
4. Почему при принятии решения в условиях риска по критерию Байеса относительно выигрышей можно обойтись только чистыми стратегиями, не используя смешанные?
5. Дайте определение оптимальной по Байесу чистой стратегии относительно рисков.
6. Почему при принятии решения в условиях риска по критерию Байеса относительно рисков можно обойтись только чистыми стратегиями, не используя смешанные?
7. Каким отношением связаны между собой оптимальные по Байесу стратегии относительно рисков и относительно выигрышей?
8. Дайте определение оптимальной по Лапласу чистой стратегии относительно выигрышей.
9. Какая существует связь между критериями Байеса и Лапласа?
10. Какой показатель используется для выбора оптимальной по Лапласу чистой стратегии относительно риска?
11. Какой показатель используется для выбора оптимальной стратегии по критерию относительных значений вероятностей состояний природы с учетом выигрышей?
12. Какой показатель используется для выбора оптимальной стратегии по критерию относительных значений вероятностей состояний природы с учетом рисков?
Упражнение 1.
В условиях задачи «Поставка товаров» (см. упражнение 4.1), найти чистую стратегию, оптимальную по критерию Байеса относительно выигрышей, если вероятности состояний природы известны и равны:q1 = 0,2; q2 = 0,3; q3=0,1; q4=0,4.
Упражнение2.
В условиях задачи «Поставка товаров», найти чистую стратегию, оптимальную по критерию Байеса относительно рисков, если вероятности состояний при-роды известны и равны: q1=0,2; q2=0,3; q3=0,1; q4=0,4.
Упражнение 3.
Рассматривая задачу «Поставка товаров» как игру с природой с неизвестными вероятностями состояний природы, найти чистую стратегию, оптимальную по критерию Лапласа относительно выигрышей.
Упражнение 4.
Рассматривая задачу «Поставка товаров» как игру с природой с неизвестными вероятностями состояний природы, найти чистую стратегию, оптимальную по критерию Лапласа относительно рисков.
Упражнение .5.
Рассматривая задачу «Поставка товаров» как игру с природой, вероятности состояний которой образуют строго убывающую последовательность, пропорциональную убывающей арифметической прогрессии:
q1 : q2 : q3 : q4 = 4:3:2:1,
найти чистую стратегию, оптимальную по критерию относительных значений вероятностей состояний природы с учетом выигрышей.
Упражнение.6.
Рассматривая задачу «Поставка товаров» как игру с природой, неизвестные вероятности состояний которой образуют строго убывающую последовательность, пропорциональную убывающей
q1 : q2 : q3 : q4 = 4:3:2:1,
арифметической прогрессии найти чистую стратегию, оптимальную по критерию относительных значений вероятностей состояний природы с учетом рисков.