Глава 5. Биматричные игры.

Игры с ненулевой суммой

До сих пор рассматривались игры, в которых интересы игроков были прямо противоположны. В игре с ненулевой суммой интересы игроков хотя и не совпадают, о уже необязательно являются противоположными. Поэтому поведение игроков становится более разнообразным. В игре с ненулевой суммой становится желательным как-то координировать свои действия с партнером или каким-то способом влиять на его действия.

Игры с ненулевой суммой могут быть некооперативными и кооперативными. В некооперативных играх игроки принимают решения независимо друг от друга либо потому, что осуществление соглашения невозможно, либо потому, что оно запрещено правилами игры.

Пусть участник игры А может выбрать любую из стратегий А₁, А₂, …, А_m, а участник В – любую из стратегий В₁, В₂, …, В_n. Если игрок А выбрал стратегию А_i, а игрок В – стратегию B_k, то выигрыш игрока А будет равен числу а_ik, а выигрыш игрока В – числу b_ik,Таким образом, каждый из игроков получит свой приз. Выигрыши игроков А и В могут быть представлены двумя матрицами:

Таким образом, имеем две матрицы: А – платежную матрицу игрока А; В – платежную матрицу игрока В. Поэтому такие игры получили название биматричных. Рассмотренные раньше матричные игры являются частным случаем биматричных, у которых a_ik=-b_ik.

Так же, как и для случая матричной игры, обозначим через Глава 5. Биматричные игры. - student2.ru вероятности с которыми игрок А использует в ходе игры свои чистые стратегии А₁, А₂, …, А_m. Для этих вероятностей выполняются условия

Глава 5. Биматричные игры. - student2.ru

Аналогично, обозначим через Глава 5. Биматричные игры. - student2.ru , ,…, вероятности, с которыми игрок B использует в ходе игры свои чистые стратегии , ,…, . Для этих вероятностей выполняются условия:

Глава 5. Биматричные игры. - student2.ru

Векторы Глава 5. Биматричные игры. - student2.ru и полностью определяют характер игры игроков A и B и называются смешанными стратегиями.

Можно показать, что для любой конечной некооперативной игры с ненулевой суммой всегда существует по крайней мере одна равновесная пара смешанных стратегий.

При использовании смешанных стратегий игра приобретает случайный характер, случайными становятся и величины выигрышей игроков. Поэтому выигрыши игроков A и B определяются математическими ожиданиями, рассчитываемыми по формулам:

Глава 5. Биматричные игры. - student2.ru

Рассмотрим случай биматричной игры размера Глава 5. Биматричные игры. - student2.ru . В этом случае платежные матрицы игроков имеют вид:

Глава 5. Биматричные игры. - student2.ru

вероятности Глава 5. Биматричные игры. - student2.ru

а средние выигрыши вычисляются по формулам:

Глава 5. Биматричные игры. - student2.ru (5.1)

Пара чисел Глава 5. Биматричные игры. - student2.ru определяет равновесную ситуацию, если для любых p и q, удовлетворяющих условиям , , одновременно выполняются следующие неравенства:

Глава 5. Биматричные игры. - student2.ru (5.2)

Выполнение неравенств (6.2) равносильно выполнению следующих неравенств:

Глава 5. Биматричные игры. - student2.ru (5.3)

Четыре неравенства (5.3) позволяют провести поиск точки равновесия.

Перепишем формулы (5.1)для средних выигрышей в виде:

Глава 5. Биматричные игры. - student2.ru

(5.4)

Положив в первой формуле (5.4) p=1 и p=0, получим:

Глава 5. Биматричные игры. - student2.ru

Найдем соотношения для разностей:

Глава 5. Биматричные игры. - student2.ru

где Глава 5. Биматричные игры. - student2.ru

Перепишем эти соотношения в виде:

Глава 5. Биматричные игры. - student2.ru

В случае, если пара (p,q) определяет точку равновесия, то в соответствии с (5.3) эти разности неотрицательны:

Глава 5. Биматричные игры. - student2.ru

Сравнив это с предыдущей формулой, получим:

Глава 5. Биматричные игры. - student2.ru

Аналогично для игрока B найдем:

Глава 5. Биматричные игры. - student2.ru

где Глава 5. Биматричные игры. - student2.ru

Таким образом, для того чтобы в биматричной игре:

Глава 5. Биматричные игры. - student2.ru

пара (p, q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств:

Глава 5. Биматричные игры. - student2.ru (5.5)

где

Глава 5. Биматричные игры. - student2.ru (5.6)

Использование соотношений (5.5), (5.6) для решения задач рассмотрим на примерах.

Борьба за рынки

Фирмы А и В производят однородный товар, который могут сбыть на одном из двух рынков. Фирма В является более состоятельной. Фирмы выбирают для борьбы один из рынков независимо друг от друга. Если фирмы выберут один и тот же рынок, то в конкурентной борьбе фирма А потерпит поражение. Если фирмы выберут разные рынки, то фирма А, не встречая противодействия, захватит выбранный рынок. Пусть платежные матрицы игроков имеют вид:

Глава 5. Биматричные игры. - student2.ru ; .

Из этих матриц следует, что если фирмы выберут один и тот же рынок, то победа достанется фирме В. При выборе стратегий (А₁,В₁) выигрыш игрока В равен 5, а при выборе стратегий (А₂,В₂) его выигрыш равен 1. Это говорит о том, что первый рынок более выгоден, например удобно расположен, хорошо посещаем и т.д. Проигрыш игрока А при выборе стратегий (А₁,В₁) равен -10. А при выборе стратегий (А₂,В₂) – -1. Если фирмы выберут разные рынки, то при выборе стратегий (А₁,В₂) выигрыш игрока равен 2, а при выборе стратегий (А₂,В₁) его выигрыш равен 1. Здесь игрок А выигрывает больше на более выгодном рынке. Потери, которые несет при этом игрок В, оказываются прямо противоположными. Определить параметры равновесной ситуации.

По формулам (5.6) рассчитаем коэффициенты Глава 5. Биматричные игры. - student2.ru :

Глава 5. Биматричные игры. - student2.ru ;

Глава 5. Биматричные игры. - student2.ru

Подставив полученные значения в (5.5), получим

Глава 5. Биматричные игры. - student2.ru (5.7)

Глава 5. Биматричные игры. - student2.ru (5.8)

Рассмотрим сначала пару неравенств (5.7) для трех различных случаев: p=1, p=0, 0<p<1.

Для первого случая p=1получим:

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства находим:

Глава 5. Биматричные игры. - student2.ru или (5.9)

Для второго случая p=0 и

Глава 5. Биматричные игры. - student2.ru

Из первого неравенства находим

Глава 5. Биматричные игры. - student2.ru или (5.10)

Для третьего случая 0<p<1 получим

Глава 5. Биматричные игры. - student2.ru

Отсюда находим Глава 5. Биматричные игры. - student2.ru и . Выполнение этих двух неравенств одновременно возможно лишь при

Глава 5. Биматричные игры. - student2.ru (5.11)

Полученные результаты изображены на рис. 5.1.

Рис. 5.1

На рис. 5.1 выделен единичный квадрат, соответствующий неравенствам

Глава 5. Биматричные игры. - student2.ru

Для первого случая p=1 имеем Глава 5. Биматричные игры. - student2.ru . На рис. 5.1 это луч, идущий из точки с координатами вниз. Для второго случая p=0 и . На рис. 5.1 это луч, идущий из точки с координатами вверх. Для третьего случая 0<p<1получили Глава 5. Биматричные игры. - student2.ru . Это горизонтальный отрезок на интервале 0<p<1.

Получили зигзаг, выделенный полужирной линией. Нас интересует та часть зигзага, которая попала в выделенный единичный квадрат.

Рассмотрим теперь пару неравенств (5.8) для трех различных случаев q=1, q=0, 0<q<1.

Для первого случая q=1 найдем

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства получим Глава 5. Биматричные игры. - student2.ru или .

Для второго случая q=0 и Глава 5. Биматричные игры. - student2.ru , а для третьего случая 0<q<1 имеем .

Полученные результаты изображены на рис 5.2. Так же, как и в предыдущем случае, получили зигзаг, выделенный полужирной линией.

Результаты объединения рис. 5.1, 5.2 представлены на рис. 5.3.

Рис. 5.2 Рис. 5.3

Точкой равновесия является общая точка построенных зигзагов. Ее координаты равны Глава 5. Биматричные игры. - student2.ru . Тогда смешанные стратегии игроков имеют вид

Глава 5. Биматричные игры. - student2.ru .

Средние выигрыши игроков определим по формулам (5.1):

Глава 5. Биматричные игры. - student2.ru

Дилемма узников

Пример: Два узника находятся в предварительном заключении по подозрению в совершении преступления. Каждый узник имеет по две стратегии: молчать (стратегия М) или говорить (стратегия Г). Стратегия М – узник не признается в преступлении, стратегия Г- узник сознается в совершенном преступлении совместно с товарищем.

Если ни тот ни другой из узников не сознается в преступлении, то их потери составят -1, т.е. Глава 5. Биматричные игры. - student2.ru

Если и тот и другой узники сознаются в преступлении, то их потери составляют -6 т.е. Глава 5. Биматричные игры. - student2.ru

Приведенные условия представлены матрицами А и В:

Глава 5. Биматричные игры. - student2.ru ; .

Определить параметры равновесной ситуации.

По формулам (5.6) рассчитаем коэффициенты С, α, D, β:

Глава 5. Биматричные игры. - student2.ru ;

Глава 5. Биматричные игры. - student2.ru

Подставив полученные значения в (5.5), получим:

Глава 5. Биматричные игры. - student2.ru (5.12)

Глава 5. Биматричные игры. - student2.ru (5.13)

Рассмотрим сначала пару неравенств (5.12) для трех различных случаев; p= 1, р = 0, 0< p < 1.

Для первого случая р = 1 получим:

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства находим

2q-3≥0, 2q≥3 или Глава 5. Биматричные игры. - student2.ru (5.14)

Для второго случая p= 0 и

Глава 5. Биматричные игры. - student2.ru

Из первого неравенства находим

Глава 5. Биматричные игры. - student2.ru или . (5.15)

Для третьего случая 0< p < 1 получим

Глава 5. Биматричные игры. - student2.ru

Отсюда находим -2q+3≥0 и 2q-3≥0. Выполнение этих двух неравенств одновременно возможно лишь при

Глава 5. Биматричные игры. - student2.ru (5.16)

Полученные результаты изображены на рис. 5.4.

Рис. 5.4

На рисунке 5.4 выделен единичный квадрат, соответствующий неравенствам

0< p < 1 и 0< q < 1.

Для первого случая р = 1 имеем Глава 5. Биматричные игры. - student2.ru . На рис.5.4 это луч, идущий из точки с координатами вверх.

Для второго случая р = 0 и Глава 5. Биматричные игры. - student2.ru . На рис.5.4 это луч, идущий из точки с координатами вниз.

Для третьего случая 0< p < 1 получили Глава 5. Биматричные игры. - student2.ru . Этот горизонтальный отрезок на интервале 0 <p< 1 , соединяющий точки с координатами и .

Рассмотрим теперь пару неравенств (5.13) для трёх различных случаев: q=1, q=0, 0 < q < 1.

Для первого случая q=1найдем

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства получим Глава 5. Биматричные игры. - student2.ru или .

Для второго случая Глава 5. Биматричные игры. - student2.ru и , а для третьего случая 0<q<1имеем .

Полученные результаты изображены на рис. 5.4. Так же, как и в предыдущем случае, получили зигзаг, выделенный полужирной линией.

Точкой равновесия является общая точка построенных зигзагов. Её координаты (0,0). Тогда смешанные стратегии игроков имеют вид

Глава 5. Биматричные игры. - student2.ru .

Средние выигрыши игроков вычисляются по формулам (5.1):

Глава 5. Биматричные игры. - student2.ru .

Это значит, что каждый игрок выбирает вторую смешанную стратегию (сознаться) и его потери составят -6. По условию задачи сговор (создание коалиции) между игроками запрещён. В противном случае игроки выбрали бы первую чистую стратегию (молчать), по которой каждый теряет -1.

Кооперативные игры

Кооперативной игрой называется игра с ненулевой суммой, в которой игрокам разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях, т.е. игроки могут образовывать коалиции.

Основная задача в кооперативной игре состоит в дележе общего выигрыша между членами коалиции.

Пусть выигрыши двух игроков определяются множеством S в пространстве переменных x и у, где х – выигрыш первого игрока, а у – выигрыш второго игрока (рис. 5.4).

Рис. 5.4

Множество S является выпуклым, замкнутым и ограниченным сверху. Точка Т с координатами х_Т и у_Т определяет величины выигрышей, которые игроки могут получить, не вступая в коалицию друг с другом. Эта точка называется точкой угрозы.

Парето-оптимальным множеством называется множество точек, образующих северо-восточную границу множества S (множество АВ на рис. 5.4).

Для этой области увеличение выигрыша одного игрока возможно только за счет уменьшения выигрыша другого.

Переговорным множеством называются точки Парето оптимального множества, координаты которых превышают х_Т по оси х и у_Т по оси у .

Иначе говоря, точки переговорного множества находятся выше и правее точки угрозы Т. Игрокам нет смысла договариваться относительно решений, не принадлежащих переговорному множеству.

Точкой решения Нэша называется точка, в которой достигается максимум Глава 5. Биматричные игры. - student2.ru , где и — превышения выигрышей каждого из игроков над платежами, которые могут быть получены без вступления в коалицию.

Если множество возможных платежей S выпукло, замкнуто и ограничено сверху, то точка Нэша существует и единственна.

Пример 5.1. Найти точку Нэша. Платежные матрицы в этой игре имеют вид

Глава 5. Биматричные игры. - student2.ru .

Определить параметры равновесной ситуации.

Решение. Средние выигрыши игроков А и В вычисляются по формулам (5.1):

Глава 5. Биматричные игры. - student2.ru (5.17)

Две эти функции заданы на единичном квадрате (рис. 5.5)

Глава 5. Биматричные игры. - student2.ru .

Рис. 5.5

Построим область, заполненную точками с координатами Глава 5. Биматричные игры. - student2.ru . Для определения первой границы этой области положим q = 0 и рассмотрим отрезок на оси Ор от нуля до единицы. При заданных условиях (5.17) приобретает вид:

Глава 5. Биматричные игры. - student2.ru (5.18)

Функция Глава 5. Биматричные игры. - student2.ru задана параметрически, где параметром является р. Умножив первое уравнение (5.18) на 2 и сложив уравнения системы (5.18), получим

Глава 5. Биматричные игры. - student2.ru .

Это уравнение прямой, т.е. граница искомой области является отрезком данной прямой (отрезок CF на рис. 5.6), причем точка Глава 5. Биматричные игры. - student2.ru соответствует , а точка — . Точно так же можно оказать, что остальные границы искомой области являются отрезками прямых.

Вторая граница. При Глава 5. Биматричные игры. - student2.ru и соотношения (5.17) приобретают вид:

Глава 5. Биматричные игры. - student2.ru

При Глава 5. Биматричные игры. - student2.ru имеем , т.е. точку ; при — , т.е. точку . Таким образом, искомым отрезком является отрезок LF.

Третья граница. При Глава 5. Биматричные игры. - student2.ru и :

Глава 5. Биматричные игры. - student2.ru

При Глава 5. Биматричные игры. - student2.ru имеем , т.е. точку ; при - , т.е. точку . Искомым отрезком является отрезок CD.

Четвертая граница. При Глава 5. Биматричные игры. - student2.ru и :

Глава 5. Биматричные игры. - student2.ru

При Глава 5. Биматричные игры. - student2.ru имеем , т.е. точку ; при — , т.е. точку . Искомым отрезком является отрезок LD.

Из сказанного следует, что областью, заполненной точками с координатами Глава 5. Биматричные игры. - student2.ru , является область внутри четырехугольника CDLF (рис. 5.6). Парето-оптимальным множеством является ломаная CDL .

Рис. 5.6

Координаты точки угрозы Т определяются путем подстановки в (5.17) координат точки равновесия биматричной игры. Эти координаты были найдены при решении примера 5.11: р* = 0, q* = 0 .

Тогда

Глава 5. Биматричные игры. - student2.ru

Таким образом, точкой угрозы является точка Глава 5. Биматричные игры. - student2.ru .

Точкой решения Нэша называется точка, в которой достигается максимум Глава 5. Биматричные игры. - student2.ru . Можно показать, что это точка . Ей соответствуют чистые стратегии обоих игроков: , . Все это означает, что потери узников составят -1, и стратегиями узников является «молчать», т.е. ни тот ни другой из узников не сознается в преступлении.