Глава 5. Биматричные игры.

Игры с ненулевой суммой

До сих пор рассматривались игры, в которых интересы игроков были прямо противоположны. В игре с ненулевой суммой интересы игроков хотя и не совпадают, о уже необязательно являются противоположными. Поэтому поведение игроков становится более разнообразным. В игре с ненулевой суммой становится желательным как-то координировать свои действия с партнером или каким-то способом влиять на его действия.

Игры с ненулевой суммой могут быть некооперативными и кооперативными. В некооперативных играх игроки принимают решения независимо друг от друга либо потому, что осуществление соглашения невозможно, либо потому, что оно запрещено правилами игры.

Пусть участник игры А может выбрать любую из стратегий А1, А2, …, Аm, а участник В – любую из стратегий В1, В2, …, Вn. Если игрок А выбрал стратегию Аi, а игрок В – стратегию Bk, то выигрыш игрока А будет равен числу аik, а выигрыш игрока В – числу bik,Таким образом, каждый из игроков получит свой приз. Выигрыши игроков А и В могут быть представлены двумя матрицами:

Глава 5. Биматричные игры. - student2.ru , Глава 5. Биматричные игры. - student2.ru

Таким образом, имеем две матрицы: А – платежную матрицу игрока А; В – платежную матрицу игрока В. Поэтому такие игры получили название биматричных. Рассмотренные раньше матричные игры являются частным случаем биматричных, у которых aik=-bik.

Так же, как и для случая матричной игры, обозначим через Глава 5. Биматричные игры. - student2.ru вероятности с которыми игрок А использует в ходе игры свои чистые стратегии А1, А2, …, Аm. Для этих вероятностей выполняются условия

Глава 5. Биматричные игры. - student2.ru

Аналогично, обозначим через Глава 5. Биматричные игры. - student2.ru , Глава 5. Биматричные игры. - student2.ru ,…, Глава 5. Биматричные игры. - student2.ru вероятности, с которыми игрок B использует в ходе игры свои чистые стратегии Глава 5. Биматричные игры. - student2.ru , Глава 5. Биматричные игры. - student2.ru ,…, Глава 5. Биматричные игры. - student2.ru . Для этих вероятностей выполняются условия:

Глава 5. Биматричные игры. - student2.ru

Векторы Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru полностью определяют характер игры игроков A и B и называются смешанными стратегиями.

Можно показать, что для любой конечной некооперативной игры с ненулевой суммой всегда существует по крайней мере одна равновесная пара смешанных стратегий.

При использовании смешанных стратегий игра приобретает случайный характер, случайными становятся и величины выигрышей игроков. Поэтому выигрыши игроков A и B определяются математическими ожиданиями, рассчитываемыми по формулам:

Глава 5. Биматричные игры. - student2.ru

Рассмотрим случай биматричной игры размера Глава 5. Биматричные игры. - student2.ru . В этом случае платежные матрицы игроков имеют вид:

Глава 5. Биматричные игры. - student2.ru

вероятности Глава 5. Биматричные игры. - student2.ru Глава 5. Биматричные игры. - student2.ru

а средние выигрыши вычисляются по формулам:

Глава 5. Биматричные игры. - student2.ru (5.1)

Пара чисел Глава 5. Биматричные игры. - student2.ru определяет равновесную ситуацию, если для любых p и q, удовлетворяющих условиям Глава 5. Биматричные игры. - student2.ru , Глава 5. Биматричные игры. - student2.ru , одновременно выполняются следующие неравенства:

Глава 5. Биматричные игры. - student2.ru (5.2)

Выполнение неравенств (6.2) равносильно выполнению следующих неравенств:

Глава 5. Биматричные игры. - student2.ru (5.3)

Четыре неравенства (5.3) позволяют провести поиск точки равновесия.

Перепишем формулы (5.1)для средних выигрышей в виде:

Глава 5. Биматричные игры. - student2.ru

(5.4)

Положив в первой формуле (5.4) p=1 и p=0, получим:

Глава 5. Биматричные игры. - student2.ru

Глава 5. Биматричные игры. - student2.ru

Найдем соотношения для разностей:

Глава 5. Биматричные игры. - student2.ru

где Глава 5. Биматричные игры. - student2.ru

Перепишем эти соотношения в виде:

Глава 5. Биматричные игры. - student2.ru

В случае, если пара (p,q) определяет точку равновесия, то в соответствии с (5.3) эти разности неотрицательны:

Глава 5. Биматричные игры. - student2.ru

Сравнив это с предыдущей формулой, получим:

Глава 5. Биматричные игры. - student2.ru

Аналогично для игрока B найдем:

Глава 5. Биматричные игры. - student2.ru

где Глава 5. Биматричные игры. - student2.ru

Таким образом, для того чтобы в биматричной игре:

Глава 5. Биматричные игры. - student2.ru

пара (p, q) определяла равновесную ситуацию, необходимо и достаточно одновременное выполнение следующих неравенств:

Глава 5. Биматричные игры. - student2.ru (5.5)

где

Глава 5. Биматричные игры. - student2.ru (5.6)

Использование соотношений (5.5), (5.6) для решения задач рассмотрим на примерах.

Борьба за рынки

Фирмы А и В производят однородный товар, который могут сбыть на одном из двух рынков. Фирма В является более состоятельной. Фирмы выбирают для борьбы один из рынков независимо друг от друга. Если фирмы выберут один и тот же рынок, то в конкурентной борьбе фирма А потерпит поражение. Если фирмы выберут разные рынки, то фирма А, не встречая противодействия, захватит выбранный рынок. Пусть платежные матрицы игроков имеют вид:

Глава 5. Биматричные игры. - student2.ru ; Глава 5. Биматричные игры. - student2.ru .

Из этих матриц следует, что если фирмы выберут один и тот же рынок, то победа достанется фирме В. При выборе стратегий (А11) выигрыш игрока В равен 5, а при выборе стратегий (А22) его выигрыш равен 1. Это говорит о том, что первый рынок более выгоден, например удобно расположен, хорошо посещаем и т.д. Проигрыш игрока А при выборе стратегий (А11) равен -10. А при выборе стратегий (А22) – -1. Если фирмы выберут разные рынки, то при выборе стратегий (А12) выигрыш игрока равен 2, а при выборе стратегий (А21) его выигрыш равен 1. Здесь игрок А выигрывает больше на более выгодном рынке. Потери, которые несет при этом игрок В, оказываются прямо противоположными. Определить параметры равновесной ситуации.

По формулам (5.6) рассчитаем коэффициенты Глава 5. Биматричные игры. - student2.ru :

Глава 5. Биматричные игры. - student2.ru ;

Глава 5. Биматричные игры. - student2.ru ;

Глава 5. Биматричные игры. - student2.ru

Глава 5. Биматричные игры. - student2.ru

Подставив полученные значения в (5.5), получим

Глава 5. Биматричные игры. - student2.ru (5.7)

Глава 5. Биматричные игры. - student2.ru (5.8)

Рассмотрим сначала пару неравенств (5.7) для трех различных случаев: p=1, p=0, 0<p<1.

Для первого случая p=1получим:

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства находим:

Глава 5. Биматричные игры. - student2.ru или Глава 5. Биматричные игры. - student2.ru (5.9)

Для второго случая p=0 и

Глава 5. Биматричные игры. - student2.ru

Из первого неравенства находим

Глава 5. Биматричные игры. - student2.ru или Глава 5. Биматричные игры. - student2.ru (5.10)

Для третьего случая 0<p<1 получим

Глава 5. Биматричные игры. - student2.ru

Отсюда находим Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru . Выполнение этих двух неравенств одновременно возможно лишь при

Глава 5. Биматричные игры. - student2.ru (5.11)

Полученные результаты изображены на рис. 5.1.

Рис. 5.1

На рис. 5.1 выделен единичный квадрат, соответствующий неравенствам

Глава 5. Биматричные игры. - student2.ru

Для первого случая p=1 имеем Глава 5. Биматричные игры. - student2.ru . На рис. 5.1 это луч, идущий из точки с координатами Глава 5. Биматричные игры. - student2.ru вниз. Для второго случая p=0 и Глава 5. Биматричные игры. - student2.ru . На рис. 5.1 это луч, идущий из точки с координатами Глава 5. Биматричные игры. - student2.ru вверх. Для третьего случая 0<p<1получили Глава 5. Биматричные игры. - student2.ru . Это горизонтальный отрезок на интервале 0<p<1.

Получили зигзаг, выделенный полужирной линией. Нас интересует та часть зигзага, которая попала в выделенный единичный квадрат.

Рассмотрим теперь пару неравенств (5.8) для трех различных случаев q=1, q=0, 0<q<1.

Для первого случая q=1 найдем

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства получим Глава 5. Биматричные игры. - student2.ru или Глава 5. Биматричные игры. - student2.ru .

Для второго случая q=0 и Глава 5. Биматричные игры. - student2.ru , а для третьего случая 0<q<1 имеем Глава 5. Биматричные игры. - student2.ru .

Полученные результаты изображены на рис 5.2. Так же, как и в предыдущем случае, получили зигзаг, выделенный полужирной линией.

Результаты объединения рис. 5.1, 5.2 представлены на рис. 5.3.

Рис. 5.2 Рис. 5.3

Точкой равновесия является общая точка построенных зигзагов. Ее координаты равны Глава 5. Биматричные игры. - student2.ru . Тогда смешанные стратегии игроков имеют вид

Глава 5. Биматричные игры. - student2.ru .

Средние выигрыши игроков определим по формулам (5.1):

Глава 5. Биматричные игры. - student2.ru

Дилемма узников

Пример: Два узника находятся в предварительном заключении по подозрению в совершении преступления. Каждый узник имеет по две стратегии: молчать (стратегия М) или говорить (стратегия Г). Стратегия М – узник не признается в преступлении, стратегия Г- узник сознается в совершенном преступлении совместно с товарищем.

Если ни тот ни другой из узников не сознается в преступлении, то их потери составят -1, т.е. Глава 5. Биматричные игры. - student2.ru

Если и тот и другой узники сознаются в преступлении, то их потери составляют -6 т.е. Глава 5. Биматричные игры. - student2.ru

Приведенные условия представлены матрицами А и В:

Глава 5. Биматричные игры. - student2.ru ; Глава 5. Биматричные игры. - student2.ru .

Определить параметры равновесной ситуации.

По формулам (5.6) рассчитаем коэффициенты С, α, D, β:

Глава 5. Биматричные игры. - student2.ru ;

Глава 5. Биматричные игры. - student2.ru ;

Глава 5. Биматричные игры. - student2.ru

Глава 5. Биматричные игры. - student2.ru

Подставив полученные значения в (5.5), получим:

Глава 5. Биматричные игры. - student2.ru (5.12)

Глава 5. Биматричные игры. - student2.ru (5.13)

Рассмотрим сначала пару неравенств (5.12) для трех различных случаев; p= 1, р = 0, 0< p < 1.

Для первого случая р = 1 получим:

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства находим

2q-3≥0, 2q≥3 или Глава 5. Биматричные игры. - student2.ru (5.14)

Для второго случая p= 0 и

Глава 5. Биматричные игры. - student2.ru

Из первого неравенства находим

Глава 5. Биматричные игры. - student2.ru или Глава 5. Биматричные игры. - student2.ru . (5.15)

Для третьего случая 0< p < 1 получим

Глава 5. Биматричные игры. - student2.ru

Отсюда находим -2q+3≥0 и 2q-3≥0. Выполнение этих двух неравенств одновременно возможно лишь при

Глава 5. Биматричные игры. - student2.ru (5.16)

Полученные результаты изображены на рис. 5.4.

Рис. 5.4

На рисунке 5.4 выделен единичный квадрат, соответствующий неравенствам

0< p < 1 и 0< q < 1.

Для первого случая р = 1 имеем Глава 5. Биматричные игры. - student2.ru . На рис.5.4 это луч, идущий из точки с координатами Глава 5. Биматричные игры. - student2.ru вверх.

Для второго случая р = 0 и Глава 5. Биматричные игры. - student2.ru . На рис.5.4 это луч, идущий из точки с координатами Глава 5. Биматричные игры. - student2.ru вниз.

Для третьего случая 0< p < 1 получили Глава 5. Биматричные игры. - student2.ru . Этот горизонтальный отрезок на интервале 0 <p< 1 , соединяющий точки с координатами Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru .

Получили зигзаг, выделенный полужирной линией. Нас интересует та часть зигзага, которая попала в выделенный единичный квадрат.

Рассмотрим теперь пару неравенств (5.13) для трёх различных случаев: q=1, q=0, 0 < q < 1.

Для первого случая q=1найдем

Глава 5. Биматричные игры. - student2.ru

Из второго неравенства получим Глава 5. Биматричные игры. - student2.ru или Глава 5. Биматричные игры. - student2.ru .

Для второго случая Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru , а для третьего случая 0<q<1имеем Глава 5. Биматричные игры. - student2.ru .

Полученные результаты изображены на рис. 5.4. Так же, как и в предыдущем случае, получили зигзаг, выделенный полужирной линией.

Точкой равновесия является общая точка построенных зигзагов. Её координаты (0,0). Тогда смешанные стратегии игроков имеют вид

Глава 5. Биматричные игры. - student2.ru .

Средние выигрыши игроков вычисляются по формулам (5.1):

Глава 5. Биматричные игры. - student2.ru .

Это значит, что каждый игрок выбирает вторую смешанную стратегию (сознаться) и его потери составят -6. По условию задачи сговор (создание коалиции) между игроками запрещён. В противном случае игроки выбрали бы первую чистую стратегию (молчать), по которой каждый теряет -1.

Кооперативные игры

Кооперативной игрой называется игра с ненулевой суммой, в которой игрокам разрешается обсуждать перед игрой свои стратегии и договариваться о совместных действиях, т.е. игроки могут образовывать коалиции.

Основная задача в кооперативной игре состоит в дележе общего выигрыша между членами коалиции.

Пусть выигрыши двух игроков определяются множеством S в пространстве переменных x и у, где х – выигрыш первого игрока, а у – выигрыш второго игрока (рис. 5.4).

Рис. 5.4

Множество S является выпуклым, замкнутым и ограниченным сверху. Точка Т с координатами хТ и уТ определяет величины выигрышей, которые игроки могут получить, не вступая в коалицию друг с другом. Эта точка называется точкой угрозы.

Парето-оптимальным множеством называется множество точек, образующих северо-восточную границу множества S (множество АВ на рис. 5.4).

Для этой области увеличение выигрыша одного игрока возможно только за счет уменьшения выигрыша другого.

Переговорным множеством называются точки Парето оптимального множества, координаты которых превышают хТ по оси х и уТ по оси у .

Иначе говоря, точки переговорного множества находятся выше и правее точки угрозы Т. Игрокам нет смысла договариваться относительно решений, не принадлежащих переговорному множеству.

Точкой решения Нэша называется точка, в которой достигается максимум Глава 5. Биматричные игры. - student2.ru , где Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru — превышения выигрышей каждого из игроков над платежами, которые могут быть получены без вступления в коалицию.

Если множество возможных платежей S выпукло, замкнуто и ограничено сверху, то точка Нэша существует и единственна.

Пример 5.1. Найти точку Нэша. Платежные матрицы в этой игре имеют вид

Глава 5. Биматричные игры. - student2.ru .

Определить параметры равновесной ситуации.

Решение. Средние выигрыши игроков А и В вычисляются по формулам (5.1):

Глава 5. Биматричные игры. - student2.ru (5.17)

Две эти функции заданы на единичном квадрате (рис. 5.5)

Глава 5. Биматричные игры. - student2.ru .

Рис. 5.5

Построим область, заполненную точками с координатами Глава 5. Биматричные игры. - student2.ru . Для определения первой границы этой области положим q = 0 и рассмотрим отрезок на оси Ор от нуля до единицы. При заданных условиях (5.17) приобретает вид:

Глава 5. Биматричные игры. - student2.ru (5.18)

Функция Глава 5. Биматричные игры. - student2.ru задана параметрически, где параметром является р. Умножив первое уравнение (5.18) на 2 и сложив уравнения системы (5.18), получим

Глава 5. Биматричные игры. - student2.ru .

Это уравнение прямой, т.е. граница искомой области является отрезком данной прямой (отрезок CF на рис. 5.6), причем точка Глава 5. Биматричные игры. - student2.ru соответствует Глава 5. Биматричные игры. - student2.ru , а точка Глава 5. Биматричные игры. - student2.ruГлава 5. Биматричные игры. - student2.ru . Точно так же можно оказать, что остальные границы искомой области являются отрезками прямых.

Вторая граница. При Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru соотношения (5.17) приобретают вид:

Глава 5. Биматричные игры. - student2.ru

При Глава 5. Биматричные игры. - student2.ru имеем Глава 5. Биматричные игры. - student2.ru , т.е. точку Глава 5. Биматричные игры. - student2.ru ; при Глава 5. Биматричные игры. - student2.ruГлава 5. Биматричные игры. - student2.ru , т.е. точку Глава 5. Биматричные игры. - student2.ru . Таким образом, искомым отрезком является отрезок LF.

Третья граница. При Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru :

Глава 5. Биматричные игры. - student2.ru

При Глава 5. Биматричные игры. - student2.ru имеем Глава 5. Биматричные игры. - student2.ru , т.е. точку Глава 5. Биматричные игры. - student2.ru ; при Глава 5. Биматричные игры. - student2.ru - Глава 5. Биматричные игры. - student2.ru , т.е. точку Глава 5. Биматричные игры. - student2.ru . Искомым отрезком является отрезок CD.

Четвертая граница. При Глава 5. Биматричные игры. - student2.ru и Глава 5. Биматричные игры. - student2.ru :

Глава 5. Биматричные игры. - student2.ru

При Глава 5. Биматричные игры. - student2.ru имеем Глава 5. Биматричные игры. - student2.ru , т.е. точку Глава 5. Биматричные игры. - student2.ru ; при Глава 5. Биматричные игры. - student2.ruГлава 5. Биматричные игры. - student2.ru , т.е. точку Глава 5. Биматричные игры. - student2.ru . Искомым отрезком является отрезок LD.

Из сказанного следует, что областью, заполненной точками с координатами Глава 5. Биматричные игры. - student2.ru , является область внутри четырехугольника CDLF (рис. 5.6). Парето-оптимальным множеством является ломаная CDL .

Рис. 5.6

Координаты точки угрозы Т определяются путем подстановки в (5.17) координат точки равновесия биматричной игры. Эти координаты были найдены при решении примера 5.11: р* = 0, q* = 0 .

Тогда

Глава 5. Биматричные игры. - student2.ru

Таким образом, точкой угрозы является точка Глава 5. Биматричные игры. - student2.ru .

Точкой решения Нэша называется точка, в которой достигается максимум Глава 5. Биматричные игры. - student2.ru . Можно показать, что это точка Глава 5. Биматричные игры. - student2.ru . Ей соответствуют чистые стратегии обоих игроков: Глава 5. Биматричные игры. - student2.ru , Глава 5. Биматричные игры. - student2.ru . Все это означает, что потери узников составят -1, и стратегиями узников является «молчать», т.е. ни тот ни другой из узников не сознается в преступлении.

Контрольные вопросы и задания

1. Определите предмет и задачи теории игр.

2. Дайте понятие матричных игр.

3. Когда достигается равновесная ситуация матричной игры?

4. Что такое седловая точка в матричной игре?

5. Найдите нижнюю и верхнюю цены и определите седловую точку игры, представленной матрицей:

Глава 5. Биматричные игры. - student2.ru

6. Какие стратегии матричной игры называются смешанными?

7. Какова основная теорема теории матричных игр?

8. Приведите алгоритм графического решения матричных игр.

9. Найдите решения следующей матричной игры

Глава 5. Биматричные игры. - student2.ru

10. Какие игры называются играми с природой?

11. Перечислите критерии, дающие схему принятия решений при поиске оптимальных решений.

12. Какой вид имеет матрица рисков?

13. Какие игры называются биматричными?

14. Дайте определение кооперативной игры?

Наши рекомендации