Основные понятия теории игр

В экономике иногда приходится сталкиваться с ситуацией, когда при наличии многих участников эффективность решения одного из них зависит от того, какие решения приняли другие участники. Например, доход предприятия от продажи изделия зависит не только от установленной на него цены, но и от количества купленных покупателем изделий. Или при выборе ассортимента товаров, выпускаемых предприятием, нужно учитывать, какой ассортимент товаров выпускают другие предприятия.

Все ситуации, когда эффективность действия одного из участников зависит от действий других, можно разбить на два типа:

1. Интересы участников совпадают, и они могут договориться о совместных действиях;

2. Интересы участников не совпадают. В этом случае может оказаться невыгодным сообщать другим участникам свои решения, так как кто-нибудь из них сможет воспользоваться знанием чужих решений и получит больший выигрыш за счет других участников.

Ситуации такого типа называются конфликтными. Построением математических моделей конфликтных ситуаций и разработкой методов решения возникающих в этих ситуациях задач занимается теория игр.

В игре могут сталкиваться интересы двух или нескольких противников, поэтому игры разделяются на парные и множественные.

Если во множественной игре интересы игроков совпадают, то они могут объединяться, создавая коалиции. Такие игры называются коалиционными.

Задачей теории игр является выработка рекомендаций для игроков, т.е. определение для них оптимальной стратегии.

Стратегией игрока называется система правил, однозначно определяющих поведение игрока на каждом ходе в зависимости от ситуации, сложившейся в процессе игры.

Оптимальной называется стратегия, которая при многократном повторении игры обеспечивает данному игроку максимально возможный средний выигрыш. Количество стратегий у каждого игрока может быть конечным или бесконечным, в зависимости от этого игры подразделяются на конечные и бесконечные.

Рассмотрим простейшую математическую модель конечной конфликтной ситуации, когда имеются два участника и когда выигрыш одного равен проигрышу другого. Такая модель называется антагонистической игрой двух лиц с нулевой суммой.

основные понятия теории игр - student2.ru игре участвуют два игрока. Каждый из них может записать независимо от другого цифры 1, 2 и 3. Если разность между цифрами, записанными игроками, положительна, то первый игрок выигрывает количество очков, равное разности между цифрами, и, наоборот, если разность отрицательна, то выигрывает второй игрок. Если разность равна нулю, то игра заканчивается вничью.

У первого игрока три стратегии (варианта действия): А₁(записать 1), А₂ (записать 2), А₃ (записать 3).

У второго игрока также три стратегии: B₁, B₂, В₃ (табл. 33.1).

Задача первого игрока — максимизировать свой выигрыш.

основные понятия теории игр - student2.ru Задача второго игрока — минимизировать свой проигрыш или минимизировать выигрыш первого игрока.

Игру можно представить в виде матрицы, в которой строки — стратегии первого игрока, столбцы — стратегии второго игрока, а элементы матрицы — выигрыши первого игрока. Такую матрицу называют платежной.

основные понятия теории игр - student2.ru Для данного примера платежная матрица имеет вид,

В общем случае парную игру с нулевой суммой можно записать платежной матрицей

Задача каждого из игроков — найти наилучшую стратегию игры, при этом предполагается, что противники одинаково разумны и каждый из них делает все, чтобы получить наибольший доход.

Найдем наилучшую стратегию первого игрока: минимальное число а, в каждой строке обозначим α_i (i = основные понятия теории игр - student2.ru ),

основные понятия теории игр - student2.ru Зная α_i, т.е. минимальные выигрыши при различных стратегиях А_i, первый игрок выберет ту стратегию, для которой α_i максимально. Обозначим это максимальное значение через α, см. справа.

основные понятия теории игр - student2.ru Величина α — гарантированный выигрыш, который может обеспечить себе первый игрок, — называется нижней ценой игры (максимином).

Аналогично для определения наилучшей стратегии второго игрока найдем максимальные значения выигрыша по столбцам и, выбрав из них минимальное значение, получим значение β, см. справа. β — верхняя цена игры (минимакс).

Если второй игрок будет придерживаться своей минимаксной стратегии, то он гарантирован, что в любом случае проиграет не больше β.

Для матричной игры справедливо неравенство основные понятия теории игр - student2.ru

основные понятия теории игр - student2.ru Если α = β, то такая игра называется игрой с седловой точкой, а пара оптимальных стратегий (А_i_опт, B_j_опт) — седловой точкой матрицы. В этом случае элемент α_ij = v называется ценой игры, является одновременно минимальным в i-й строке и j-м столбце. Если игра имеет седловую точку, то говорят, что она решается в чистых стратегиях.

Решение игры рассмотренного выше, см. справа.

Так как α = β = 0, матрица игры имеет седловую точку.

Оптимальная стратегия первого игрока — А₃, второго — В₃. Из табл. 31.1 видно, что отклонение первого игрока от оптимальной стратегии уменьшает его выигрыш, а отклонение второго игрока от В₃ увеличивает его проигрыш.

Если платежная матрица не имеет седловой точки, т.е. α < β, то поиск решения игры приводит к применению сложной стратегии, состоящей в случайном применении двух и более стратегий с определенными частотами. Такая сложная стратегия называется смешанной.

основные понятия теории игр - student2.ru В игре, матрица которой имеет размерность т х п, стратегии первого игрока задаются наборами вероятностей = (x₁, x₂,... ,x_т), с которыми игрок применяет свои чистые стратегии. Эти наборы можно рассматривать как m-мерные векторы, для координат которых:

основные понятия теории игр - student2.ru Аналогично для второго игрока наборы вероятностей определяют n-мерные векторы = (y₁, y₂, … , y_п), для координат которых:

Выигрыш второго игрока при использовании смешанных стратегий определяют как математическое ожидание выигрыша, т.е. он равен формуле справа:

В основной теореме теории игр утверждается, что каждая конечная игра имеет, по крайней мере, одно решение, возможно, в области смешанных стратегий.

Применение оптимальной стратегии может получить выигрыш, равный цене игры: a≤ v≤ b.

основные понятия теории игр - student2.ru Применение первым игроком оптимальной стратегии x_i_опт должно обеспечить ему при любых действиях второго игрока выигрыш не меньше цены игры. Поэтому выполняется соотношение справа:

основные понятия теории игр - student2.ru Аналогично второму игроку оптимальная стратегия y_j_оптдолжна обеспечить при любых стратегиях первого игрока проигрыш, не превышающий цену игры, т.е. справедливо соотношение справа:

основные понятия теории игр - student2.ru Если платежная матрица не содержит седловой точки, то задача определения смешанной стратегии тем сложнее, чем больше размерность матрицы. Поэтому матрицы большой размерности целесообразно упростить, уменьшив их размерность путем вычеркивания дублирующих (одинаковых) и заведомо невыгодных стратегий. Рассмотрим игру, представленную платежной матрицей

Откуда имеем α и β.

Все элементы А₂ меньше A₃, т.е. А₃ заведомо невыгодна для первого игрока и А₂ можно исключить. Все элементы А₄меньше А₃, исключаем А₄.

основные понятия теории игр - student2.ru Для второго игрока: сравнивая В₁ и B₄, исключаем В₁;сравнивая В₂ и В₄, исключаем В₂; сравнивая B₃ и В₄, исключаем В₃. В результате преобразований получим матрицу справа:

31.1. Графическое решение игр вида (2 x n) и (m x 2)

основные понятия теории игр - student2.ru Графический метод применим к играм, в которых хотя бы один игрок имеет только две стратегии. Рассмотрим игру (2 х п), см. табл. 31.2.

Предполагаем, что игра не имеет седловой точки.

основные понятия теории игр - student2.ru Обозначим: х₁ — вероятность применения первым игроком 1-й стратегии, x₂ — вероятность применения первым игроком 2-й стратегии, причем х₂ = 1 — x₁; y₁ — вероятность применения вторым игроком 1-й стратегии, у₂ — вероятность применения вторым игроком 2-й стратегии и т.д., у_n — вероятность применения вторым игроком п-й стратегии.

Ожидаемый выигрыш первого игрока при применении вторым 1-й стратегии составит

основные понятия теории игр - student2.ru Аналогично найдем ожидаемые выигрыши первого игрока при применении вторым игроком 2, 3, ..., n-й стратегий. Полученные данные поместим в табл. 31.3.

Из таблицы видно, что ожидаемый выигрыш первого игрока линейно зависит от x₁. На оси X₁ построим выражения ожидаемых выигрышей первого игрока.

Первый игрок должен выбирать такие стратегии, чтобы максимизировать свой минимальный ожидаемый выигрыш. Поэтому оптимальная стратегия первого игрока определяется как точка пересечения прямых, максимизирующих его минимальный ожидаемый выигрыш.

основные понятия теории игр - student2.ru Аналогично находим оптимальную стратегию второго игрока. Она определяется как точка пересечения прямых, минимизирующих его максимальные ожидаемые проигрыши.

Пример 1. Рассмотрим представленную выше игру, заданную платежной матрицей

Найти оптимальные стратегии игроков и цену игры.

основные понятия теории игр - student2.ru Решение. Обозначим: x₁ — вероятность применения первым игроком 1-й стратегии, х₂, х₃, х₄ — вероятность использования первым игроком 2, 3, 4-й стратегий соответственно, причем х₁ + x₂ + x₃ + x₄ = 1; y₁ — вероятность применения вторым игроком 1-й стратегии, у₂, у₃, y₄, y₅ — вероятность использования вторым игроком 2, 3, 4, 5-й стратегий соответственно, причем y₁+у₂+у₃+y₄+ y₅ = 1.

основные понятия теории игр - student2.ru Платежная матрица была упрощена путем вычеркивания дублирующих, заведомо невыгодных стратегий. Поэтому x₂ = x₄ = y₁ = y₂ = y₃ = 0 и матрица имеет вид

Найдем решение игры (табл. 31.4) графическим методом (рис. 31.1). На оси Х₁ разместим точки х₁ = 0 и х₁ = 1, через которые проведем прямые, перпендикулярные оси Х₁. Подставляя х₁ = 0 и x₁ = 1 в выражение х₁ +3, найдем значения, которые отложим на соответствующих перпендикулярных прямых. Соединив эти точки, получим прямую.

Аналогично рассмотрим выражение –3x₁ + 5.

основные понятия теории игр - student2.ru Оптимальная стратегия первого игрока определится из равенства выражений х₁ + 3 и -3х₁ + 5:

основные понятия теории игр - student2.ru

Цена игры v = x₁ + 3 = 1/2 + 3 = 7/2.

Оптимальная стратегия первого игрока:

основные понятия теории игр - student2.ru

Найдем оптимальную стратегию для второго игрока (табл. 31.5).

основные понятия теории игр - student2.ru Имеем

основные понятия теории игр - student2.ru

Оптимальная стратегия второго игрока (рис. 31.2):

основные понятия теории игр - student2.ru

Пример 2. Найдем решение игры вида (2 х n), заданной платежной матрицей (табл. 31.6)

основные понятия теории игр - student2.ru

Решение. Находим

α = mах (-1,2) = 2,

β = min (4, 3, 3, 6) = 3, 2≤ v≤ 3.

Тогда

основные понятия теории игр - student2.ru

Оптимальное решение:

первого игрока: основные понятия теории игр - student2.ru _опт = (1/2, 1/2), при этом цена игры составляет v = 5/2.

Найдем оптимальное решение второго игрока (табл. 31.7).

основные понятия теории игр - student2.ru Из рис. 31.3 следует, что оптимальная стратегия первого игрока определяется из равенства выражений –x₁ + 3 и х₁ + 2, соответствующих 2-й и 3-й чистым стратегиям второго игрока (см. табл. 31.5), поэтому y₁ = y₄ = 0, а у₃ = 1 – y₂.

Имеем

основные понятия теории игр - student2.ru

откуда основные понятия теории игр - student2.ru

Оптимальное решение второго игрока (рис. 31.4):

основные понятия теории игр - student2.ru _опт = (0,1 / 2,1 / 2,0), при этом цена игры v = 5/2.

Ответ.

основные понятия теории игр - student2.ru _опт = (1/2, 1/2), _опт = (0,1 / 2,1 / 2,0), v = 5/2.

основные понятия теории игр - student2.ru Пример 3. Найдем решение игры вида (т х 2), заданной платежной матрицей (табл. 31.8)

основные понятия теории игр - student2.ru Решение. Находим α = mах (2, 2, 2, -2) = 2, β = min (3, 6) = 3, 2 ≤ v ≤ 3. Пусть y₁ и у₂ (причем y₂ = l —y₁) — смешанные стратегии второго игрока; x₁, x₂, x₃, x₄ — смешанные стратегии первого игрока.

Находим

основные понятия теории игр - student2.ru

Оптимальное решение второго игрока (рис. 31.5):

основные понятия теории игр - student2.ru _опт = (2/3, 1/3), при этом цена игры v = 8/3.

основные понятия теории игр - student2.ru Прямые, пересекающиеся в минимаксной точке, соответствуют 1-й и 3-й чистым стратегиям первого игрока. Это означает, что х₂= х₄ = 0. Следовательно, х₁ = 1 — x₃. Найдем оптимальную стратегию 1-го игрока (табл. 31.9, рис. 31.6).