Нижняя и верхняя цена игры

Определим стратегию игрока Нижняя и верхняя цена игры - student2.ru , которая обеспечила бы ему наибольший из возможных выигрышей вне зависимости от того как поведет себя игрок В. Выбирая стратегию, мы должны руководствоваться тем, что наш противник действует разумно и на любую нашу стратегию отвечает той стратегией из числа имеющихся у него, которая обеспечивает нам минимальный выигрыш.

То есть, если мы воспользуемся стратегией Нижняя и верхняя цена игры - student2.ru , то при разумных действиях противника наш выигрыш будет равен Нижняя и верхняя цена игры - student2.ru . Обозначим, через Нижняя и верхняя цена игры - student2.ru наибольшее значение из всех Нижняя и верхняя цена игры - student2.ru : Нижняя и верхняя цена игры - student2.ru . Величина Нижняя и верхняя цена игры - student2.ru называется нижней ценой игрыили максиминным выигрышем (максимином). Число Нижняя и верхняя цена игры - student2.ru лежит в определенной строке матрицы; та стратегия игрока Нижняя и верхняя цена игры - student2.ru , которая соответствует этой строке, называется максиминной стратегией. Очевидно, если игрок Нижняя и верхняя цена игры - student2.ru будет придерживаться максиминной стратегии, то ему при любом поведении противника гарантирован выигрыш, во всяком случае, не меньший Нижняя и верхняя цена игры - student2.ru .

Нижняя цена игры Нижняя и верхняя цена игры - student2.ru – гарантированный выигрыш игрока Нижняя и верхняя цена игры - student2.ru при любой стратегии противника (это тот минимум, который игрок Нижняя и верхняя цена игры - student2.ru может себе обеспечить, действуя наиболее осторожно).

Очевидно, аналогичные рассуждения можно провести и за противника Нижняя и верхняя цена игры - student2.ru . Выдвигая стратегию Нижняя и верхняя цена игры - student2.ru , противник понимает, что мы ответим на эту стратегию той стратегией из всех возможных, которая даст нам максимальный выигрыш равный Нижняя и верхняя цена игры - student2.ru . Обозначим через Нижняя и верхняя цена игры - student2.ru наименьшее значение из всех Нижняя и верхняя цена игры - student2.ru : Нижняя и верхняя цена игры - student2.ru . Величина Нижняя и верхняя цена игры - student2.ru называется верхней ценой игры (минимаксом). Соответствующая минимаксному выигрышу стратегия противника называется его минимаксной стратегией. Придерживаясь своей наиболее осторожной минимаксной стратегии, игрок Нижняя и верхняя цена игры - student2.ru может гарантировать себе проигрыш не более Нижняя и верхняя цена игры - student2.ru , вне зависимости от того, как поступит игрок Нижняя и верхняя цена игры - student2.ru .

Верхняя цена игры - гарантированный проигрыш игрока Нижняя и верхняя цена игры - student2.ru при любой стратегии противника (это тот минимальный проигрыш, который может себе обеспечить игрок Нижняя и верхняя цена игры - student2.ru , действуя наиболее осторожно).

Принцип осторожности, диктующий игрокам выбор соответствующих стратегий в теории игр в ее приложениях, часто называют принципом минимакса.

Задача № 6.1.

Игроки Нижняя и верхняя цена игры - student2.ru и Нижняя и верхняя цена игры - student2.ru одновременно и независимо друг от друга пишут одно из трех чисел: 1, 2 или 3. Если сумма написанных чисел четная, то Нижняя и верхняя цена игры - student2.ru платит Нижняя и верхняя цена игры - student2.ru эту сумму в рублях; если она нечетная, то, наоборот, Нижняя и верхняя цена игры - student2.ru платит Нижняя и верхняя цена игры - student2.ru эту сумму. Требуется проанализировать игру; составить ее матрицу; найти нижнюю и верхнюю цены игры.

Решение.

Игра состоит из двух ходов (ход игрока Нижняя и верхняя цена игры - student2.ru и ход игрока Нижняя и верхняя цена игры - student2.ru ), оба хода личные. У игрока Нижняя и верхняя цена игры - student2.ru три стратегии: Нижняя и верхняя цена игры - student2.ru - написать число 1; Нижняя и верхняя цена игры - student2.ru – написать число 2; Нижняя и верхняя цена игры - student2.ru – написать число 3. У противника (игрока Нижняя и верхняя цена игры - student2.ru ) тоже три стратегии. Игра представляет собой игру 3 Нижняя и верхняя цена игры - student2.ru 3 с матрицей, приведенной ниже.

Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru
Нижняя и верхняя цена игры - student2.ru 2 -3 4 -3
Нижняя и верхняя цена игры - student2.ru -3 4 -5 -5
Нижняя и верхняя цена игры - student2.ru 4 -5 6 -5
Нижняя и верхняя цена игры - student2.ru 4 4 6 4 -3

Нижняя цена игры Нижняя и верхняя цена игры - student2.ru ; верхняя цена игры Нижняя и верхняя цена игры - student2.ru . Максиминная стратегия игрока Нижняя и верхняя цена игры - student2.ru это стратегия Нижняя и верхняя цена игры - student2.ru ; применяя ее систематически, игрок Нижняя и верхняя цена игры - student2.ru может твердо рассчитывать на выигрыш не менее, чем «-3», т.е. его проигрыш не составит более, чем 3 рубля в каждой игре. Аналогично, применяя стратегии Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru игрок Нижняя и верхняя цена игры - student2.ru обеспечит себе этим проигрыш не более, чем в четыре рубля. Если же игрок Нижняя и верхняя цена игры - student2.ru отступит от своей минимаксной стратегии (например, выберет стратегию Нижняя и верхняя цена игры - student2.ru ) противник может, выбрав стратегию Нижняя и верхняя цена игры - student2.ru , свести выигрыш игрока Нижняя и верхняя цена игры - student2.ru к «-5». Отступление же игрока Нижняя и верхняя цена игры - student2.ru от своей минимаксной стратегии может свести его проигрыш к 6 рублям.

Задача №6.2.

В распоряжении игрока Нижняя и верхняя цена игры - student2.ru имеются три вида вооружения: Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru . У противника Нижняя и верхняя цена игры - student2.ru имеется три вида самолетов Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru . Задача игрока Нижняя и верхняя цена игры - student2.ru поразить самолет; задача противника (игрока Нижняя и верхняя цена игры - student2.ru ) – сохранить его. При применении вооружения Нижняя и верхняя цена игры - student2.ru самолеты Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru поражаются соответственно с вероятностями: 0,9; 0,4; 0,2. При применении вооружения Нижняя и верхняя цена игры - student2.ru самолеты поражаются с вероятностями: 0,3; 0,6; 0,8, а при применении вооружения Нижняя и верхняя цена игры - student2.ru – 0,5; 0,7; 0,2. Сформулировать ситуацию в терминах теории игры. Определить верхнюю и нижнюю цены игры.

Решение.

Ситуация может рассматриваться как игра 3 Нижняя и верхняя цена игры - student2.ru 3 с двумя личными ходами и одним случайным. Личный ход игрока Нижняя и верхняя цена игры - student2.ru – выбор типа вооружения. Личный ход игрока Нижняя и верхняя цена игры - student2.ru – выбор вида самолета. Случайный ход - действие вооружения; этот ход может окончиться поражением или не поражением самолета. Выигрыш игрока Нижняя и верхняя цена игры - student2.ru равен единице, если самолет поражен, и равен нулю в противном случае. Стратегиями игрока Нижняя и верхняя цена игры - student2.ru являются три варианта вооружения; стратегиями игрока Нижняя и верхняя цена игры - student2.ru являются три варианта самолетов. Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения данного самолета данным оружием. Ниже приводится матрица игры:

Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru
Нижняя и верхняя цена игры - student2.ru 0,9 0,4 0,2 0,2
Нижняя и верхняя цена игры - student2.ru 0,3 0,6 0,8 0,3
Нижняя и верхняя цена игры - student2.ru 0,5 0,7 0,2 0,2
Нижняя и верхняя цена игры - student2.ru 0,9 0,7 0,8 0,7 0,3

Нижняя цена игры Нижняя и верхняя цена игры - student2.ru =0,3; верхняя цена игры Нижняя и верхняя цена игры - student2.ru =0,7. Наиболее осторожная (максиминная) стратегия игрока Нижняя и верхняя цена игры - student2.ru – это стратегия Нижняя и верхняя цена игры - student2.ru ; пользуясь вооружением Нижняя и верхняя цена игры - student2.ru , игрок Нижняя и верхняя цена игры - student2.ru гарантирует себе, что будет поражать самолеты в среднем не менее, чем с частотой 0,3. Наиболее осторожной (минимаксной) стратегией игрока Нижняя и верхняя цена игры - student2.ru будет стратегия Нижняя и верхняя цена игры - student2.ru . Выбирая второй вид самолетов, игрок Нижняя и верхняя цена игры - student2.ru может быть уверен, что он будет поражаться не более чем с частотой 0,7.

Продемонстрируем на данном примере свойство неустойчивости минимаксных стратегий.До тех пор пока оба игрока придерживаются своих наиболее осторожных стратегий, средний выигрыш игрока Нижняя и верхняя цена игры - student2.ru равен 0,6. Это число больше, чем нижняя цена игры Нижняя и верхняя цена игры - student2.ru =0,3, но меньше, чем верхняя цена игры Нижняя и верхняя цена игры - student2.ru =0,7. Теперь допустим, что игроку Нижняя и верхняя цена игры - student2.ru стало известно, что игрок Нижняя и верхняя цена игры - student2.ru применяет стратегию Нижняя и верхняя цена игры - student2.ru , он немедленно применит стратегию Нижняя и верхняя цена игры - student2.ru , чем сведет выигрыш игрока Нижняя и верхняя цена игры - student2.ru к 0,3. В свою очередь, на стратегию Нижняя и верхняя цена игры - student2.ru игрок Нижняя и верхняя цена игры - student2.ru может ответить стратегией Нижняя и верхняя цена игры - student2.ru , дающей выигрыш 0,9 и т.д.

Таким образом, положение, при котором оба игрока пользуются своими минимаксными стратегиями, является неустойчивым и может быть нарушено поступившими сведениями о стратегии противоположной стороны.

Однако существуют некоторые игры, для которых минимаксные стратегии являются устойчивыми. Это те игры, для которых нижняя цена игры равна верхней: Нижняя и верхняя цена игры - student2.ru .

Если нижняя цена игры равна верхней, то их общее значение называется чистой ценой игры или просто ценой игры.

Задача №6.3

Пусть игра задана платежной матрицей 4 Нижняя и верхняя цена игры - student2.ru 4:

Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru Нижняя и верхняя цена игры - student2.ru
Нижняя и верхняя цена игры - student2.ru 0,4 0,5 0,9 0.3 0,3
Нижняя и верхняя цена игры - student2.ru 0,8 0,4 0,3 0.7 0,3
Нижняя и верхняя цена игры - student2.ru 0,7 0,6 0,8 0.9 0,6
Нижняя и верхняя цена игры - student2.ru 0.7 0.2 0.4 0.6 0.2
Нижняя и верхняя цена игры - student2.ru 0,8 0,6 0,8 0.9 0.6 0.6

Найдем нижнюю цену игры: Нижняя и верхняя цена игры - student2.ru =0,6. Найдем верхнюю цену игры: Нижняя и верхняя цена игры - student2.ru =0,6. Они оказались равными. Следовательно, у игры есть чистая цена Нижняя и верхняя цена игры - student2.ru , равная Нижняя и верхняя цена игры - student2.ru .

Элемент 0,6, выделенный в платежной матрице, является одновременно минимальным в своей строке и максимальным в своем столбце. В геометрии точку на поверхности, обладающую аналогичным свойством, называют седловой точкой; по аналогии этот термин применяется и в теории игр. Элемент матрицы, обладающий этим свойством, называется седловой точкой матрицы, а про игру говорят, что она имеет седловую точку.

Седловая точка – платеж, который одновременно является наибольшим в своем столбце и наименьшим в своей строке.

Стратегии, соответствующие седловой точке, называют оптимальными стратегиями (в данном примере Нижняя и верхняя цена игры - student2.ru , Нижняя и верхняя цена игры - student2.ru ), а их совокупность называют решением игры.

Решение игры обладает замечательным свойством. Если один из игроков придерживается своей оптимальной стратегии, а другой игрок будет любым способом отклоняться от своей оптимальной стратегии, то для игрока допустившего отклонение, это никогда не может оказаться выгодным: в лучшем случае выигрыш его останется неизменным, в худшем случае его выигрыш уменьшится (проигрыш увеличится).

Это утверждение легко проверить на примере рассматриваемой игры с седловой точкой. Мы видим, что в случае игры с седловой точкой минимаксные стратегии обладают своеобразной «устойчивостью»: если одна сторона придерживается своей минимаксной стратегии, то для другой невыгодно отклоняться от своей минимаксной стратегии. В данном случае, даже если у игроков имеются сведения о том, что противник избрал свою оптимальную стратегию, это не изменит поведения игроков. Пара оптимальных стратегий в игре с седловой точкой является как бы «положением равновесия»: любое отклонение от оптимальной стратегии приводит отклоняющегося игрока к невыгодным последствиям, вынуждающим его вернуться в исходное положение.

Наши рекомендации