Нижняя и верхняя цена игры

Определим стратегию игрока Нижняя и верхняя цена игры - student2.ru , которая обеспечила бы ему наибольший из возможных выигрышей вне зависимости от того как поведет себя игрок В. Выбирая стратегию, мы должны руководствоваться тем, что наш противник действует разумно и на любую нашу стратегию отвечает той стратегией из числа имеющихся у него, которая обеспечивает нам минимальный выигрыш.

То есть, если мы воспользуемся стратегией Нижняя и верхняя цена игры - student2.ru , то при разумных действиях противника наш выигрыш будет равен . Обозначим, через наибольшее значение из всех : . Величина называется нижней ценой игрыили максиминным выигрышем (максимином). Число Нижняя и верхняя цена игры - student2.ru лежит в определенной строке матрицы; та стратегия игрока , которая соответствует этой строке, называется максиминной стратегией. Очевидно, если игрок Нижняя и верхняя цена игры - student2.ru будет придерживаться максиминной стратегии, то ему при любом поведении противника гарантирован выигрыш, во всяком случае, не меньший Нижняя и верхняя цена игры - student2.ru .

Нижняя цена игры Нижняя и верхняя цена игры - student2.ru – гарантированный выигрыш игрока при любой стратегии противника (это тот минимум, который игрок может себе обеспечить, действуя наиболее осторожно).

Очевидно, аналогичные рассуждения можно провести и за противника Нижняя и верхняя цена игры - student2.ru . Выдвигая стратегию , противник понимает, что мы ответим на эту стратегию той стратегией из всех возможных, которая даст нам максимальный выигрыш равный Нижняя и верхняя цена игры - student2.ru . Обозначим через наименьшее значение из всех : . Величина называется верхней ценой игры (минимаксом). Соответствующая минимаксному выигрышу стратегия противника называется его минимаксной стратегией. Придерживаясь своей наиболее осторожной минимаксной стратегии, игрок Нижняя и верхняя цена игры - student2.ru может гарантировать себе проигрыш не более , вне зависимости от того, как поступит игрок .

Верхняя цена игры - гарантированный проигрыш игрока Нижняя и верхняя цена игры - student2.ru при любой стратегии противника (это тот минимальный проигрыш, который может себе обеспечить игрок , действуя наиболее осторожно).

Принцип осторожности, диктующий игрокам выбор соответствующих стратегий в теории игр в ее приложениях, часто называют принципом минимакса.

Задача № 6.1.

Игроки Нижняя и верхняя цена игры - student2.ru и одновременно и независимо друг от друга пишут одно из трех чисел: 1, 2 или 3. Если сумма написанных чисел четная, то платит эту сумму в рублях; если она нечетная, то, наоборот, Нижняя и верхняя цена игры - student2.ru платит эту сумму. Требуется проанализировать игру; составить ее матрицу; найти нижнюю и верхнюю цены игры.

Решение.

Игра состоит из двух ходов (ход игрока Нижняя и верхняя цена игры - student2.ru и ход игрока ), оба хода личные. У игрока три стратегии: - написать число 1; – написать число 2; – написать число 3. У противника (игрока Нижняя и верхняя цена игры - student2.ru ) тоже три стратегии. Игра представляет собой игру 3 3 с матрицей, приведенной ниже.


2	-3	4	-3
-3	4	-5	-5
4	-5	6	-5
4	4	6	4 -3

Нижняя цена игры Нижняя и верхняя цена игры - student2.ru ; верхняя цена игры . Максиминная стратегия игрока это стратегия; применяя ее систематически, игрок может твердо рассчитывать на выигрыш не менее, чем «-3», т.е. его проигрыш не составит более, чем 3 рубля в каждой игре. Аналогично, применяя стратегии Нижняя и верхняя цена игры - student2.ru , игрок обеспечит себе этим проигрыш не более, чем в четыре рубля. Если же игрок отступит от своей минимаксной стратегии (например, выберет стратегию Нижняя и верхняя цена игры - student2.ru ) противник может, выбрав стратегию , свести выигрыш игрока к «-5». Отступление же игрока от своей минимаксной стратегии может свести его проигрыш к 6 рублям.

Задача №6.2.

В распоряжении игрока Нижняя и верхняя цена игры - student2.ru имеются три вида вооружения: , , . У противника имеется три вида самолетов , , . Задача игрока поразить самолет; задача противника (игрока Нижняя и верхняя цена игры - student2.ru ) – сохранить его. При применении вооружения самолеты , , поражаются соответственно с вероятностями: 0,9; 0,4; 0,2. При применении вооружения Нижняя и верхняя цена игры - student2.ru самолеты поражаются с вероятностями: 0,3; 0,6; 0,8, а при применении вооружения – 0,5; 0,7; 0,2. Сформулировать ситуацию в терминах теории игры. Определить верхнюю и нижнюю цены игры.

Решение.

Ситуация может рассматриваться как игра 3 Нижняя и верхняя цена игры - student2.ru 3 с двумя личными ходами и одним случайным. Личный ход игрока – выбор типа вооружения. Личный ход игрока – выбор вида самолета. Случайный ход - действие вооружения; этот ход может окончиться поражением или не поражением самолета. Выигрыш игрока Нижняя и верхняя цена игры - student2.ru равен единице, если самолет поражен, и равен нулю в противном случае. Стратегиями игрока являются три варианта вооружения; стратегиями игрока Нижняя и верхняя цена игры - student2.ru являются три варианта самолетов. Среднее значение выигрыша при каждой заданной паре стратегий есть не что иное, как вероятность поражения данного самолета данным оружием. Ниже приводится матрица игры:


0,9	0,4	0,2	0,2
0,3	0,6	0,8	0,3
0,5	0,7	0,2	0,2
0,9	0,7	0,8	0,7 0,3

Нижняя цена игры Нижняя и верхняя цена игры - student2.ru =0,3; верхняя цена игры =0,7. Наиболее осторожная (максиминная) стратегия игрока – это стратегия ; пользуясь вооружением , игрок гарантирует себе, что будет поражать самолеты в среднем не менее, чем с частотой 0,3. Наиболее осторожной (минимаксной) стратегией игрока Нижняя и верхняя цена игры - student2.ru будет стратегия . Выбирая второй вид самолетов, игрок может быть уверен, что он будет поражаться не более чем с частотой 0,7.

Продемонстрируем на данном примере свойство неустойчивости минимаксных стратегий.До тех пор пока оба игрока придерживаются своих наиболее осторожных стратегий, средний выигрыш игрока Нижняя и верхняя цена игры - student2.ru равен 0,6. Это число больше, чем нижняя цена игры =0,3, но меньше, чем верхняя цена игры =0,7. Теперь допустим, что игроку стало известно, что игрок Нижняя и верхняя цена игры - student2.ru применяет стратегию , он немедленно применит стратегию , чем сведет выигрыш игрока к 0,3. В свою очередь, на стратегию игрок может ответить стратегией Нижняя и верхняя цена игры - student2.ru , дающей выигрыш 0,9 и т.д.

Таким образом, положение, при котором оба игрока пользуются своими минимаксными стратегиями, является неустойчивым и может быть нарушено поступившими сведениями о стратегии противоположной стороны.

Однако существуют некоторые игры, для которых минимаксные стратегии являются устойчивыми. Это те игры, для которых нижняя цена игры равна верхней: Нижняя и верхняя цена игры - student2.ru .

Если нижняя цена игры равна верхней, то их общее значение называется чистой ценой игры или просто ценой игры.

Задача №6.3

Пусть игра задана платежной матрицей 4 Нижняя и верхняя цена игры - student2.ru 4:


0,4	0,5	0,9	0.3	0,3
0,8	0,4	0,3	0.7	0,3
0,7	0,6	0,8	0.9	0,6
0.7	0.2	0.4	0.6	0.2
0,8	0,6	0,8	0.9	0.6 0.6

Найдем нижнюю цену игры: Нижняя и верхняя цена игры - student2.ru =0,6. Найдем верхнюю цену игры: =0,6. Они оказались равными. Следовательно, у игры есть чистая цена , равная .

Элемент 0,6, выделенный в платежной матрице, является одновременно минимальным в своей строке и максимальным в своем столбце. В геометрии точку на поверхности, обладающую аналогичным свойством, называют седловой точкой; по аналогии этот термин применяется и в теории игр. Элемент матрицы, обладающий этим свойством, называется седловой точкой матрицы, а про игру говорят, что она имеет седловую точку.

Седловая точка – платеж, который одновременно является наибольшим в своем столбце и наименьшим в своей строке.

Стратегии, соответствующие седловой точке, называют оптимальными стратегиями (в данном примере Нижняя и верхняя цена игры - student2.ru , ), а их совокупность называют решением игры.

Решение игры обладает замечательным свойством. Если один из игроков придерживается своей оптимальной стратегии, а другой игрок будет любым способом отклоняться от своей оптимальной стратегии, то для игрока допустившего отклонение, это никогда не может оказаться выгодным: в лучшем случае выигрыш его останется неизменным, в худшем случае его выигрыш уменьшится (проигрыш увеличится).

Это утверждение легко проверить на примере рассматриваемой игры с седловой точкой. Мы видим, что в случае игры с седловой точкой минимаксные стратегии обладают своеобразной «устойчивостью»: если одна сторона придерживается своей минимаксной стратегии, то для другой невыгодно отклоняться от своей минимаксной стратегии. В данном случае, даже если у игроков имеются сведения о том, что противник избрал свою оптимальную стратегию, это не изменит поведения игроков. Пара оптимальных стратегий в игре с седловой точкой является как бы «положением равновесия»: любое отклонение от оптимальной стратегии приводит отклоняющегося игрока к невыгодным последствиям, вынуждающим его вернуться в исходное положение.

Наши рекомендации

Глава X. Верхняя и нижняя ель

Комара (из Зеликмана): / — верхняя губа, 2 — мандибула. 3 — нижняя челюсть, 4 — гипофаринкс, 5—нижняя губа, 6 — «ижне-челюстной щупик, 7 — сяжки

Верхняя и нижняя челюсти у детей

Платежная матрица. Нижняя и верхняя цена игры

Нижняя и верхняя цены игры. Принцип минимакса

Нижняя и верхняя цена игры. принцип минимакса

Верхняя и нижняя конечности

Нижняя и верхняя половины матрицы

Платежная матрица. Нижняя и верхняя цена игры

Монопольная цена –верхняя цена, по которой монополист может продать товар или услугу, и которая включает максимальную Р3.

← Предыдущая страница | Следующая страница →