Пример 3. Решение статистической игры
Рассмотрим пример решения статистической игры в экономической задаче.
Сельскохозяйственное предприятие производит капусту. Оно имеет возможность хранить произведённую капусту в течение всего сезона реализации – с осени до начала лета следующего года. Хозяйство может выбрать одну из трёх стратегических программ реализации капусты в течение сезона реализации:
A1 - реализовать всю капусту осенью, непосредственно после уборки;
A2 - заложить часть капусты на хранение и реализовать её в течение осенних и зимних месяцев;
A3 – заложить всю капусту на хранение и реализовать её в весенние месяцы.
Сумма затрат на производство, хранение и реализацию капусты для хозяйства при выборе им каждой из стратегий составляет соответственно 20, 30 и 40 тыс. денежных единиц.
На региональном рынке капусты может сложиться одна из следующих трёх ситуаций:
S1 - поступление капусты на рынок происходит равномерно в течение всего сезона реализации и рынок не испытывает сезонных колебаний цен реализации продукта;
S2 - в осенние месяцы на рынок поступает капусты немного больше, чем зимой и весной. В связи с этим наблюдаются небольшие сезонные колебания цен – в начале зимы цены немного возрастают по сравнению с осенним уровнем и держатся стабильными в течение всех последующих месяцев сезона реализации;
S3 - в осенние месяцы на рынок поступает капусты значительно больше, чем зимой и весной. Объёмы капусты, поступающей в течение сезона реализации, постоянно уменьшаются.Значения суммы выручки предприятия от реализации капусты при выборе каждой из стратегий реализации и формировании различных ситуаций на рынке представлены в таблице 10.
Таблица 10
Выручка от реализации капусты, тыс. д.е.
Стратегии хозяйства | Выручка от реализации капусты, тыс. д.е. | ||
S1 | S2 | S3 | |
A1 | 30 | 25 | 22 |
A2 | 30 | 40 | 33 |
A3 | 30 | 40 | 60 |
В задаче необходимо определить:
1. Какая стратегия хозяйства является наиболее выгодной, если известны значения вероятностей состояний рынка капусты региона: 0,3, 0,6 и 0,1 соответственно;
2. Какая стратегия хозяйства является наиболее выгодной, если информация о вероятностях состояний рынка капусты отсутствует и предприятию необходимо:
а) получить минимально гарантированный выигрыш;
б) учесть значения риска от принятия различных решений;
в) определить наиболее выгодную стратегию, если коэффициент пессимизма равен 0,3;
3. Определить наиболее выгодную стратегию, если информация о вероятностях состояний рынка не является вполне достоверной и параметр достоверности информации равен 0,7.
Решение
1. Составим платёжную матрицу данной игры. Её коэффициентами будут значения прибыли от производства капусты, получаемые как разница суммы выручки от реализации капусты и затрат на производство, хранение и реализацию капусты (см. таблицу 11).
Таблица 11
Платёжная матрица задачи определения наиболее выгодной стратегии реализации капусты
S1 | S2 | S3 | |
A1 | 10 | 5 | 2 |
A2 | 0 | 10 | 3 |
A3 | -10 | 0 | 20 |
3. Определим наиболее выгодную стратегию по критерию максимального математического ожидания выигрыша:
W1 = 10×0,3 + 5×0,6 + 2×0,1 = 6,2
W2 = 0×0,3 + 10×0,6 + 3×0,1 = 6,3
W3 = -10×0,3 + 0×0,6 + 20×0,1 = -1
Таблица 12
Определение оптимальной стратегии в статистической игре по критерию максимального математического ожидания
S1 | S2 | S3 | Wi | |
Pj | 0,3 | 0,6 | 0,1 | |
A1 | 10 | 5 | 2 | 6.2 |
A2 | 0 | 10 | 3 | 6.3 |
A3 | -10 | 0 | 20 | -1 |
Оптимальной по данному критерию при указанных значениях вероятностей состояния рынка капусты будет стратегия A2 (W = 6,3) (см. таблицу 12).
3. Определим наиболее выгодные стратегии предприятия по ММ-критерию, критерию недостаточного основания Лапласа (НО-критерий) и критерию пессимизма-оптимизма.
Таблица 13
Определение оптимальной стратегии в статистической игре по максиминному критерию, критерию недостаточного основания Лапласа и критерию пессимизма-оптимизма
S1 | S2 | S3 | Wi (ММ) | Wi (НО) | Wi (ПО) | |
A1 | 10 | 5 | 2 | 2 | 5,67 | 7,6 |
A2 | 0 | 10 | 3 | 0 | 4,33 | 7 |
A3 | -10 | 0 | 20 | -10 | 3,33 | 11 |
Значения Wi для ММ-критерия:
W1 = min (10, 5, 2) = 2
W2 = min (0, 10, 3) = 0
W3 = min (-10, 0 20) =-10
W = max Wi = W1
Оптимальной стратегией по максиминному критерию является стратегия A1 (W = 2). Определим оптимальную стратегию по критерию недостаточного основания Лапласа. По данному критерию оптимальной является стратегия A1 (W = 5,67).
По критерию пессимизма-оптимизма при коэффициенте пессимизма, равном 0,3 – стратегия A3 (W = 11).
4. Определим наиболее выгодную стратегию по критерию минимаксного риска. Для этого рассчитаем матрицу рисков (см. таблицу 14).
Таблица 14
Определение оптимальной стратегии в статистической игре по критерию минимаксного риска с помощью построения матрицы рисков
S1 | S2 | S3 | Ri | |
A1 | 0 | 5 | 18 | 18 |
A2 | 10 | 0 | 17 | 17 |
A3 | 20 | 10 | 20 | 20 |
Оптимальной стратегией по критерию минимаксного риска является стратегия A2 (W = 17).
6. Определим наиболее выгодную стратегию предприятия по критерию Ходжа-Лемана (см. таблицу 15).
Таблица 15
Определение оптимальной стратегии в статистической игре по критерию Ходжа-Лемана
S1 | S2 | S3 | Wi | |
Pj | 0,3 | 0,6 | 0,1 | |
A1 | 10 | 5 | 2 | 4,94 |
A2 | 0 | 10 | 3 | 4,41 |
A3 | -10 | 0 | 20 | -3,7 |
По критерию Ходжа-Лемана оптимальной для хозяйства будет стратегия A1 (W = 4,94).
ЗАКЛЮЧЕНИЕ
Задачи, в которых возникают ситуации, где важную роль играют конфликты и совместные действия можно решать с помощью теории игр.
Решение задачи заключается в том, как должен вести себя разумный игрок в конфликте с разумным противником, чтобы обеспечить себе в среднем наибольший возможный выигрыш.
Для правильного применения теории игр в решении задач нужно знать основные понятия теории игр, их классификацию, уметь делать правильную постановку задачи с позиции теории игр и осуществлять их решение.
29)
Домини́рование в теории игр — ситуация, при которой одна из стратегий некоторого игрока дает больший выигрыш, нежели другая, при любых действиях его оппонентов. Обратное понятие, нетранзитивность, возникает, если некоторая стратегия может давать меньшие выигрыши, чем другая, в зависимости от поведения остальных участников.
Понятие доминирования используется при решении или упрощении некоторых типов некооперативных игр.
Содержание [убрать] · 1 Терминология · 2 Формальные определения · 3 Доминирование и равновесия Нэша · 4 Последовательное исключение доминируемых стратегий · 5 Литература |
[править]Терминология
При выборе своей стратегии из множества допустимых игрок сравнивает по предпочтительности исходы от их применения. Может возникать три типа результатов:
· Стратегия В доминирует стратегию A, если при любом поведении остальных игроков использование стратегии В приводит к не худшему исходу, нежели использование А. Различают строгое доминирование, когда В дает больший выигрыш, чем А, в любых условиях, и слабое доминирование, если при некоторых действиях других игроков В обеспечивает больший выигрыш, чем А, а при других — одинаковый с ней.
· Стратегия В доминируется стратегией A, если при любом поведении остальных игроков стратегия В приводит к не лучшему исходу, нежели стратегия А. Аналогично предыдущему случаю, стратегия может доминироваться строго и слабо.
· Стратегии А и В называются нетранзитивными, если В не доминирует А и А не доминирует В. Это оначает, что в зависимости от выбора стратегий другими игроками, большие выигрыши игроку может обеспечивать как выбор стратегии А, так и В.
Это понятие обобщается на сравнение более чем двух стратегий:
· Стратегия B называется строго доминирующей, если она строго доминирует любую другую допустимую стратегию игрока.
· Стратегия B называется слабо доминирующей, если она доминирует любую другую допустимую стратегию игрока, при этом некоторые из них доминируются слабо.
· Стратегия B называется строго доминируемой, если существует другая стратегия, которая строго ее доминирует.
· Стратегия B называется слабо доминируемой, если существует другая стратегия, которая слабо ее доминирует.
[править]Формальные определения
Говорят, что стратегия игрока слабо доминирует стратегию , если
, причем хотя бы одно неравенство выполнено строго.
Здесь представляет собой прямое произведение стратегических множеств всех игроков, кроме -го.
Стратегия строго доминирует , если
.
[править]Доминирование и равновесия Нэша
Основная статья: Равновесие в доминирующих стратегиях
C | D | |
C | 1, 1 | 0, 0 |
D | 0, 0 | 0, 0 |
Слабое доминирование |
Если для одного из игроков существует строго доминирующая стратегия, он будет ее использовать в любом из равновесий Нэша в игре. Если все игроки имеют строго доминирующие стратегии, игра имеет единственное равновесие Нэша. Однако, это равновесие не обязательно будет эффективным по Парето, т.е. неравновесные исходы могут обеспечить всем игрокам больший выигрыш. Классическим примером этой ситуации является игра «Дилемма заключенного».
Использование строго доминируемых стратегий ни при каких условиях не является рациональным для игроков, в связи с чем они не будут входить в равновесия Нэша. В то же время, слабо доминируемые стратегии могут входить в равновесия. Пример такой игры приведен справа.
Здесь стратегии D обоих игроков слабо доминируются их стратегиями C. Однако, ситуации (D, D) является равновесием Нэша в этой игре. Действительно, ни один из игроков, отклоняясь от использования D, не сможет получить большего выигрыша, если другой игрок придерживается D.
[править]Последовательное исключение доминируемых стратегий
Последовательное исключение доминируемых стратегий — часто используемая технология решения или упрощения некооперативных игр. Она основана на предположении о том, что в процессе игры стороны не будут использовать доминируемые стратегии, в связи с чем их можно не рассматривать при дальнейшем решении. Однако, исключение этих стратегий из рассмотрения приводит к сужению множества возможных ситуаций, в результате чего могут возникнуть новые доминируемые стратегии, которые в исходной игре не доминировались. Последовательное исключение доминируемых стратегий заключается в их отыскании и удалении в последовательности редуцированных игр с сужающимися множествами игровых ситуаций.
Этот процесс может останавливаться, приводя к редуцированной игре, в которой все стратегии игроков являются нетранзитивными либо к единственной ситуации. Если при этом удалялись строго доминируемые стратегии, такая ситуация является единственным равновесием Нэша в игре. Удаление слабо доминируемых стратегий также приводит к равновесию Нэша, однако это равновесие может быть не единственным. В некоторых играх, в зависимости от последовательности удаления слабо доминируемых стратегий, процесс итеративного исключения может сходиться к различным равновесиям Нэша.
править