Сведение матричной игры к задаче линейного программирования

Общим методом нахождения решения игры любой конечной размерности является ее сведение к задаче линейного программирования. Из основного положения теории игр следует, что при использовании смешанных стратегий такое оптимальное решение всегда существует и цена игры γ находится между верхним и нижним значениями игры (α≤γ≤β).

Допустим, что смешанная стратегия игрока А складывается из стратегий Сведение матричной игры к задаче линейного программирования - student2.ru с вероятностями Сведение матричной игры к задаче линейного программирования - student2.ru (некоторые из значений вероятностей могут быть равны нулю). Оптимальная смешанная стратегия игрока В складывается из стратегий Сведение матричной игры к задаче линейного программирования - student2.ru с вероятностями Сведение матричной игры к задаче линейного программирования - student2.ru . Условия игры определяются платежной матрицей Сведение матричной игры к задаче линейного программирования - student2.ru с элементами Сведение матричной игры к задаче линейного программирования - student2.ru , Сведение матричной игры к задаче линейного программирования - student2.ru ; Сведение матричной игры к задаче линейного программирования - student2.ru . Если игрок А применяет оптимальную смешанную стратегию, а игрок B — чистую стратегию Сведение матричной игры к задаче линейного программирования - student2.ru , то средний выигрыш игрока А (математическое ожидание выигрыша) составит

Сведение матричной игры к задаче линейного программирования - student2.ru .

Игрок А стремится к тому, чтобы при любой стратегии игрока В его выигрыш был не меньше, чем цена игры γ, а сама цена игры была максимальной. Такое поведение игрока А описывается следующей задачей линейного программирования:

Сведение матричной игры к задаче линейного программирования - student2.ru (игрок А стремится максимизировать свой выигрыш)

Сведение матричной игры к задаче линейного программирования - student2.ru

Используя обозначения Сведение матричной игры к задаче линейного программирования - student2.ru и соотношение Сведение матричной игры к задаче линейного программирования - student2.ru , получим Сведение матричной игры к задаче линейного программирования - student2.ru . Отсюда

Сведение матричной игры к задаче линейного программирования - student2.ru

Сведение матричной игры к задаче линейного программирования - student2.ru

Эта задача всегда имеет решение Сведение матричной игры к задаче линейного программирования - student2.ru , получив которое (например, с помощью надстройки Поиск решения MS Excel) можно найти цену игры Сведение матричной игры к задаче линейного программирования - student2.ru и оптимальные значения вероятностей Сведение матричной игры к задаче линейного программирования - student2.ru — оптимальную смешанную стратегию игрока А.

Требуется обратить внимание на то, что матрица игры представлена в неравенствах в транспонированном виде.

Поведению игрока B соответствует двойственная задача линейного программирования:

Сведение матричной игры к задаче линейного программирования - student2.ru

(эквивалентно Сведение матричной игры к задаче линейного программирования - student2.ru : игрок B стремится минимизировать свой средний проигрыш)

Сведение матричной игры к задаче линейного программирования - student2.ru

Здесь Сведение матричной игры к задаче линейного программирования - student2.ru .

Если в исходной платежной матрице имеется хотя бы один неположительный элемент, то первым шагом в процедуре сведения игры к задаче линейного программирования должно быть ее преобразование к матрице, все элементы которой строго положительны. Для этого достаточно увеличить все элементы исходной матрицы на одно и то же число

Сведение матричной игры к задаче линейного программирования - student2.ru , Сведение матричной игры к задаче линейного программирования - student2.ru .

При таком преобразовании матрицы оптимальные стратегии игроков не изменятся. Если исходная матрица увеличивалась на d, то для получения цены первоначальной игры, γ нужно уменьшить на d.

Варианты заданий:

1.

  В1 В2 В3 В4
А1
А2
А3
А4

2.

  В1 В2 В3 В4
А1 -2 -3
А2
А3 -2
А4

3.

  В1 В2 В3 В4
А1
А2 -3 -2
А3 -4 -1
А4 -3


4.

  В1 В2 В3 В4
А1
А2 -1
А3 -3
А4 -3 -1

5.

  В1 В2 В3 В4
А1 -1
А2
А3
А4 -3

6.

  В1 В2 В3 В4
А1 -1
А2 -5
А3
А4

7.

  В1 В2 В3 В4
А1
А2
А3
А4 -1

8.

  В1 В2 В3 В4
А1
А2
А3
А4

9.

  В1 В2 В3 В4
А1 -4 -5
А2 -3 -4 -9 -2
А3 -8 -9
А4 -9

10.

  В1 В2 В3 В4
А1 0,8 0,6 0,2 -0,8
А2 -0,8 0,9 -0,4 0,5
А3 1,7 0,5 0,3 0,6
А4 0,3 -0,8 0,1 0,7

11.

  В1 В2 В3 В4
А1 -5 -1
А2
А3 -6
А4 -9 -2

12.

  В1 В2 В3 В4
А1 -2 -1 -2
А2 -2 -5
А3
А4 -2

13.

  В1 В2 В3 В4
А1
А2 -2 -5
А3 -3 -5
А4

14.

  В1 В2 В3 В4
А1 -8
А2 -1
А3
А4 -3

15.

  В1 В2 В3 В4
А1 -5
А2 -4
А3
А4

16.

  В1 В2 В3 В4
А1
А2
А3 -5 -2 -3
А4 -2 -5

17.

  В1 В2 В3 В4
А1
А2 -1 -6
А3 -2 -8
А4 -2 -4

18.

  В1 В2 В3 В4
А1 -7
А2 -2 -5
А3
А4 -5

19.

  В1 В2 В3 В4
А1 -5
А2
А3 -8 -5
А4 -3

20.

  В1 В2 В3 В4
А1 -7
А2
А3 -3
А4 -3


21.

  В1 В2 В3 В4
А1
А2
А3 -3
А4 -6

22.

  В1 В2 В3 В4
А1 -3
А2
А3
А4 -5

23.

  В1 В2 В3 В4
А1 -5 -8 -2
А2 -2 -6
А3 -4 -3 -5
А4 -1

24.

  В1 В2 В3 В4
А1
А2
А3
А4

25.

  В1 В2 В3 В4
А1 -7
А2
А3 -6
А4

Лабораторная работа №6

Тема: Итерационный метод решения матричных игр

Цель: Приобрести навыки поиска рациональных решений с помощью итерационного метода.

Порядок выполнения работы:

1. Изучить теоретическую часть;

2. Упростить заданную по варианту матрицу, убрав доминантные строки;

3. С помощью MS Excel или написав программу, определить итерационным методом цену игры и оптимальные стратегии для каждого из игроков.

4. Проверить результат решения с помощью приведения задачи к задаче линейного программирования (ЛП).

Теория:

Ситуации, связанные с принятием решений, в которых два или более разумных противника имеют конфликтующие цели, рассматриваются в теории игр. Само слово «игра» применяется для обозначения некоторого набора правил и соглашений, составляющих данный вид игры, например: футбол, карточная игра, шахматы. Эти ситуации принятия решений отличаются от рассмотренных ранее, где природа, хотя и могла находиться в различных состояниях, но не преследовала каких-либо целей и, следовательно, не рассматривалась в роли соперника.

Общие понятия матричных игр

В игре заинтересованные стороны называются игроками, каждый из которых имеет некоторое множество вариантов выбора (не меньше двух, иначе он фактически не участвует в игре, поскольку заранее известно, что он предпримет). В экономике модель поведения лиц в виде игры возникает, например, при попытке нескольких фирм завоевать наиболее выгодное место на конкурентном рынке, или, например, при желании нескольких лиц (кампаний) разделить некоторое количество продукта (ресурса, финансовых средств) между собой так, чтобы каждому досталось как можно больше. Игроками в конфликтных экономических ситуациях, моделируемых в виде игры, являются производственные и непроизводственные фирмы, банки, отдельные люди и другие экономические агенты. В военных приложениях модель игры используется, например, для наилучшего выбора средств (из имеющихся или потенциально возможных) поражения военных целей противника или защиты от его нападения.

Для игр характерна неопределенность результата. Причины или источники неопределенности относятся к трем группам:

1. Комбинаторные источники (например игра шахматы);

2. Случайные факторы (например игры кости, карточные игры, где случаен расклад);

3. Неопределенность имеет стратегическое происхождение: игрок не знает, какого рода образа действий придерживается его противник. Здесь неопределенность исходит от другого лица.

Далее будем рассматривать игровые модели конфликтов, в которых участвуют два противника, каждый из которых имеет конечное число вариантов выбора решений. С каждой парой решений связан платеж, который один из игроков выплачивает другому (т.е. выигрыш одного игрока равен проигрышу другого). Такие игры принято называть конечными играми двух лиц с нулевой суммой.

В игре принимают участие два игрока: A и B. В распоряжении каждого игрока имеется конечное множество вариантов выбора — стратегий. Пусть Сведение матричной игры к задаче линейного программирования - student2.ru — множество стратегий игрока A, Сведение матричной игры к задаче линейного программирования - student2.ru — множество стратегий игрока B. С каждой парой стратегий связан платеж, который один из игроков выплачивает другому. Т.е., когда игрок А выбирает стратегию Сведение матричной игры к задаче линейного программирования - student2.ru (свою i-ю стратегию), а игрок В — стратегию Сведение матричной игры к задаче линейного программирования - student2.ru , то результатом такого выбора становится платеж Сведение матричной игры к задаче линейного программирования - student2.ru . Поскольку стратегий конечное число, то платежи Сведение матричной игры к задаче линейного программирования - student2.ru образуют матрицу размерности n x m, называемую матрицей платежей (или матрицей игры). Строки этой матрицы соответствуют стратегиям игрока А, а столбцы — стратегиям игрока В.

Пусть два игрока А и В играют в игру, основанную на подбрасывании монеты. Игроки одновременно и независимо друг от друга выбирают герб (Г) или решку (Р). Если результаты двух подбрасываний монеты совпадают (т.е. ГГ или РР), то игрок А получает один доллар от игрока В. Иначе игрок А платит один доллар игроку В.

Для каждого из игроков возможны 2 варианта результатов: выпадения герба или решки, следовательно матрица платежей имеет размерность 2 х 2 следующего вида:

  BГ BР
AГ    
AР    

Если результаты двух подбрасываний (т.е. подбрасываний монеты игроками А и В) совпадают, то платеж в 1 доллар получает игрок А. Будем строить матрицу игры, с точки зрения игрока А, т.е. его выигрыши оценивать как положительные, а проигрыши — как отрицательные (с точки зрения В все будет наоборот и мы вполне могли бы построить матрицы платежей, ориентируясь на его точку зрения).

  BГ BР
AГ  
AР  

Если результаты подбрасывания различаются, то доллар получает В, значит платеж А равняется –1 доллар. В игре с нулевой суммой выигрыш игрока B равносилен проигрышу игрока A и равен поэтому Сведение матричной игры к задаче линейного программирования - student2.ru .

  BГ BР
AГ –1
AР –1

Т.о., мы построили матрицу игры, описывающую заданную ситуацию. Предполагается, что матрица игры обоим игрокам известна.

Исход игры зависит от поведения обоих игроков, которое основывается на выборе правильных стратегий игры, т.е. таких вариантов, при которых так платеж данному игроку будет наибольшим. Однако, в отличие от методов оптимизации, в теории игр игрок не может просто стремиться к максимуму, он вынужден считаться с действиями соперника. Существенно, что ни один из партнеров не знает, какую стратегию применит его противник. Таким образом, имеет место ситуация полной неопределенности, при которой теория вероятности также не может помочь игрокам в выборе решения.

Наши рекомендации