Порядок выполнения работы. Ознакомиться с методами решения задач матричных игр методами линейного
Цель работы
Ознакомиться с методами решения задач матричных игр методами линейного программирования [1,2].
Методические указания
Постановка общей задачи теории игр
Теория игр – математическая теория конфликтных ситуаций. Экономические соревнования, спортивные встречи, боевые операции – примеры конфликтных ситуаций. Простейшие модели конфликтных ситуаций – это салонные и спортивные игры.
В игре могут сталкиваться интересы двух противников (игра парная или игра двух лиц), интересы n (n > 2) противников (игра множественная или игра n лиц). Существуют игры с бесконечным множеством игроков.
Стратегией игрока называется система правил, однозначно определяющих выбор поведения игрока на каждом ходе в зависимости от ситуации, сложившейся в процессе игры. В зависимости от числа возможных стратегий игры делятся на конечные и бесконечные.
Процесс игры состоит в выборе каждым игроком i одной своей стратегии .В результате сложившейся ситуации s игрок i получает выигрыш .
Игры, в которых целью каждого участника является получение по возможности большего индивидуального выигрыша, называются бескоалиционными в отличие от коалиционных, в которых действия игроков направлены на максимизацию выигрышей коллективов (коалиции) без дальнейшего разделения выигрыша между участниками.
По определению бескоалиционной игрой называется система
,
в которой I и – множества, – функции на множестве принимающие вещественные значения.
Бескоалиционная игра называется игрой с постоянной суммой, если существует такое постоянное C, что для всех ситуаций .
Ситуация s в игре называется приемлемой для игрока i, если этот игрок, изменяя в ситуации s свою стратегию si на какую-либо другую si', не может увеличить своего выигрыша.
Ситуация s, приемлемая для всех игроков, называется ситуацией равновесия.
Процесс нахождения ситуации равновесия в бескоалиционной игре есть процесс решения игры.
Матричные игры
Игра называется парной, если в ней сталкиваются интересы двух противников. Игра называется с нулевой суммой, если один игрок выигрывает столько, сколько второй проигрывает в той же партии.
Каждая фиксированная стратегия, которую может выбрать игрок, называется его чистой стратегией.
Матричной называют парную игру с нулевой суммой при условии, что каждый игрок имеет конечное число чистых стратегий.
Пусть первый игрок имеет m чистых стратегий, а второй – n.
Парная игра с нулевой суммой задается ' формально системой чисел – матрицей , элементы которой определяют выигрыш первого игрока (и соответственно проигрыш второго), если первый игрок выберет i-ю строку (i-ю стратегию), а второй игрок j-й столбец (j-ю стратегию). Матрица называется платежной матрицей или матрицей игры.
Задача первого игрока – максимизировать свой выигрыш.
Задача второго игрока – максимизировать свой выигрыш – сводится к минимизации проигрыша второго, что эквивалентно задаче минимизации выигрыша первого игрока.
Чистые стратегии
Гарантированный выигрыш первого игрока, применяющего чистую i-ю стратегию,
Число называется нижним значением игры, а соответствующая чистая стратегия i0, при которой достигается называется максиминной стратегией первого игрока. Аналогично, называется верхним значением игры а j0 – минимаксной стратегией второго игрока.
Всегда . Если то игра имеет седловую точку в чистых стратегиях; число называется значением игры (или ценой игры). Игра имеет седловую точку в чистых стратегиях тогда и только тогда, когда существует элемент матрицы , минимальный в своей строке и в то же время максимальный в столбце
(1) |
Любая пара (i0, j0), обладающая свойством (10.1), называется седловой точкой.
Смешанные стратегии
Если обозначить через x1, x2, …, xm вероятности (частоты), с которыми первый игрок выбирает соответственно первую, вторую, . . ., m-ю чистую стратегию, так что через ; через y1, y2, …, yn вероятности, с которыми второй игрок выбирает первую, вторую, ,.., n-ю свою чистую стратегию, причем , то наборы чисел x=( x1, x2, …, xm) и y=(y1, y2, …, yn) называются смешанными стратегиями первого и второго игроков соответственно. Каждый игрок имеет бесчисленное множество смешанных стратегий. Множество смешанных стратегий первого игрока обозначим через s1 и множество смешанных стратегий второго игрока – через s2.
Задача первого игрока состоит в выборе такой стратеги чтобы при отсутствии информации о выборе другого максимизировать свой выигрыш. Задача второго игрока состоит в выборе такой стратегии , чтобы при отсутствии информации о поведении первого игрока минимизировать выигрыш первого.
Если первый игрок применяет стратегию , а второй – стратегию то средний выигрыш M(x, y) первого игрока равен
Выигрыш M(x, y) называют функцией игры.
Например, в задаче с матрицей
первый игрок имеет две чистые стратегии , и бесчисленное множество смешанных стратегий, таких, как , и т. д.; все они являются элементами множества второй игрок имеет четыре чистые стратегии и бесчисленное множество смешанных стратегий, таких, как , являющихся элементами множества
Если первый игрок применяет смешанную стратегию , а второй применяет стратегию , то средний выигрыш первого игрока, определяемый функцией игры, окажется равным
Если же первый игрок применяет стратегию , а второй — стратегию , то . Оптимальная стратегия первого игрока второго игрока ; —цена игры.
Седловая точка в смешанных стратегиях
Пара смешанных стратегий (х*, у*) называется седловой точкой функции М(х, у), если
(2) |
Каждая матричная игра с нулевой суммой имеет решение в смешанных стратегиях, т. е. существуют такие смешанные стратегии х* и y* первого и второго игроков соответственно, что выполняется условие (10.2). Гарантированный выигрыш первого игрока, применяющего смешанную стратегию
Стратегия х*, при которой гарантированный выигрыш первого игрока достигает максимального значения, называется оптимальной стратегией первого игрока:
Гарантированный проигрыш второго игрока
y* – оптимальная стратегия второго игрока, если
Гарантированный выигрыш первого игрока, применяющего свою оптимальную стратегию, равен гарантированному проигрышу второго игроку, применяющего свою оптимальную стратегию: – цена игры.
Сведение задачи теория игр к задаче линейного программирования
Задача максимизации гарантированного выигрыша первого игрока и задача минимизации гарантированного проигрыша второго игрока сводятся к паре взаимно двойственных задач линейного программирования:
Задача первого игрока | Задача второго игрока |
Процесс решения задач упрощается, если перейти к Переменным . Это возможно, если .
Имеем:
Задача первого игрока | Задача второго игрока |
Оптимальные стратегии игроков не изменятся, если матрицу игры заменить на . Цена игры при этом увеличивается на с.
Методы решения задач теории игр
Методы решения задач теории игр во многом зависят от условий задачи и от матрицы А выигрышей первого игрока.
1) Если матрица А имеет седловую точку, то решение игры сводится к нахождению седловой точки матрицы А. Оптимальные стратегии игроков определяются при этом координатами (i,j) седловой точки матрицы А, а цена игры элементом в седловой точке.
Пример 1. Найти оптимальные стратегии игроков и цену игры:
Минимизируя элементы первой строки, получим, что –
, аналогично, , .
Максимизируя элементы по столбцам, получим: . Нижняя цена игры определяется путем максимизации :
Верхняя цена игры определяется минимизацией :
Имеем , так что . Игра, определяемая матрицей A, имеет седловую точку (2, 3). Задача разрешима в чистых стратегиях. Оптимальный способ игры найден. Придерживаясь чистой второй стратегии, первый игрок обеспечивает себе выигрыш, не меньший 5, второй игрок, применяя чистую третью стратегию, проигрывает не более 5. Обе стратегии i=2 и j=3являются оптимальными для первого и второго игроков. Цена игры v=5.
2) Если матрица А имеет размер или , то решение задачи может быть получено графически.
Иногда процесс решения задачи можно упростить, если вычеркнуть из матрицы доминируемые (неполезные) стратегии. Вычеркнутым стратегиям соответствуют нулевые компоненты в смешанных стратегиях. Стратегия i0 для первого игрока является доминируемой, если существует такая стратегия i1 для первого игрока, что
или если существуют такие числа , что
Стратегия j0 для второго игрока является доминирующей, если существует такая стратегия j1 второго игрока, что
или если существуют такие числа , что
Пример 2. Найти оптимальные стратегии игроков и цену игры
В чистых стратегиях решения игры нет, так как
Упростим матрицуA, заметив, что
Задачу с матрицей размера 2x3 решим геометрически:
В плоскости переменных (x, v) построим – vj(x) ожидаемый средний выигрыш первого (рис. 1) игрока, применяющего первую стратегию с вероятностью х при условии, что второй игрок отвечает чистой стратегией j (j=1,2,3):
В точке А (рис. 1) пересечения прямых v1(x) и v2(x) гарантированный выигрыш первого игрока (изображенный жирной линией) достигает наибольшего значения Исходная задача с матрицей А имеет следующее решение: |
3) Если задача теории игр не имеет решения в чистых стратегиях и не может быть решена графически, то для получения точного решения игры используют методы линейного программирования.
Целесообразно задачу второго игрока решать симплекс-методом. В послед ней симплекс-таблице, содержащей оптимальное решение задачи второго игрока, можно найти и оптимальное решение двойственной задачи – задачи первого игрока.
Пример 3.Получить решение задачи теории игр, если матрица выигрышей первого игрока известна:
Очевидно, что матрица А не имеет седловой точки и что графический способ решения неприемлем.
Построим пару взаимно двойственных задач линейного программирования, эквивалентную игре с матрицей . Имеем:
Сведем задачу второго игрока к канонической задаче минимизации
и составим симплекс-таблицу, которая приведена к базису опорного решения :
1/3 | 1/3 | 1/3 | ||||||||||||||
10/3 | -3 | -2/3 | 1/3 | |||||||||||||
2/3 | -1 | -1/3 | -1/3 |
Выбираем положительную оценку и находим наименьшее отношение min{l/3, 1/2} = 1/3. С ведущим элементом выполняем жорданово преобразование таблицы. Получаем
-14/3 | 4/3 | -2 | 1/3 | ||||
1/3 | 1/3 | 1/3 | |||||
10/3 | -1 | -2/9 | 1/3 | 1/9 | |||
-4/9 | -1/9 | -1/3 | -4/9 |
Все оценки базиса не положительны. Следовательно, – оптимальное опорное решение канонической задачи минимизации. Поэтому является оптимальным решением задачи линейного программирования и .
Компоненты оптимального решения двойственной задачи определяются с помощью оценочной строки последней симплекс-таблицы, а именно , так что – оптимальное решение двойственной задачи. Переходя к первоначальным переменным , задачи, получим .
Наконец,
Порядок выполнения работы
1. Сделать формальную постановку задачи.
2. Определить множество возможных стратегий игроков, при этом по возможности исключить эквивалентные стратегии.
3. Выписать матрицу игры.
4. Найти оптимальные стратегии игроков, используя симплекс–метод.
Задачи для решения
1. (Морра)
Игроки одновременно показывают один или два пальца, и в тот же момент каждый из игроков называет число. Если число, названное одним из игроков, совпадает с общим числом пальцев, показываемых обоими игроками, то игрок получает со своего противника выигрыш, равный этому числу.
2. (Игра А,B,C)
Тасуется колода, состоящая из трех карт: А,B,C, и каждому из двух игроков дается по одной карте. Посмотрев свою карту, I–й игрок делает предположение относительно того, какая карта у II–го игрока.. Посмотрев на свою карту и услышав предположение I–го игрока, II–й игрок также пытается угадать карту I–го. Если какой–либо из игроков угадывает правильно, другой платит ему 1$.
3. (Упрощенный покер)
Первый игрок получает одну из карт Ст и Мл с равными вероятностями, а затем может или "сделать ставку" или "спасовать". Если первый делает ставку, то второй может "спасовать" и потерять 2 или "уравнять игру", и выиграть или потерять 1 в зависимости от того, имеется ли на руках у первого игрока карта Мл или Ст. Если первый игрок пасует, то второй может также пасовать, что дает выигрыш 0, или сделать ставку, выигрывая 2, если у первого игрока карта Мл, и теряя 1, если у первого игрока Ст.
4. (о шарах)
Известно, что в урне находятся два шара, каждый из которых либо белый, либо черный. Игрок должен определить, сколько там черных шаров. Если его предположение правильно, ему должно быть уплачено ; если его ответ отличается от правильного на 1 (например, он указывает 1, когда в действительности 2 черных шара, или указывает 2, когда в действительности один шар, и т.д.), то ему должно быть уплачено ; если ответ отличается от правильного на 2, то ему должно быть уплачено , причем . Стоимость исследования одного шара равна .
5.(Оборона города или игра полковника Блотто)
Полковник Блотто имеет m полков, а его противник – n полков. Противник защищает две позиции. Позиция будет занята полковником Блотто, если на ней наступающие полки окажутся в численном превосходстве. Противоборствующим сторонам требуется распределить полки между двумя позициями.
6.(Игра на уклонение)
Игроки 1 и 2 выбирают целые числа между 1 и n, при этом игрок 1 выигрывает величину |i–j|.
7.(Дискретная игра типа дуэли)
Игроки продвигаются навстречу друг другу на n шагов. После каждого сделанного шага игрок может выстрелить или нет, но во время игры он может выстрелить только один раз. Считается, что вероятность того, что игрок попадает в своего противника, если выстрелит, продвинувшись на k шагов, равна k/n (k£n).
Варианты заданий
1. Задача 1
2. Задача 2
3. Задача 3 при ,
4. Задача 3 при ,
5. Задача 3 при ,
6. Задача 4 при , , ,
7. Задача 4 при , , ,
8. Задача 4 при , , ,
9. Задача 5 при m=5 n=2.
10. Задача 5 при m=4 n=3.
11. Задача 6 при n=4.
12. Задача 6 при n=5.
13. Задача 6 при n=6.
14. Задача 7 при n=5.
15. Задача 7 при n=6.
16. Задача 7 при n=7.
Содержание отчета
Отчет по работе должен содержать титульный лист, цель работы, вариант задания, математическую постановку задачи, оптимальные стратегии игроков, значение игры, выводы.
Контрольные вопросы
1. Понятие стратегии. Чистые и смешанные стратегии. Выбор оптимальной стратегии.
2. Решение матричных игр с помощью методов линейного программирования.
3. Игры с нулевой суммой.
Литература
1. Гейл Д. . Теория линейных экономических моделей. М.: Изд–во иностранной литературы, 1968.
2. Петросян Л.А. Зенкевич Н.А. Семина Е.А. Теория игр : Учеб. пособие – М.: ВЫСШ. ШК.; : УНИВЕРСИТЕТ, 1998. – 300 с.