Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования.

Решению из предыдущего раздела можно придать естественную графическую форму. Итак, вначале мы были заняты поиском оптимальной смешанной стратегии Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru нападающего. Она задаётся двумя неотрицательными числами Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru – частотами. Но поскольку их сумма равняется единице, смешанную стратегию можно, по существу, задать одним числом Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , где . Будем откладывать переменную по оси абсцисс, а по оси ординат будем откладывать средние выигрыши нападающего. Мы нарисуем два графика: средние выигрыши в случае, когда вратарь применяет чистую стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и в случае, когда он применяет чистую . При этом мы будем использовать тот общий факт, что такие зависимости линейные; и то, что две точки – при Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и при − непосредственно «считываются» из таблицы (12.1) (первая из них соответствует чистой стратегии Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru нападающего, а вторая – чистой стратегии ). Получаем следующую картинку:

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru

Теперь порассуждаем, глядя на неё. Как и выше, будем «болеть» сначала за команду нападающего, т.е. за игрока A. Нам надо помочь ему выбрать оптимальную смешанную стратегию. Теперь, вместо развилки трёх «дорог» из раздела 11, мы имеем бесконечное количество «дорог», индексированных вещественными числами Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru от 0 до 1. Предположим, что мы выбрали «дорогу» с некоторым значением Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Что самое худшее нас ждёт на ней? Проведём на картинке вертикальную двойную линию, соответствующую Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Ордината точки её пересечения с прямой, отвечающей стратегии Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru вратаря, является средним выигрышем форварда при условии, что вратарь применяет чистую Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Тоже верно и для точки пересечения со второй прямой, соответствующей Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . А что будет, если вратарь решит применить различные смешанные стратегии? Нетрудно сообразить, что соответствующие средние выигрыши нападающего заполнят «жирный» вертикальный отрезок между двумя рассмотренными только что точками. Из рисунка видно, что самый худший для нас вариант – это чистая стратегия Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Отметим соответствующую точку дополнительно маленьким прямоугольником. Пусть теперь значение Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru «пробежит» от 0 до 1. Тогда отмеченные точки образуют так называемую нижнюю огибающую двух наших прямолинейных графиков: в данном случае, это будет отмеченная прямоугольниками «крышечка». Выбираем теперь такое значение Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , при котором наихудший вариант будет относительно наилучшим – вновь применяем принцип максимина (как в разделе 11). Точка максимума огибающей – в данном случае точка пересечения прямых – и даст искомое оптимальное значение Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Разумеется, значение находится по формуле Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Тем самым, оптимальная смешанная стратегия нападающего Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru найдена.

Теперь «поболеем» за команду, которую представляет вратарь B. Аналогичным образом мы получим следующую картинку

Как и выше, рассматриваем фиксированную смешанную стратегию вратаря, соответствующую значению Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Возможные средние выигрыши нападающего (т.е. проигрыши вратаря) заполнят вновь «жирный» отрезок. Однако в данном случае самым худшим для нас (т.е. для вратаря) будет наибольшее значение ординаты. Таким образом, надо рассматривать верхнюю огибающую прямых, отмеченную на рисунке маленькими пустыми прямоугольниками. Поскольку мы стремимся минимизировать наш проигрыш, мы выбираем значение Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , соответствующее минимуму огибающей – точке пересечения прямых в данном случае (принцип минимакса). Вычисляя Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , мы определяем оптимальную смешанную стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru вратаря.

Аналогичный графический метод решения применим для игр, описываемых матрицами размера Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru или . В этих случаях надо начинать графическое решение обязательно с игрока с двумя стратегиями (т.к. именно его смешанная стратегия определяется ровно одним параметром). Рассмотрим, например, матричную игру Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . В этом случае всевозможные смешанные стратегии игрока A определяются значением Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Для каждой чистой стратегии игрока B мы получаем, как и выше, график среднего выигрыша игрока A – некоторый прямолинейный отрезок. Только теперь их будет Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru штук. Рассуждая как выше, приходим к построению нижней огибающей этих Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru графиков и нахождению её максимума (принцип максимина). Абсцисса точки максимума и будет искомым значением Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru .

Однако для нахождения оптимальной стратегии игрока B (при Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru )нарисовать графики не удастся, т.к. эта стратегия определяется уже Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru параметрами. Рассмотрим, тем не менее, практически общую ситуацию, когда точка максимума нижней огибающей графиков для игрока A определяется точкой пересечения ровно двух прямых, как на следующем чертеже:

Из рисунка видно, что точка максимума порождена пересечениями прямых, отвечающих стратегиям Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и игрока B . А отсюда следует, что игрок B в ответ на оптимальную смешанную стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru должен применить некоторую смешанную стратегию, в которой активными являются лишь стратегии Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и (т.е про остальные две он вообще должен забыть). Тем самым, задача свелась к игре Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , рассмотренной выше, и мы графически сможем определить частоты стратегий Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и в оптимальной смешанной стратегии (остальные частоты будут нулевыми).

Что же делать в случае произвольной матричной игры Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru ? Во-первых, необходимо попробовать свести её к задачам меньших размеров (например, рассмотренным выше) с помощью принципа доминирования строк или столбцов. Предположим, что в платёжной матрице для Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru -й и -й строк выполняется соотношение для всех Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Это означает, что при любой чистой стратегии Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru игрока B игроку A выгодней применять стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru по сравнению со стратегией . Тем самым, он может просто забыть про стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и вычеркнуть её из платёжной матрицы. Тем самым, мы придём к игре меньшего размера: Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Аналогично, если для -го и -го столбцов платёжной матрицы выполняются неравенства Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru для всех , то игроку B всегда выгодней применять стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru по сравнению со стратегией какую бы стратегию ни использовал игрок A (обратите внимание на различие, связанное с тем, что элементы платёжной матрицы – это проигрыши игрока B). Итак, в этом случае игрок B может вычеркнуть свою стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru и игра сведётся к игре размера .

Наконец, если даже после этого мы имеем игру Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , где оба размера не меньше 3, мы сводим задачу к задаче линейного программирования следующим образом.

«Поболеем» вначале за игрока A. Мы вновь на развилке «дорог», каждая из который на этот раз определяется набором из Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru неотрицательных чисел с условием . Фиксируем одну из них. Если наш оппонент B применит одну из своих чистых стратегий Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru ( , то наш средний выигрыш будет составлять Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Ясно, что если B будет применять смесь стратегий Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru с частотами , то наш средний выигрыш будет равняться линейной комбинации указанных выше Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru чисел с этими коэффициентами. Что же самое худшее ждёт нас? Разумеется, минимум из этих Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru чисел (так как сумма коэффициентов ). Теперь нам надо найти тот набор Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , сумма которого равна 1, для которого этот минимум максимален (вновь принцип максимина). Далее делается неожиданный ход: минимум из рассматриваемых Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru чисел можно, очевидно, найти как наибольшее число Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru такое, что выполняется система неравенств:

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru (13.1)

А далее из этих максимальных значений Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru нам надо выбрать самое максимальное при различных наборах Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Будем считать для удобства, что с самого начала все значения Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru положительны (этого легко добиться, прибавляя ко всем выигрышам одно и тоже число, что не изменит относительного соотношения выгодности между стратегиями). Тогда максимальное Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru для системы (13.1) будет также положительным, и мы можем ввести новые переменные, принимающие неотрицательные значения:

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru .

В новых переменных система (13.1) будет иметь вид

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru (13.2)

При этом имеем Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Значение мы хотим сделать наибольшим; следовательно, надо подбирать такие Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru , удовлетворяющие системе (13.2), чтобы выражение Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru принимало наименьшее значение:

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru (13.3)

При этом частоты Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru выражаются через однозначно:

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . (13.4)

Итак, нахождение оптимальной смешанной стратегии свелось к решению задачи линейного программирования (13.2)-(13.3) и последующему вычислению частот по формуле (13.4).

Рассуждая аналогично для игрока B, мы рассмотрим его смешанную стратегию Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru как одну из «дорог» и заметим, что наихудшей ситуацией на этой «дороге» будет проигрыш в размере максимума из чисел Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru . Этот максимум есть наименьшее решение системы неравенств

Вводя переменные

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru ,

приходим к системе

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru (13.5)

и условию

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru (13.6)

При этом

Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru (13.7)

Итак, задача нахождения оптимальной смешанной стратеги игрока B свелась к задаче линейного программирования (13.5)-(13.6) и последующему вычислению частот Графический метод нахождения смешанных стратегий, сведение матричной игры к задаче линейного программирования. - student2.ru по формуле (13.7).

Интересно отметить, что задачи линейного программирования (13.2)-(13.3) и (13.5)-(13.6) являются взаимно-двойственными; а стало быть, достаточно решить симплекс-методом только одну из них и решение другой получится автоматически по теоремам двойственности.

Раздел 14

Наши рекомендации

Приведение матричной игры к задаче линейного программирования

Сведение матричной игры к задаче линейного программирования

Приведение матричной игры к задаче линейного программирования

Сведение матричной игры к задаче линейного программирования

Приведение матричной игры к задаче линейного программирования.

Сведение матричной игры к модели линейного программирования

Сведение матричной игры к задаче линейного программирования

Сведение конечной матричной игры к задаче линейного программирования.

Сведение матричной игры к модели линейного программирования

← Предыдущая страница | Следующая страница →