Связь матричных игр с линейным программированием

Лемма. Если увеличить все элементы платежной матрицы на одно и тоже число, то цена игры увеличится на то же число, а решение задачи (выбор стратегий) не изменится.

Из этого следует, что всегда можно, увеличив элементы матрицы на какое-либо число, добиться, чтобы цена игры стала положительной v>0. Поэтому далее будем считать, что v>0.

При использовании оптимальной смешанной стратегии Связь матричных игр с линейным программированием - student2.ru игроком А его выигрыш будет не меньше цены игры v, в том числе при условии, что противник выберет чистую стратегию Вк . Получаем систему неравенств:

Связь матричных игр с линейным программированием - student2.ru

Введем обозначения Связь матричных игр с линейным программированием - student2.ru (i = 1,..., n). Так как вероятности неотрицательны и v>0, то и Связь матричных игр с линейным программированием - student2.ru . Перепишем систему неравенств с новыми переменными

Связь матричных игр с линейным программированием - student2.ru (*)

Учитывая, что Связь матричных игр с линейным программированием - student2.ru , сумма новых переменных Связь матричных игр с линейным программированием - student2.ru ,

Цена игры для первого игрока должна быть как можно больше Связь матричных игр с линейным программированием - student2.ru , поэтому величина Связь матричных игр с линейным программированием - student2.ru должна быть как можно меньше.

Итак, мы имеем задачу линейного программирования (ЗЛП): надо найти неотрицательные значения переменных Связь матричных игр с линейным программированием - student2.ru , которые удовлетворяют системе неравенств (*) и обращают целевую функцию Z в минимум.

Аналогично, с точки зрения игрока В: его проигрыши при использовании им оптимальной смешанной стратегии SB( Связь матричных игр с линейным программированием - student2.ru ) не могут превышать цену игры, в том числе, если А применяет одну из чистых стратегий Аi. Обозначив Связь матричных игр с линейным программированием - student2.ru (k = 1,…,m) и целевую функцию Связь матричных игр с линейным программированием - student2.ru , получим двойственную ЗЛП.

Связь матричных игр с линейным программированием - student2.ru , где Связь матричных игр с линейным программированием - student2.ru , Связь матричных игр с линейным программированием - student2.ru , Связь матричных игр с линейным программированием - student2.ru , Связь матричных игр с линейным программированием - student2.ru определяется как решения двойственных задач линейного программирования:

Связь матричных игр с линейным программированием - student2.ru Связь матричных игр с линейным программированием - student2.ru
Связь матричных игр с линейным программированием - student2.ru Связь матричных игр с линейным программированием - student2.ru

Пример. Рассмотрим платежную матрицу без седловой точки, полученную в предыдущем примере Связь матричных игр с линейным программированием - student2.ru . Найти решение задачи в области смешанных стратегий. ► Пусть сторона А использует первую стратегию с вероятностью p1, вторую стратегию с вероятностью p2. Обозначив Связь матричных игр с линейным программированием - student2.ru , Связь матричных игр с линейным программированием - student2.ru , получим систему ограничений:

Связь матричных игр с линейным программированием - student2.ru

Целевая функция Связь матричных игр с линейным программированием - student2.ru

Связь матричных игр с линейным программированием - student2.ru Эту задачу линейного программирования можно решить геометрически (рис.6), построив область допустимых решений (ОДР) и семейство уровней целевой функции. Оптимальное решение находится в точке пересечения ограничивающих ОДР прямых, координаты этой точки являются решением системы двух уравнений:

Связь матричных игр с линейным программированием - student2.ru Связь матричных игр с линейным программированием - student2.ru

Из оптимального решения ЗЛП Связь матричных игр с линейным программированием - student2.ru найдем:

Связь матричных игр с линейным программированием - student2.ru .

Оптимальная смешанная стратегия первого игрока состоит в том, чтобы применять первую чистую стратегию с частотой Связь матричных игр с линейным программированием - student2.ru и вторую чистую стратегию с частотой Связь матричных игр с линейным программированием - student2.ru , чередуя их случайным образом (например, вынимая наугад шарик из урны, где лежат два черных и один белый шарики: попался белый шар – используй первую стратегию, черный – вторую). Тогда его средний выигрыш составит Связь матричных игр с линейным программированием - student2.ru , но он может быть и больше, если второй игрок ведет себя неразумно. Мы видим, что цена игры находится между нижней и верхней ценой игры, т.е. между числами 3 и 5.

Используя равенство экстремальных значений целевых функций в двойственных задачах линейного программирования, легко найти оптимальную смешанную стратегию второго игрока: Связь матричных игр с линейным программированием - student2.ru . ◄

Игры с природой.

Задачапринятия решения в условиях неопределенности называется «игрой с природой». Под «природой» будем понимать совокупность неопределенных факторов, влияющих на эффективность принимаемых решений. Неопределенность в принятии решения возникает в тех случаях, когда отсутствует достаточно полная информация о состоянии объекта управления и о состоянии внешней среды. Природа выступает в качестве внешней среды. Предполагается, что множество состояний природы известно. Лицо, принимающее решение (ЛПР), является первым игроком А, который в процессе игры выбирает одну из m возможных строк платежной матрицы (они же стратегии) A1, А2,…, Am. Второй игрок П – природа, основной особенностью которой является её незаинтересованность в выигрыше. Этот противник пассивен и не противодействует достижению намеченной цели, меняя свои состояния стихийно. Пусть стратегии природы П1, …, Пn – это её состояния. Выигрыши игрока А при каждой паре стратегий Аi и Пj известны и заданы платежной матрицей (aij). Задача заключается в определении такой стратегии, применение которой обеспечило бы наибольший выигрыш игроку А. Для оценки эффективности стратегии используется критерий – числовая функция - вычисляемый по элементам платежной матрицы.

К наиболее часто используемым подходам для обоснования выбора решения ЛПР (методам выбора оптимальной стратегии) в условиях неопределенности можно отнести:

Название критерия Критерий выбора оптимальной стратегии
Критерий Вальда (пессимиста) Связь матричных игр с линейным программированием - student2.ru
Критерий оптимиста Связь матричных игр с линейным программированием - student2.ru
Критерий Гурвица Связь матричных игр с линейным программированием - student2.ru где a - показатель пессимизма
Критерий Сэвиджа (минимальных сожалений) Связь матричных игр с линейным программированием - student2.ru - матрица рисков (минимальных сожалений)
Критерий Лапласа Связь матричных игр с линейным программированием - student2.ru

Анализ матрицы выигрышей игры с природой начинается с выявления и отбрасывания дублирующих и доминируемых стратегий ЛПР – игрока А. Но! Ни одну из стратегий природы отбросить нельзя, так как каждое из состояний природы может наступить случайным образом, независимо от действий игрока А.

Критерий Вальда (пессимиста, или гарантированного результата) считает наилучшей стратегией максиминную стратегию, т.е. ту, которая гарантирует в наихудших условиях максимальный выигрыш.

Критерий Сэвиджа также является критерием крайнего пессимизма. Разность между максимально возможным выигрышем при данном состоянии природы и выигрышем, который будет получен при применении стратегии в тех же условиях, называется в теории игр риском. Согласно этому критерию, надо выбирать ту стратегию, при которой в наихудших условиях величина риска принимает наименьшее значение.

Критерий Гурвица помогает найти компромиссное решение между крайне пессимистичной оценкой по критерию Вальда (α=1) и крайне оптимистичной оценкой при α=0, используя промежуточное значение показателя пессимизма-оптимизма, которое характеризует степень активного «противодействия» природы с точки зрения ЛПР. Коэффициент выбирается на основании опыта, здравого смысла и т.д.

Принцип Лапласаприменяется, когда ни одно состояние природы нельзя предпочесть другому, поэтому субъективно они оцениваются как равновероятные.

Пример. Руководство торговой фирмы разработало 4 плана продажи товаров A1, А2, A3, А4. В зависимости от конъюнктуры рынка П1, П2, П3, П4 рассчитаны значения прибыли (в млн.руб.) для каждой стратегии, представленные в виде матрицы выигрышей:

  П1 П2 П3 П4
A1
А2
A3
А4

Определить оптимальный план продажи товаров.

► Проанализировав платежную матрицу, убеждаемся, что дублирующих и доминирующих стратегий у игрока А нет.

Найдем минимальный элемент в каждой строке и впишем его в дополнительный столбец – наихудший результат применения данной стратегии. Максимальный элемент этого столбца 9. Следовательно, оптимальной стратегией по критерию Вальда является А3, которая гарантирует прибыль не менее 9 млн.руб.

В следующий столбец впишем максимальный элемент матрицы выигрышей по каждой строке. Оптимист выбрал бы план продажи А2, дающий наибольшую прибыль 13 при состоянии рынка П2. Но кто даст гарантию, что именно это состояние рынка наступит? Поэтому воспользуемся критерием Гурвица с показателем пессимизма α=0.4. Посчитаем линейную комбинацию минимальной и максимальной величины прибыли по каждой строке и внесем её в последний столбец. Наибольшее значение критерия Гурвица Gi достигается в строке А2, значит, по критерию Гурвица следует выбрать план продажи А2.

  П1 П2 П3 П4 Связь матричных игр с линейным программированием - student2.ru aij Связь матричных игр с линейным программированием - student2.ru aij Gi=0.4 Связь матричных игр с линейным программированием - student2.ru aij + 0.6 Связь матричных игр с линейным программированием - student2.ru aij
A1 G1=0.4*8+0.6*11=9.8
А2 13 G2=0.4*7+0.6*13=10.6
A3 9 G3=0.4*9+0.6*11=10.2
А4 G1=0.4*8+0.6*12=10.4
Связь матричных игр с линейным программированием - student2.ru aij      

Если мы вычислим средний выигрыш по каждой строке, то по критерию Лапласа оптимальной будет стратегия А3.

Построим матрицу рисков. Для этого найдем максимальный элемент в каждом столбце состояния природы. Затем вычислим разность между ним и каждым элементом матрицы в этом столбце и занесем найденное значение rij в новую таблицу (матрицу рисков):

  П1 П2 П3 П4 Связь матричных игр с линейным программированием - student2.ru rij
A1
А2
A3 3
А4

Согласно критерию Сэвиджа, рекомендуется выбрать ту стратегию, при которой в наихудших условиях величина риска (упущенная прибыль) принимает наименьшее значение. В каждой строке матрицы риска ищем наибольший элемент, заносим его в дополнительный столбец, сравниваем элементы этого столбца. Итак, минимальны будут сожаления при выборе плана продаж А3. Окончательный выбор между вторым и третьим планами продаж должно сделать руководство торговой фирмы (ЛПР), а критерии помогли оценить принимаемое решение с разных позиций, дабы избежать грубых ошибок. ◄

Наши рекомендации