Типовая платежная матрица

Стратегия противника Стратегия исследователя Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru
Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru
Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru
Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru Типовая платежная матрица - student2.ru

При этом исследователь должен заранее определить наборы значений управляемых переменных и неопределенных факторов или задать алгоритм их вычисления на ЭВМ. При вычислении на ЭВМ значений целевой функции любой набор значений неопределенных факторов всегда представляет собой набор детерминированных констант.

Неопределенность этих факторов для исследователя заключается не в составе стратегии противника, а в том, какую из этих стратегий противник может реализовать в рамках исследуемой ситуации. Именно в условиях неопределенности относительно реализации стратегий противника исследователь и должен принимать решение об оптимальности своих стратегий.

Для принятия решений о выборе наилучшей стратегии исследователя, т.е. оптимальных значений управляемых параметров, разработаны специальные критерии и методы, которыми может пользоваться лицо, ответственное за принятие решений, в зависимости от создавшейся ситуации, собственной подготовленности, а также накопленного опыта и личных качеств.

Жизненная необходимость анализа конфликтных ситуаций и принятия решения в условиях неопределенности, создаваемой активными противодействующими усилиями нескольких участников операций, вызвала к жизни специальный математический аппарат – теорию игр.

Задача теории игр – выработка рекомендаций по выбору рационального образа действий участников многократно повторяющегося конфликта. В настоящее время теория игр как математическая теория конфликтных ситуаций представляет собой емкую математическую дисциплину. Развита теория антагонистических и неантагонистических игр, позиционных, дифференциальных и т.д.

Для нахождения решения в конфликтных ситуациях, реализуемых ограниченное число раз или всего один раз, рекомендации теории игр теряют свой смысл. В антагонистических конфликтных ситуациях выбор оптимального решения основывается на теории минимакса (максимина), базирующейся на максиминном критерии (критерии Вальда).

Применение данного критерия обеспечивает максимизацию минимального выигрыша или, что то же самое, минимизацию максимальных потерь, которые могут быть при выборе определенной стратегии. Иначе говоря, для каждой стратегии Типовая платежная матрица - student2.ru выбирается наименьшее из значений Типовая платежная матрица - student2.ru , т.е. Типовая платежная матрица - student2.ru . Затем, сравнивая между собой наименьшие из выбранных значений, выбирают ту стратегию, у которой значение Em выше: Типовая платежная матрица - student2.ru .

Данный критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения.

В том случае, когда имеются сомнения в отношении целей других участников операции, однако есть уверенность, что эти цели не являются полностью противоположными целям функционирования объекта, т.е. ситуация не является антагонистической, для выбора оптимального решения предложен ряд критериев.

Максимальный критерий Типовая платежная матрица - student2.ru основан на предположении, что другой участник операции действует заодно с исследователем, их цели совпадают. Вследствие этого оптимальным решением являются стратегии участников операции, приводящие к получению наибольшего значения критерия оптимальности в платежной матрице. Этот критерий целесообразно применять в тех случаях, когда имеется принципиальная возможность повлиять на действия другого участника операции

Критерий пессимизма-оптимизма (критерий Гурвица) позволяет учитывать комбинации наихудших и наилучших состояний. Для этого каждой стратегии Типовая платежная матрица - student2.ru ставится в соответствие выражение вида

Типовая платежная матрица - student2.ru ,

где min Типовая платежная матрица - student2.ru – наименьшее и наибольшее значения критерия оптимальности для m-й стратегии; γ – показатель пессимизма-оптимизма, принимающий значения от 0 до 1.

Оптимальной считается стратегия с более высоким значением выражения

Типовая платежная матрица - student2.ru .

Выбор величины γ определяется лицом, принимающим решение, экспертным путем на основании учета различных качественных факторов, характеризующих взаимодействие объекта с окружением. При γ = 1 критерий Типовая платежная матрица - student2.ru ; при γ = 0 критерий Типовая платежная матрица - student2.ru .

Критерий недостаточного основания (критерий Лапласа) дает возможность определить оптимальное действие тогда, когда совершенно неизвестно, какая из стратегий противника может иметь место; все стратегии считаются равновероятностными:

Типовая платежная матрица - student2.ru .

Оптимальной будет та стратегия, для которой сумма значений математического ожидания критерия по всем стратегиям противника будет максимальной.

Критерий минимакса сожалений (минимаксного риска) (критерий Сэвиджа). Матрице решений, выраженной в определенных значениях критерия Emp, ставится в соответствие новая матрица решений, выраженная в так называемых рисках rmp.

Значения rmp определяются как разность между максимальным значением столбца Типовая платежная матрица - student2.ru и соответствующими значениями данного столбца, т.е.

Типовая платежная матрица - student2.ru .

Из множества решений, оптимальных по отдельным критериям, основываясь также на специфике задачи и неформализуемой информации, руководитель может выбрать наилучшее решение.

Наши рекомендации