Типовая платежная матрица
Стратегия противника Стратегия исследователя | … | … | |||
… | … | ||||
… | … | … | … | … | … |
… | … | ||||
… | … | … | … | … | … |
… | … |
При этом исследователь должен заранее определить наборы значений управляемых переменных и неопределенных факторов или задать алгоритм их вычисления на ЭВМ. При вычислении на ЭВМ значений целевой функции любой набор значений неопределенных факторов всегда представляет собой набор детерминированных констант.
Неопределенность этих факторов для исследователя заключается не в составе стратегии противника, а в том, какую из этих стратегий противник может реализовать в рамках исследуемой ситуации. Именно в условиях неопределенности относительно реализации стратегий противника исследователь и должен принимать решение об оптимальности своих стратегий.
Для принятия решений о выборе наилучшей стратегии исследователя, т.е. оптимальных значений управляемых параметров, разработаны специальные критерии и методы, которыми может пользоваться лицо, ответственное за принятие решений, в зависимости от создавшейся ситуации, собственной подготовленности, а также накопленного опыта и личных качеств.
Жизненная необходимость анализа конфликтных ситуаций и принятия решения в условиях неопределенности, создаваемой активными противодействующими усилиями нескольких участников операций, вызвала к жизни специальный математический аппарат – теорию игр.
Задача теории игр – выработка рекомендаций по выбору рационального образа действий участников многократно повторяющегося конфликта. В настоящее время теория игр как математическая теория конфликтных ситуаций представляет собой емкую математическую дисциплину. Развита теория антагонистических и неантагонистических игр, позиционных, дифференциальных и т.д.
Для нахождения решения в конфликтных ситуациях, реализуемых ограниченное число раз или всего один раз, рекомендации теории игр теряют свой смысл. В антагонистических конфликтных ситуациях выбор оптимального решения основывается на теории минимакса (максимина), базирующейся на максиминном критерии (критерии Вальда).
Применение данного критерия обеспечивает максимизацию минимального выигрыша или, что то же самое, минимизацию максимальных потерь, которые могут быть при выборе определенной стратегии. Иначе говоря, для каждой стратегии выбирается наименьшее из значений , т.е. . Затем, сравнивая между собой наименьшие из выбранных значений, выбирают ту стратегию, у которой значение Em выше: .
Данный критерий прост и четок, но консервативен в том смысле, что ориентирует принимающего решение на слишком осторожную линию поведения.
В том случае, когда имеются сомнения в отношении целей других участников операции, однако есть уверенность, что эти цели не являются полностью противоположными целям функционирования объекта, т.е. ситуация не является антагонистической, для выбора оптимального решения предложен ряд критериев.
Максимальный критерий основан на предположении, что другой участник операции действует заодно с исследователем, их цели совпадают. Вследствие этого оптимальным решением являются стратегии участников операции, приводящие к получению наибольшего значения критерия оптимальности в платежной матрице. Этот критерий целесообразно применять в тех случаях, когда имеется принципиальная возможность повлиять на действия другого участника операции
Критерий пессимизма-оптимизма (критерий Гурвица) позволяет учитывать комбинации наихудших и наилучших состояний. Для этого каждой стратегии ставится в соответствие выражение вида
,
где min – наименьшее и наибольшее значения критерия оптимальности для m-й стратегии; γ – показатель пессимизма-оптимизма, принимающий значения от 0 до 1.
Оптимальной считается стратегия с более высоким значением выражения
.
Выбор величины γ определяется лицом, принимающим решение, экспертным путем на основании учета различных качественных факторов, характеризующих взаимодействие объекта с окружением. При γ = 1 критерий ; при γ = 0 критерий .
Критерий недостаточного основания (критерий Лапласа) дает возможность определить оптимальное действие тогда, когда совершенно неизвестно, какая из стратегий противника может иметь место; все стратегии считаются равновероятностными:
.
Оптимальной будет та стратегия, для которой сумма значений математического ожидания критерия по всем стратегиям противника будет максимальной.
Критерий минимакса сожалений (минимаксного риска) (критерий Сэвиджа). Матрице решений, выраженной в определенных значениях критерия Emp, ставится в соответствие новая матрица решений, выраженная в так называемых рисках rmp.
Значения rmp определяются как разность между максимальным значением столбца и соответствующими значениями данного столбца, т.е.
.
Из множества решений, оптимальных по отдельным критериям, основываясь также на специфике задачи и неформализуемой информации, руководитель может выбрать наилучшее решение.