Критерий Вальда для смешанных стратегий
Оптимальной считается та смешанная стратегия статистика , при которой минимальный средний выигрыш будет максимальным: . (2)
Критерий Вальда ориентируют статистика на самые неблагоприятные состояния природы, то есть выражают пессимистическую оценку ситуации.
2. Критерий Сэвиджа (минимаксного риска)
На практике, выбирая одно из возможных решений, часто останавливаются на том, осуществление которого приведет к наименее тяжелым последствиям, если выбор окажется ошибочным. Этот подход к выбору решения математически был сформулирован американским статистиком Сэвиджем в 1954 году и получил название принципа Сэвиджа. Он особенно удобен для экономических задач и часто применяется для выбора решений в играх человека с природой.
По принципу Сэвиджа каждое решение характеризуется величиной дополнительных потерь, которые возникают при реализации этого решения, по сравнению с реализацией решения, правильного при данном состоянии природы. Естественно, что правильное решение не влечет за собой никаких дополнительных потерь, и их величина равна нулю.
При выборе решения, наилучшим образом соответствующего различным состояниям природы, следует принимать во внимание только эти дополнительные потери, которые по существу, будут являться следствием ошибок выбора.
Для решения задачи строится так называемая «матрица рисков», элементы которой показывают, какой убыток понесет игрок (ЛПР) в результате выбора неоптимального варианта решения.
Напомним, что Риском игрока при выборе стратегии в условиях (состояниях) природы называется разность между максимальным выигрышем, который можно получить в этих условиях, и выигрышем, который получит игрок в тех же условиях, применяя стратегию .
Критерий Сэвиджа – это критерий минимаксного риска, минимизации «сожалений». Этот критерий, как критерий Вальда, является максимально осторожным и пессимистическим.
В критерии Сэвиджа пессимизм проявляется по-другому: худшим считается не минимальный выигрыш, а максимальная потеря выигрыша по сравнению с тем, что можно было бы достичь в данных условиях (максимальный риск).
Критерий Сэвиджа ориентируется не на результат, а на риск (потери или штрафы) .
В качестве оптимальной выбирается стратегия, при которой величина потерь в наихудших условиях минимальна. Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту стратегию, которая минимизирует максимальный риск:
. (3)
Требования, предъявляемые к ситуации, в которой принимается решение по критерию Сэвиджа, совпадают с требованием к использованию критерия Вальда. Критерий Сэвиджа, как и критерий Вальда, ориентирует статистика на самые неблагоприятные состояния природы.
Пример 2. Для задачи «Поставщик» минимакс риска достигается сразу при двух стратегиях А2 и А3:
max | min | ||
Найти оптимальное решение игры , применяя критерий Сэвиджа.
Решение.
Ориентируемся на самые неблагоприятные состояния «природы». Вычислим риски статистика .
Для первого столбца:
Для второго столбца:
Для третьего столбца:
Запишем матрицу рисков.
Стратегии статистика | |||
Определим в каждой строке наибольшее число – наибольший риск статистика , если он применяет стратегию , а природа меняет свои состояния , , . Дополним матрицу рисков последним столбцом «наибольшие риски».
Матрица рисков и наибольшие риски
Стратегии статистика | Наибольшие риски | |||
Найдем наименьший риск: .
Значит, оптимальной стратегией по критерию Сэвиджа является стратегия .
4.3. Критерий Гурвица (пессимизма-оптимизма)