Допустимые стратегии в статистических играх
Рассмотрим некоторую смешанную стратегию . Тогда возможны два случая:
1) Нельзя найти стратегию лучшую, чем . Это означает, что не существует такой стратегии , для которой справедливо неравенство:
, (3.6)
при всех , , хотя для некоторых это неравенство может и выполняться. В этом случае стратегия называется допустимой..
2) Существует стратегия лучше, чем . Это означает, что неравенство (6) выполняется при всех . В этом случае стратегия называется недопустимой и ее следует исключить из рассмотрения в пользу стратегии .
Допустимые стратегии удобно рассмотреть в терминах - игры, при которой стратегии статистика определяются в виде точек, лежащих на выпуклой оболочке области , а потери статистика определяются координатами соответствующих точек выпуклой оболочки.
Продемонстрируем метод нахождения допустимых стратегий для случая, когда множество состояний природы состоит только из двух элементов и :
0
Рис. 3.2
Рассмотрим стратегию (точку), расположенную внутри области . Эта стратегия не является допустимой, так как координаты (потери) всех точек, лежащих на отрезке , имеют меньшие значения, то есть представляют явно лучшие решения. Поэтому все «внутренние» стратегии вида можно исключить в пользу стратегии вида , лежащей на границе области .
Следовательно, можно сделать вывод о том, что все множество допустимых стратегий статистика представляет (геометрически) дугу границы области .
№ 3.3.Найти функции потерь для допустимых решений в задаче о технологической линии.
Решение. Левая нижняя граница допустимых решений (см. рис.3.1) состоит из отрезков и , каждый из которых представляет собой смешанную стратегию.
Введем параметр . Тогда параметрическое уравнение отрезка будет иметь вид:
,
и это определяет смешанную стратегию:
.
Спроектировав отрезок на оси координат, получим следующие выражения для функции потерь:
,
.
Аналогично для отрезка с уравнением:
,
получим смешанную стратегию
,
и функции потерь
,
.
О принципах выбора стратегий в статистических играх
Принципом выбора стратегии называют правило, которое позволяет статистику определить наилучшую смешанную стратегию. В различных ситуациях статистик может воспользоваться различными принципами выбора стратегии. Рассмотрим некоторые из них.
Принцип минимакса
Согласно этого принципа, статистик выбирает ту стратегию , при которой его средние потери будут наименьшими при наихудшем для него состоянии природы, то есть
(3.7)
Следовательно, мы можем достаточно просто найти решение статистической игры без эксперимента сведением этой задачи к задаче линейного программирования.
№ 3.4.Найти минимаксную стратегию в задаче о технологической линии.
Решение. Построим графики функций потерь и для отрезков и .
5 3
3 2
1 1
0 1 0 1
Рис. 3.3 . Рис. 3.4 .
Значения выделим на рисунке жирными линиями. Тогда минимум этой величины достигается на рис.3.3 при , и равен 3, а на рис.4 определяется точкой пересечения прямых как:
,
то есть достигается при , и равен .
Таким образом, принцип минимакса дает точку на отрезке , соответствующую , и определяет смешанную стратегию
,
при которой потери статистика будут не больше ед. при любой стратегии природы.
Иногда выбирают стратегию исходя из так называемых дополнительных потерь:
. (3.8)
Величина определяет те минимальные потери, которые несет статистик даже при своем наилучшем решении (для каждого возможного состояния природы). В этом случае выбор стратегии может осуществляться по принципу минимакса дополнительных потерь.
№ 3.5.Найти минимаксную стратегию в задаче о технологической линии, исходя из дополнительных потерь.
Решение. Так как при , а при , то матрица дополнительных потерь примет вид:
.
Применим принцип минимакса графически. Для этого построим сначала выпуклую оболочку :
0 1 3
Рис. 3.5
Спроектируем отрезок на оси координат и получим следующие выражения для функции дополнительных потерь:
,
.
Для отрезка получаем аналогично:
,
.
Построим графики дополнительных потерь:
3 3
1 1
0 1 0 1
Рис.3.6 . Рис. 3.7 .
Тогда на рис. 3.6 минимум от максимума дополнительных потерь достигается при , равен 1, и получаем чистую стратегию . Для рис.3.7 получаем , и стратегию .
Следовательно, оптимальной является чистая стратегия , и минимаксные дополнительные потери равны 1 ед.
Минимаксные принципы исходят из предположения о том, что природа действует наихудшим для статистика образом, и поэтому выражают точку зрения ЛПР, не расположенного к риску. Недостатком этих методов является и то, что они не учитывают априорной информации о состояниях природы, что ограничивает возможный выигрыш статистика. Поэтому минимаксные принципы можно рекомендовать в случае отсутствия априорной информации о состояниях природы, или если есть веские основания сомневаться в достоверности такой информации.
Отметим также, что принцип минимакса дал разные результаты для полных и дополнительных потерь. Это происходит, в частности, потому, что статистик может компенсировать необходимые потери тем или иным образом, например, установлением соответствующих цен на производимую продукцию. Поэтому он может их и не учитывать при выборе оптимальной стратегии.
Байесовский принцип
Другим принципом выбора стратегии является байесовский, который учитывает априорное распределение вероятностей состояний природы . Согласно этому принципу, смешанную стратегию статистика оценивают усреднением потерь по всем возможным состояниям природы, то есть по величине:
. (3.9)
Наилучшей стратегией при этом будет та, которая минимизирует величину (9), а именно:
. (3.10)
Эту стратегию и называют байесовской.
№ 3.6.Найти байесовскую стратегию в задаче о технологической линии, представленной в виде - игры.
Решение. Для допустимых стратегий, определяемых отрезком , имеем:
.
Тогда при , что соответствует смешанной стратегии .
Для отрезка получаем:
.
Тогда при , что соответствует той же смешанной стратегии .
Следовательно, байесовской стратегией является чистая стратегия с оптимальным значением потерь 1,8 ед.
Ответ: ; .