Допустимые стратегии в статистических играх
Рассмотрим некоторую смешанную стратегию . Тогда возможны два случая:
1) Нельзя найти стратегию лучшую, чем
. Это означает, что не существует такой стратегии
, для которой справедливо неравенство:
, (3.6)
при всех ,
, хотя для некоторых
это неравенство может и выполняться. В этом случае стратегия
называется допустимой..
2) Существует стратегия лучше, чем
. Это означает, что неравенство (6) выполняется при всех
. В этом случае стратегия
называется недопустимой и ее следует исключить из рассмотрения в пользу стратегии
.
Допустимые стратегии удобно рассмотреть в терминах - игры, при которой стратегии статистика определяются в виде точек, лежащих на выпуклой оболочке области
, а потери статистика определяются координатами соответствующих точек выпуклой оболочки.
Продемонстрируем метод нахождения допустимых стратегий для случая, когда множество состояний природы состоит только из двух элементов и
:
0
Рис. 3.2
Рассмотрим стратегию (точку), расположенную внутри области
. Эта стратегия не является допустимой, так как координаты (потери) всех точек, лежащих на отрезке
, имеют меньшие значения, то есть представляют явно лучшие решения. Поэтому все «внутренние» стратегии вида
можно исключить в пользу стратегии вида
, лежащей на границе области
.
Следовательно, можно сделать вывод о том, что все множество допустимых стратегий статистика представляет (геометрически) дугу границы области
.
№ 3.3.Найти функции потерь для допустимых решений в задаче о технологической линии.
Решение. Левая нижняя граница допустимых решений (см. рис.3.1) состоит из отрезков и
, каждый из которых представляет собой смешанную стратегию.
Введем параметр . Тогда параметрическое уравнение отрезка
будет иметь вид:
,
и это определяет смешанную стратегию:
.
Спроектировав отрезок на оси координат, получим следующие выражения для функции потерь:
,
.
Аналогично для отрезка с уравнением:
,
получим смешанную стратегию
,
и функции потерь
,
.
О принципах выбора стратегий в статистических играх
Принципом выбора стратегии называют правило, которое позволяет статистику определить наилучшую смешанную стратегию. В различных ситуациях статистик может воспользоваться различными принципами выбора стратегии. Рассмотрим некоторые из них.
Принцип минимакса
Согласно этого принципа, статистик выбирает ту стратегию , при которой его средние потери
будут наименьшими при наихудшем для него состоянии природы, то есть
(3.7)
Следовательно, мы можем достаточно просто найти решение статистической игры без эксперимента сведением этой задачи к задаче линейного программирования.
№ 3.4.Найти минимаксную стратегию в задаче о технологической линии.
Решение. Построим графики функций потерь и
для отрезков
и
.
5 3
3 2
1 1
0 1 0 1
Рис. 3.3 . Рис. 3.4
.
Значения выделим на рисунке жирными линиями. Тогда минимум этой величины достигается на рис.3.3 при
, и равен 3, а на рис.4 определяется точкой пересечения прямых как:
,
то есть достигается при , и равен
.
Таким образом, принцип минимакса дает точку на отрезке , соответствующую
, и определяет смешанную стратегию
,
при которой потери статистика будут не больше ед. при любой стратегии природы.
Иногда выбирают стратегию исходя из так называемых дополнительных потерь:
. (3.8)
Величина определяет те минимальные потери, которые несет статистик даже при своем наилучшем решении (для каждого возможного состояния природы). В этом случае выбор стратегии может осуществляться по принципу минимакса дополнительных потерь.
№ 3.5.Найти минимаксную стратегию в задаче о технологической линии, исходя из дополнительных потерь.
Решение. Так как при
, а при
, то матрица дополнительных потерь примет вид:
.
Применим принцип минимакса графически. Для этого построим сначала выпуклую оболочку :
0 1 3
Рис. 3.5
Спроектируем отрезок на оси координат и получим следующие выражения для функции дополнительных потерь:
,
.
Для отрезка получаем аналогично:
,
.
Построим графики дополнительных потерь:
3 3
1 1
0 1 0 1
Рис.3.6 . Рис. 3.7
.
Тогда на рис. 3.6 минимум от максимума дополнительных потерь достигается при , равен 1, и получаем чистую стратегию
. Для рис.3.7 получаем
,
и стратегию
.
Следовательно, оптимальной является чистая стратегия , и минимаксные дополнительные потери равны 1 ед.
Минимаксные принципы исходят из предположения о том, что природа действует наихудшим для статистика образом, и поэтому выражают точку зрения ЛПР, не расположенного к риску. Недостатком этих методов является и то, что они не учитывают априорной информации о состояниях природы, что ограничивает возможный выигрыш статистика. Поэтому минимаксные принципы можно рекомендовать в случае отсутствия априорной информации о состояниях природы, или если есть веские основания сомневаться в достоверности такой информации.
Отметим также, что принцип минимакса дал разные результаты для полных и дополнительных потерь. Это происходит, в частности, потому, что статистик может компенсировать необходимые потери тем или иным образом, например, установлением соответствующих цен на производимую продукцию. Поэтому он может их и не учитывать при выборе оптимальной стратегии.
Байесовский принцип
Другим принципом выбора стратегии является байесовский, который учитывает априорное распределение вероятностей состояний природы . Согласно этому принципу, смешанную стратегию
статистика оценивают усреднением потерь
по всем возможным состояниям природы, то есть по величине:
. (3.9)
Наилучшей стратегией при этом будет та, которая минимизирует величину (9), а именно:
. (3.10)
Эту стратегию и называют байесовской.
№ 3.6.Найти байесовскую стратегию в задаче о технологической линии, представленной в виде - игры.
Решение. Для допустимых стратегий, определяемых отрезком , имеем:
.
Тогда при
, что соответствует смешанной стратегии
.
Для отрезка получаем:
.
Тогда при
, что соответствует той же смешанной стратегии
.
Следовательно, байесовской стратегией является чистая стратегия с оптимальным значением потерь 1,8 ед.
Ответ: ;
.