Игры с природой с экспериментами.
Рассмотренные выше игры с природой предусматривали необходимость принятия нами решения в условиях неопределенности на основе имеющихся у нас данных, используемых в процессе вычислений. Такие данные принято называть априорными. В некоторых случаях при решении задач с природными неопределенностями появляется возможность проведения различных экспериментов, позволяющих получить дополнительную информацию и тем самым снизить степень неопределенности в отношении действительного состояния природы. Очевидно, что проведение экспериментов связано с затратой ресурсов. Возникают естественные вопросы: стоит ли проводить эксперимент, сколько должно быть экспериментов, в каком порядке надо проводить эксперименты. Некоторые ответы на эти вопросы дает теория игр с экспериментами.
Назовем единичным такой эксперимент, объем и порядок которого заранее определены и не могут быть изменены в процессе его проведения. Отметим, что собственно методику эксперимента должен разрабатывать специалист в предметной области, а мы можем только делать вывод о целесообразности его проведения на основании имеющейся априорной информации. Единичный эксперимент не обязательно состоит только из одного испытания. В процессе его проведения может быть получена целая выборка значений, однако принципиальным является то обстоятельство, что объем выборки конечен и известен заранее.
Возможен и другой способ организации эксперимента. В процессе проведения эксперимента после каждого испытания мы можем принимать решение, прекратить ли дальнейшие испытания и выбрать ли какую либо стратегию из числа возможных или продолжить испытания с целью увеличения объема информации. Такие эксперименты называют последовательными. Максимальное допустимое количество выборок в процессе проведения последовательного эксперимента тоже может быть известно заранее (в этом случае говорят об усеченном последовательном эксперименте), или быть неограниченным (неограниченный последовательный эксперимент).
Будем считать, что в нашем распоряжении имеется набор стратегий , которые он может использовать в ответ на одну из возможных стратегий природы , появляющуюся с вероятностью при условии
.
Известна также платежная матрица . Для снижения неопределенности относительно действительного состояния природы мы можем провести эксперимент, стоимость которого известна и равна . Пусть в результате проведения эксперимента состояние природы станет известно точно. Необходимо сделать вывод о целесообразности проведения эксперимента.
Наш средний выигрыш при использовании стратегии может быть определен как
. (9)
В качестве оптимальной стратегии может быть выбрана стратегия , максимизирующая наш средний выигрыш
.
Предположим теперь, что в результате проведения эксперимента удалось точно установить стратегию природы . Очевидно, что в этом случае мы должны выбирать стратегию, обеспечивающую наш максимальный выигрыш
. (10)
Оценим теперь средний возможный выигрыш после проведения эксперимента
где ‑ стоимость проведения эксперимента. Отсюда появляется условие целесообразности проведения эксперимента
или
.
Преобразовывая неравенство, имеем
. (11)
Выражение в круглых скобках есть ничто иное как риск
.
Тогда правая часть неравенства есть минимальный средний риск, откуда вытекает условие целесообразности проведения эксперимента: затраты на эксперимент должны быть меньше минимального среднего риска, иначе от эксперимента следует воздержаться и в качестве оптимальной следует выбрать стратегию максимизирующую средний выигрыш или минимизирующую средний риск.
Рассмотрим случай, когда с помощью эксперимента не удается точно определить состояние природы, но возможно получить одно из несовместимых событий , связанных определенными вероятностями с состояниями (стратегиями) природы. Обозначим условную вероятность появления исхода эксперимента при условии стратегии природы символом . Поскольку образуют полную систему событий, справедливо
.
Будем считать, что все значения известны, а также известна стоимость проведения эксперимента . Нас по прежнему будет интересовать вопрос: целесообразно ли проведение эксперимента и если да, то какую стратегию необходимо выбрать при том или ином исходе эксперимента. Предположим, что в результате эксперимента был получен результат . Определим апостериорные вероятности стратегий природы по теореме Байеса [6]
.
Далее для каждой стратегии рассчитаем величину условного среднего выигрыша при условии результата эксперимента
.
Очевидно, что оптимальной будет стратегия , обеспечивающая максимум условного среднего выигрыша при конкретном исходе эксперимента
.
Вероятность появления условного выигрыша совпадает с вероятностью появления события . Обозначим ее символом . Тогда
.
Величина выигрыша с использованием эксперимента
.
С другой стороны наш выигрыш без проведения эксперимента определяется выражением
.
Отсюда вытекает условие целесообразности проведения эксперимента
Если проведение эксперимента признано целесообразным, то необходимо разработать систему так называемых решающих правил, смысл которой сводится к следующему: какую стратегию необходимо выбрать, если эксперимент дал результат ?