Принципы выбора стратегии в играх с единичным экспериментом
Так как введение функции риска сводит игру с единичным экспериментом к форме, аналогичной игре без эксперимента, то остаются справедливыми все принципы выбора стратегии статистика. Отличие состоит только в том, что вместо минимизации средних потерь, статистик должен теперь минимизировать средний риск.
Например, согласно принципу минимакса выбирается стратегия , при которой средний риск будет минимальным при наихудшем для статистика состоянии природы:
. (3.18)
И игра решается сведением к задаче линейного программирования.
Отметим также, что при определении среднего риска можно исходить и из дополнительных потерь .
Для применения байесовского принципа введем понятие ожидаемого риска, под которым будем понимать средний риск с учетом всех возможных состояний природы и априорного распределения вероятностей . А именно:
. (3.19)
И оптимальной будет такая решающая функция , при которой ожидаемый риск будет минимальным:
. (3.20)
При этом риск называется байесовским.
№ 3.10.Определить минимаксную и байесовскую стратегии в задаче о технологической линии с проведением единичного эксперимента.
Решение. Сведение задачи к - игре позволяет получить следующие решения:
1) Минимаксная стратегия -
.
2) Байесовская стратегия: , при которой
.
Пример задачи принятия решений в сельском хозяйстве
Рассмотрим задачу о том, на каких участках сажать картофель: на влажных , или на засушливых . Множество состояний природы состоит из двух элементов: - влажное лето (осадков будет выше нормы), - сухое лето (осадков будет ниже нормы). По результатам многолетних наблюдений известна соответствующая прибыль в расчете на 1 га (в у.е.):
Так как размерность задачи мала, то решение этой статистической игры можно будет продемонстрировать аналитически.
Определим функцию потерь в виде разности между наибольшей прибылью (25) и прибылью которую можно получить во всех остальных случаях:
20 0
5 17
Определим множество исходов эксперимента как: - наблюдается (весной) большое количество осадков, - малое количество осадков, со следующими условными вероятностями :
0,60 | 0,30 | |
0,40 | 0,70 |
Построим пространство решающих функций :
и вычислим функции риска, представив для удобства расчетов потери и условные вероятности в одной таблице:
0,60 | 0,40 | |||
0,30 | 0,70 |
Тогда можем получить следующие функции риска:
,
,
,
,
,
,
,
.
Представим полученные значения в виде матрицы (таблицы) рисков:
13,4 | 8,6 |
Видно, что стратегия является недопустимой, так как при сравнении ее со стратегией , получаем следующие неравенства: . Поэтому стратегию можно исключить. Это приводит к следующей матрице рисков:
8,6 |
Найдем сначала байесовское решение, предполагая, что априорное распределение вероятностей состояний природы имеет вид: .
Тогда средние потери (риски) будут равны:
,
,
,
Видно, что
.
Следовательно, оптимальной байесовской стратегией будет стратегия : если весной много осадков ( ), то принимается решение о том, что картофель надо сажать на засушливых участках; если весной будет мало осадков ( ), то принимается решение о том, что посадки надо осуществить на влажных участках.
Найдем теперь минимаксное решение . Согласно принципу минимакса необходимо выполнение следующих условий:
где - цена игры. Разделив на все неравенства, получаем задачу линейного программирования.
Найти
,
при ограничениях:
Решив эту задачу, получаем:
,
то есть
,
и
.
Таким образом, минимаксная стратегия заключается в выборе стратегии с вероятностью 0,0385, и стратегии с вероятностью 0,9615. Это означает, что если весной наблюдается большое число осадков , то с вероятностью 0,0385 принимается решение , а с вероятностью 0,9615 - решение . Если же весной наблюдается малое число осадков , то принимается решение . Кроме того, видно, что минимаксная стратегия более осторожна, чем байесовская, так как .
Если решать эту задачу без проведения эксперимента, то легко можно получить:
а) байесовское решение: ;
б) минимаксное решение: .
Видно, что проведение эксперимента действительно позволило улучшить результаты статистика, особенно минимаксное решение.