Стохастической неопределенности

Принятие решения в условиях стохастической неопределенности можно описать с помощью матрицы «выигрышей» (или «потерь») c m возможными действиями (стратегиями) Стохастической неопределенности - student2.ru и n возможными случайными состояниями природы Стохастической неопределенности - student2.ru , которая имеет вид:

Стохастической неопределенности - student2.ru ,

где Стохастической неопределенности - student2.ru представляется как выигрыш (потеря), связанный с Стохастической неопределенности - student2.ru -ой стратегией ЛПР (игрока) и Стохастической неопределенности - student2.ru -м состоянием природы.

При решении задач наряду матрицами рассматривают соответствующие таблицы:

Таблица 5.1. Исходная матрица в условиях неопределенности
  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru

Для Стохастической неопределенности - student2.ru используют также термин: «полезность» принятого решения.

Таким образом, требуется найти вектор Стохастической неопределенности - student2.ru , который обеспечивает оптимум заданной функции полезности Стохастической неопределенности - student2.ru по некоторому критерию.

В условиях неопределенности вероятностное распределение, соответствующее состояниям природы, не известно. Поэтому выбор стратегии игроком принимается на основе ряда критериев:

1. Критерий Лапласа.

2. Максиминный (минимаксный) критерий.

3. Максимаксный критерий.

4. Критерий Гурвица.

5. Критерий Сэвиджа.

Критерий Лапласа опирается на следующее соображение: так как распределение вероятностей состояний среды неизвестно, можно считать их равными, то есть Стохастической неопределенности - student2.ru .

Выбор наилучшей стратегии выбирается на основе критерия максимизации выигрыша, если Стохастической неопределенности - student2.ru задает выигрыш:

Стохастической неопределенности - student2.ru , (5.1)

или минимизации потерь, если Стохастической неопределенности - student2.ru задает потерю:

Стохастической неопределенности - student2.ru , (5.2)

Пример T578. Хенк — прилежный студент, который обычно получает хорошие отметки благодаря, в частности, тому, что имеет возможность повторить материал в ночь перед экзаменом. Перед завтрашним экзаменом Хенк столкнулся с небольшой проблемой. Его сокурсники организовали на всю ночь вечеринку, в которой он хочет участвовать. Хенк имеет три альтернативы: Стохастической неопределенности - student2.ru — участвовать в вечеринке всю ночь; Стохастической неопределенности - student2.ru — половину ночи участвовать в вечеринке, а половину — учиться; Стохастической неопределенности - student2.ru — учиться всю ночь.

Профессор, принимающий завтрашний экзамен, непредсказуем, и экзамен может быть легким ( Стохастической неопределенности - student2.ru ), средним ( Стохастической неопределенности - student2.ru ) или трудным ( Стохастической неопределенности - student2.ru ). В зависимости от сложности экзамена и времени, затраченного Хенком на повторение, можно ожидать следующие баллы.



  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru

Порекомендуйте Хенку, какой выбор он должен сделать.

Решение. Очевидно, что в данном случае необходимо воспользоваться формулой (5.1), чтобы максимизировать полученный балл. Рассчитаем ожидаемые значения баллов для каждого решения (стратегии):

Стохастической неопределенности - student2.ru балла,

Стохастической неопределенности - student2.ru баллов,

Стохастической неопределенности - student2.ru балла.

  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru М
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru

Лаплас рекомендует учиться всю ночь.

Максиминный (минимаксный) критерийназывают еще критерием Вальда, или критерием «осторожного наблюдателя», так как предполагается, что внешняя среда находится в самом невыгодном положении. Поэтому критерий сводится к выбору наилучшей альтернативы из наихудших, если Стохастической неопределенности - student2.ru задает прибыль (максиминный критерий):

Стохастической неопределенности - student2.ru , (5.3)

или к выбору наихудшей альтернативы из наилучших, если Стохастической неопределенности - student2.ru задает потери (минимаксный критерий):

Стохастической неопределенности - student2.ru , (5.4)

Применим критерии к предыдущей задаче.

  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru

Стохастической неопределенности - student2.ru , критерий предлагает стратегию Стохастической неопределенности - student2.ru , оценивая при этом шансы Хенка, как получение 82 баллов, при условии, что он будет учиться всю ночь.

Максимаксный критерийназывают также критерием «здорового оптимиста», так как предполагается, что внешняя среда находится в самом выгодном положении. Поэтому критерий сводится к выбору наилучшей альтернативы из наилучших, если Стохастической неопределенности - student2.ru задает выигрыш:

Стохастической неопределенности - student2.ru , (5.5)

Применим критерий к предыдущей задаче.

  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru

Стохастической неопределенности - student2.ru , критерий предлагает стратегию Стохастической неопределенности - student2.ru , оценивая при этом шансы Хенка, как получение 100 баллов, при условии, что он будет учиться всю ночь.

Критерий Гурвица предполагает, что внешняя среда может находиться в наилучшем состоянии с вероятностью Стохастической неопределенности - student2.ru , а в наихудшем состоянии с вероятностью Стохастической неопределенности - student2.ru , где Стохастической неопределенности - student2.ru .

Если Стохастической неопределенности - student2.ru задает выигрыш, тогда решение по критерию Гурвица производится по условию:

Стохастической неопределенности - student2.ru , (5.6)

Если Стохастической неопределенности - student2.ru задает потери, тогда решение по критерию Гурвица производится по условию:

Стохастической неопределенности - student2.ru , (5.7)

Параметр Стохастической неопределенности - student2.ru называют показателем оптимизма, так как выбором параметра можно задавать степень оптимизма. При Стохастической неопределенности - student2.ru критерий Гурвица переходит в критерий оптимиста, а при Стохастической неопределенности - student2.ru — в критерий пессимиста.

Рассмотрим решение предыдущей задачи с уровнем оптимизма Стохастической неопределенности - student2.ru . Ожидаемое значения баллов для стратегии Стохастической неопределенности - student2.ru :

Стохастической неопределенности - student2.ru .

Аналогично рассчитаем значения для остальных стратегий. Для сравнения приведем результаты расчетов при различных Стохастической неопределенности - student2.ru :

  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru 62,5
Стохастической неопределенности - student2.ru 89,8 86,5 83,2
Стохастической неопределенности - student2.ru 96,4 85,6
  max: 96,4 85,6

Наилучшим решением и для данного критерия является Стохастической неопределенности - student2.ru .

Критерий Сэвиджа строится на основе матрицы «потерь» Стохастической неопределенности - student2.ru , которая получается из матрицы платежей (выигрышей или проигрышей) следующим образом:

Стохастической неопределенности - student2.ru

Построим матрицу потерь для рассматриваемого выше примера. В данном случае Стохастической неопределенности - student2.ru задает выигрыш. Поэтому найдем максимальные значения по столбцам:

  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
max

Вычтем полученные числа 100, 88, 82 из элементов соответствующих столбцов, получим матрицу потерь:

  Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
Стохастической неопределенности - student2.ru
max

К полученной матрице применяется минимаксный критерий:

Стохастической неопределенности - student2.ru ,

что соответствует решению Стохастической неопределенности - student2.ru .

Наши рекомендации