Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей.

Критерий Гурвица был выдвинут в 1951 году Леонидом Гурвицем, как некоторая альтернатива, попытка разработать промежуточный критерий, который учитывает критику критериев Вальда и максимакса. В научной литературе он именуется критерием Гурвица: «Критерий пессимизма-оптимизма Гурвица с коэффициентом оптимизма λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru [0,1] оптимальности чистых стратегий относительно выигрышей».

Данный критерий позволяет учитывать комбинацию наихудших состояний. Смысл его состоит в нахождении по специальной формуле эффективности всех стратегий игрока А и последующее сравнении данных показателей эффективности для выбора наиболее оптимальной стратегии, при условии полной неопределённости, т.е. вероятности состояния природы нам неизвестны. Другими словами, при выборе решения мы находим некоторый средний результат при состоянии, находящемся между крайним пессимизмом и безудержным оптимизмом.

Критерий Гурвица целесообразно применять в следующих ситуациях:

1. Информация о состояниях окружающей среды отсутствует или недостоверна;

2. Необходимо считаться возможным появлением наихудшего и наилучшего состояния природы;

3. Допускается некоторый риск.

Рассмотрим игру с природой размера mxn, m Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru 2, n Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru 2, с матрицей A= (aij), где i=1,2,…,m, а j=1,2,…,n. Пусть A1 ,A2 ,…,Am– чистые стратегии игрока А и П12,...Пn– состояния природы П. Вероятности состояний неизвестны.

Введём специальный коэффициент λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru [0,1], которым обозначим количественную «меру оптимизма» игрока А при выборе стратегии. Данный коэффициент выбирает сам игрок, на основании интуиции, личного опыта, состояния окружающей среды или на основе статистических исследований результатов принятия решений.

Эффективность чистой стратегии Ai в смысле критерия Гурвица [(Hur)p(λ)] характеризуется показателем:

(Hur)pi (λ)= (1- λ)Wi + λMi , i = 1,2,…,m, (2.1)

где Wiи Mi - показатели эффективности стратегии Ai соответственно по критерию Вальда и по максимаксному критерию.

Таким образом, Игрок А при использовании критерия Гурвица с коэффициентом λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru [0,1] занимает более взвешенную позицию, чем если бы он применил критерий Вальда или максимаксный критерий.

Если открыть скобки в равенстве (2.1) и несколько преобразовать данное выражение, то можно получить показатель эффективности (Hur)pi (λ) в форме линейной функции от аргумента λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru [0,1] с угловым коэффициентом (Mi -Wi):

(Hur)pi (λ) = (Mi -Wi) λ + Wi (2.2)

Ценой игры в чистых стратегиях по критерию Гурвица с коэффициентом оптимизма λ относительно выигрышей или (Hur)p (λ)-ценой в чистых стратегиях называется максимальный из показателей эффективности:

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru (2.3)

Оптимальной во множестве чистых стратегий по критерию Гурвица с коэффициентом λ относительно выигрышей, или (Hur)p (λ) – оптимальной во множестве Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru , называется чистая стратегия Ak с наибольшим (Hur)p (λ)-показателем эффективности:

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru (2.4)

Из определений (2.2) и (2.3) очевидно, что критерий Гурвица оптимальности чистых стратегий относительно выигрышей при λ = 0 превращается в критерий Вальда оптимальности чистых стратегий, а при λ = 1 – в максимаксный критерий оптимальности чистых стратегий.

Составим общий алгоритм нахождения оптимальной чистой стратегии игрока А относительно выигрышей с использованием критерия Гурвица:

1) Выбираем по строкам наименьший выигрыш и заполняем колонку Wi ;

2)Выбираем по строкам наибольший выигрыш и заполняем колонку Mi;

3)Находим эффективность чистой стратегии по формуле:

(Hur)pi (λ)= (1- λ)Wi+ λMi; результаты заносим в соответствующую колонку в таблицу;

4)По методу максимина (критерий Вальда) и максимакса определяем наибольший из всех расчётных выигрышей в колонках Wiи Мi; по наибольшему значению (Hur)pi определяется оптимальная чистая стратегия данного игрока.

5)Для разрешения конфликтной ситуации составляем таблицу Гурвица относительно игрока В. В таблице меняем платёжную матрицу.

6)Далее также применяем обобщенный критерий Гурвица и метод максимина относительно игрока В.

7)Игрок, разрешающий конфликтную ситуацию определяется по наибольшему расчётному выигрышу из соответствующих оптимальных стратегий игроков, т.е. используется формула Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно выигрышей. - student2.ru .

Выбор показателя оптимизма λ логичен: вместо того, чтобы придерживаться двух крайностей в оценке ситуации в большинстве случаев целесообразно придерживаться некоторой промежуточной позиции, которая учитывает как наихудшее, так и наилучшее поведение природы.



Наши рекомендации