Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков.

В играх с природой игроку приходится не только выбирать стратегии для достижения оптимального выигрыша, но и учитывать риски принимаемых решений. Таким образом, критерий Гурвица можно определить относительно рисков, в данном случае, критерий будет представлять собой комбинацию критерия Сэвиджа и миниминного критерия. Этот критерий будем называть критерием пессимизма-оптимизма Гурвица относительно рисков, или (Hur)r (λ)-критерием, где λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru [0,1] – показатель оптимизма.

В качестве показателя неэффективности чистой стратегии Ai по критерию Гурвица относительно рисков

[ (Hur)r (λ) ] рассматривается число: Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , i=1,2,…,m (1.1)

где (Sav)i и µi – показатели неэффективности стратегии Ai соответственно по критерию Сэвиджа и по миниминному критерию.

Показатели неэффективности чистой стратегии можно записать в следующей форме:

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru [0,1], i=1,2,…,m (1.2)

Из которой понятно, что Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru является линейной функцией аргумента λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru [0,1] с угловым коэффициентом Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru .

Ценой игры в чистых стратегиях ( Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru ) по критерию Гурвица относительно рисков является наименьший из показателей неэффективности всех чистых стратегий:

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru [0,1] (1.3)

Чистую стратегию Ak с наименьшим показателем неэффективности называется оптимальной во множестве чистых стратегий по критерию Гурвица относительно рисков, т.е.:

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , λ Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru [0,1] (1.4)

Использую формулу (1.1), находим Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru =(Sav)i и Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru = Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru . Таким образом видно, что критерий Гурвица оптимальности чистых стратегий относительно рисков при λ = 0 превращается в Критерий Сэвиджа оптимальности чистых стратегий, а при λ = 1 – в миниминный критерий оптимальности чистых стратегий.

Критерий Гермейера оптимальности чистых стратегий

При использовании этого критерия исходная платёжная матрица заменяется матрицей Гермейера. Каждый элемент матрицы мы домножаем на соответствующую вероятность j состояния природы.

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru для матрицы выигрышей,

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru для матрицы потерь.

Критерий Гермейера применяют игроки не склонные к риску, т.к. каждая стратегия оценивается с точки зрения min по гарантиров. результата.

  Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , q=0,4 Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , q=0,2 Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , q=0,1
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru

Состояние природы образует минимум а затем игрок выбирает стратегию которая принесёт ему максимальный результат. Т.е. он защищает себя.

Пример.

  Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , q=0,4 Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , q=0,2 Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru , q=0,1 VGi в. VGi п.
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru 3,6 0,8 0,1 0,1 3,6
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru 2,8 0,2 0,8 0,2 2,8
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru 4,4 0,6 0,7 0,6 4,4

Исходная матрица

Далее умножаем каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу :

В столбце VGi в. Находим миним. Элементы по строкам , а в столбце VGi п. находим макс. Элементы.

Далее находим VGi в (maxmin) , и VGi п. (minmax)

Получаем следующий ответ : S*=S3 , V*=0,6 - выигрыш S*=S2 , V*=2,8 - потеря

41.Критерий Ходжа – Лемана оптимальности чистых стратегий относительно выигрышей. Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru матрица выигрышей

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru матрица потерь

y- параметр отражающий степень доверия ЛПР к оценкам вероятностей состояния природы. y Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru [0,1] Чем выше у, тем выше доверие игрока А к оценкам вероятности. А следовательно от того как У зависит доминирует первое слагаемое или второе.

Критерий Ходжа-Лемана

1) Предположим, что матрицей выигрышей игрока А является матрица А.

2) Известны вероятности qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, удовлетворяющие условию (1).Таким образом, игроку А надлежит принимать решение в условиях риска.

3) Пусть l=2,

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru (11)

· показатель эффективности стратегии Аi по критерию Вальда,

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru (12)

· показатель эффективности стратегии Аi по критерию Байеса.

Матрица В примет вид

В= Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru

т.е. bi1=Wi, bi2=Bi, i=1,…,m.

4) Коэффициенты l1, l2 выбираются следующим образом:

l1=1-l, l2=l, где lÎ[0, 1]. (13)

Очевидно, что эти коэффициенты удовлетворяют условию (2).

5) По формуле (3), с учетом (11), (12), и (13), показатель эффективности стратегии Аi по критерию Ходжа-Лемана равен:

Gi=libi1+l2bi2=(1-l)Wi+lBi=(1-l)aij+l qiaji=1,…,m. (14)
 

В правой части формулы (14) коэффициент lÎ[0, 1] есть количественный показатель степени доверия игрока А данному распределению вероятностей qi=p(Пj), j=1,…,n, состояний природы Пj, j=1,…,n, а коэффициент (1-l) характеризует количественно степень пессимизма игрока А. Чем больше доверия игрока А данному распределению вероятностей состояний природы, тем меньше пессимизма и наоборот.

6) Цену игры по критерию Ходжа-Лемана находим по формуле (4):

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru

7) Оптимальной стратегией по критерию Ходжа-Лемана является стратегия Аk с наибольшим показателем эффективности:

Gk=G.

Отметим, что критерий Ходжа-Лемана является как-бы промежуточным критерием между критериями Байеса и Вальда. При l=1, из (14) имеем:Gi=Bi и потому критерий Ходжа-Лемана превращается в критерий Байеса. А при l=0, из (14): Gi=Wi и, следовательно, из критерия Ходжа-Лемана получаем критерий Вальда.

Пример.

Исходная матрица

  q=0,4 П1 q=0,3 П2 q=0,1 П3 q=0,2 П4
S1
S2

Далее используя формулы –

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru матрица выигрышей

Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru матрица потерь

каждый элемент в столбце на соответствующий коэффициент q. Получим следующую таблицу :

Vi1*q1 Vi2*q2 Vi3*q3 Vi4*q4  
Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru
2,4 0,9 0,8 0,5 4,6
1,6 0,9 1,2 0,5 4,2

Принимая Критерий пессимизма – оптимизма Гурвица оптимальности чистых стратегий относительно рисков. - student2.ru =0,6

Получим итоговые данные, для выйгрыша выберем макс. Элемент, для потерь – мин.

HL(выйгрыш) HL (потеря)
4,02 5,22
3,66 4,86

Получаем следующий ответ : S*=S1 , V*=4,02 - выигрыш

S*=S2 , V*=4,86 - потеря

42.Основные понятия и определения в теории неантагонистических (бескоалиционных) игр. Способы задания неантагонистической игры.

Некооперативная или бескоалиционная игра, это система Г= (aij,bij)=(Ha(Ai,Bj), Hb(Ai,Bj)), где Ai и Bj принадлежат Sa и Sb соответственно, а Ha и Hb функции выигрыша. Sa и Sb – множество стратегий игрока А и В Sa= {A1,A2, … , Am}, Sb = {B1,B2, … , Bn}.

Бескоалиционное поведение, когда соглашения между участниками запрещены правилами, а кооперативное поведение разрешается в форме выбора совместных стратегий.

Интересы игроков могут пересекаться, быть взаимовыгодными обоим игрокам, в то время как в антагонистическом конфликте это не представляется возможным.

Матрица выигрышей двух игроков в бескоалиционной игре имеет следующий вид S= SaxSb:

А\В B1 Bn
A1 (a11,b11) (a1n,b1n)
Am (am1,bm1) (amn,bmn)

Неантагонистические игры, как и антагонистические, могут быть как конечные, так и бесконечные. Эта характеристика игры зависит от количества чистых стратегий игроков (S1, S2, … ,Sk где k- количество игроков, конечны)

Способы задания игр:

· стратегическая(нормальная, матричная)

· позиционная форма(форма дерева)

Наши рекомендации