Принцип гарантованого результату

Так як антагоністичні ігри володіють тієї властивістю, що виграш одного (А) дорівнює програшу іншого (В), то всі необхідні дані можна помістити в таблицю (матрицю). Елементи матриці, числа aij. Така матриця - це нормальна форма подання ігри і називається вона платіжною (ігровою) матрицею, aij - виграш (програш) гравців. Гру, що представлена матрицею, називають грою m´n.

Табл.1.1

В А S1b S2b - - - Snb
S1a a11 a12 - - - a1n
- - - -        
Sma am1 am2 - - - amn

Нехай задана антагоністична гра в нормальній формі, тобто матрицею табл.1.1.

Знайдемо оптимальну стратегію гравців.

Очевидно, що для А при використанні стратегії S гарантованим виграшем буде найменше з a11, a12,..., a1n, тобто a1. Кращого результату, при правильній стратегії В, очікувати не доводиться.

Таким же чином А може розраховувати при виборі стратегії S2a, на min {a21,..., a2n}=a2, тобто у випадку стратегії Ska на min {akj}=a k і т. і.

Найкращої з всіх стратегій для А буде та, для якої a k - max, тобто виграш А ((гарантований) a =max a k =max min {akj}

1<k<m 1<k<m 1<j<n

Така стратегія називається максимінною.

Якщо А буде дотримуватись максимінної стратегії, то поза залежністю від стратегії В він виграє не менше a.

Тому a - це нижня ціна гри або максимінний виграш.

Аналогічне міркування для В, оскільки йдеться про програші сторони А, так як в антагоністичній грі ПВ(Ukj)=-ПА(Ukj)=-akj. Тоді при стратегії Skb це найкращий показник. Вj=max{akj} =>В=minВj= min max akj

1<k<m 1<j<m 1<j<n 1<k<m

- де В - min програш з усіх max. Така стратегія B називається мінімаксною, а В - верхньою ціною гри або мінімаксним програшем. Це результат, що не залежить від поведінки А.

В проведеному аналізі кожна із сторін була орієнтована на гіршу, з її точки зору ситуацію, а після цього з всіх гірших вибиралася найкраща. Цей принцип - принцип гарантованого результату (або принцип мінімаксу). Він припускає відсутність ризику.

ПРОБЛЕМА РІВНОВАГИ В ГРІ, ЧИСТІ

І ЗМІШАНІ СТРАТЕГІЇ

Якщо a=b, то в платіжній матриці присутній елемент apq, який мінімальний в р - рядку і max в q- стовпці і apq= a = b.

Приклад такої матриці

-22 -7 -8  
a23=8=apq
-9 -13  
-5 -3  

Очевидно, що елемент apq являє собою сідлову точку, що поєднує в собі і властивості т. min (для однієї перспектної) і точку max для іншої.

Такі ігри називаються іграми з сідловою точкою, мал.1.

принцип гарантованого результату - student2.ru Для таких ігор характерно, що відмова від мінімаксної стратегії будь-якого з учасників призводить його до програшу.   Мал.1.

Положення, при якому немає сенсу міняти стратегію жодної з сторін, називається ситуацією рівноваги. В іграх з сідловою точкою така ситуація виникає, якщо А та В використають стратегії Spa і Sqb, що називаються чистими. apq=a=b називається чистою ціною гри, а стратегії Spa і Sqb - оптимальними.

Чисті стратегії застосовуються, коли А та В володіють відомостями про дії один іншого і про їх результати. Якщо такої інформації немає, то принцип рівноваги порушується і гра ведеться безсистемно, тобто наосліп. Тому треба розрізняти ігри з повною інформацією, коли будь-який учасник знає всю передісторію ігри та ігри з неповною інформацією, в яких знання передісторії обмежене (наприклад, можливістю приховати від супротивника хід).

Ми будемо розглядати ігри з повною інформацією та з однією сідловою точкою, бо за наявності двох сідлових точок apq і azt, можна показати, що apq=azt.

Хоча на практиці найбільш розповсюджений випадок, коли платіжна матриця взагалі не має сідлової точки та a ¹ b.

Якщо в гру привноситься елемент випадку, тобто стратегія Sia буде обрана з ймовірністю Pia, то можна говорити про розподіл ймовірності на множині стратегій сторони А, причому принцип гарантованого результату - student2.ru .

А самий розподіл {P1a, P2a,…,Pma}=SA називається змішаною стратегією, якою володіє А в даній грі.

Аналогічно для B вводиться змішана стратегія SB={P1b,P2b,…,Pnb}, тобто деякий розподіл.

Чисті стратегії являються окремим випадком змішаних, наприклад, стратегію SPA можна задати SA={0, …,0,1, …,0}

При виборі змішаних стратегій зберігається принцип min max.

Нехай {SА} - множина змішаних стратегій А, а {SВ} - множина змішаних стратегій В. Тоді середня величина (мат. сподівання) платежу:

принцип гарантованого результату - student2.ru (4.1)

Це виграш А, отже програш В.

Сторона А повинна орієнтуватися на гірше (принцип гарантованості результату). Тоді принцип гарантованого результату - student2.ru - оптимальна стратегія Sa. Аналогічно принцип гарантованого результату - student2.ru - оптимальна стратегія Sb. Але такі рішення тільки в простих випадках.

Наши рекомендации