Критерий Байеса относительно выигрыша (К1).

Пусть задана игра ис природой

  П1 Пn
A1      
  aij  
An      
qi q1   qn

Определение:

Показателем эффективности стратегии Аi называется величина Критерий Байеса относительно выигрыша (К1). - student2.ru

Стратегия игрока называется максимальной, если показатель эффективности ее максимален. Ai0 – оптимальна (в соответствии с К1) => max āi = āi0.

Критерий Байеса относительно выигрыша (К1). - student2.ru Определение:

Выигрыш игрока при использовании им смешанной стратегии P=

Равен Критерий Байеса относительно выигрыша (К1). - student2.ru

Определение:

Показателем эффективности игрока А (в соответствии с К1) называется величина

Критерий Байеса относительно выигрыша (К1). - student2.ru

Определение:

Стратегия P0 игрока А назыается оптимальной на множестве Sa (в соответствии с К1) если

Критерий Байеса относительно выигрыша (К1). - student2.ru

Теорема.

Если стратегия Аio оптимальна на множестве чистых стратегий Sca (в соответствии с К1), то она оптимальна и на множестве смешанных стратегий Sa (в соответствии с К1).

Доказательство.

Критерий Байеса относительно выигрыша (К1). - student2.ru

Если верно, что Критерий Байеса относительно выигрыша (К1). - student2.ru , то => Критерий Байеса относительно выигрыша (К1). - student2.ru

Т.к. Критерий Байеса относительно выигрыша (К1). - student2.ru . Критерий Байеса относительно выигрыша (К1). - student2.ru

Критерий Байеса относительно риска (К2).

Определение:

Показателем неэффективности Аi (в соответствии с К2) есть величина

Критерий Байеса относительно выигрыша (К1). - student2.ru , ║rij║ = Ra.

Стратегия Аi0 игрока А называется оптимальной, если Критерий Байеса относительно выигрыша (К1). - student2.ru

Определение:

Риском, при использовании игроком А стратегии P и при Пi называется:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Определение:

Показатель эффективности стратегии В игрока А (в соответствии с К2) называется величина:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Определение:

Смешанные стратегии P0 игрока А называется оптимальной (в соответствии с К2), если

Критерий Байеса относительно выигрыша (К1). - student2.ru

Теорема.

Стратегия Аio игрока А, оптимальная (в соответствии с К2) на множестве ScА (множество рисков), будет оптимальной и на SА (множество смешанных стратегий).

Доказательство:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Докажем это неравенство в другую сторону.

Пусть Критерий Байеса относительно выигрыша (К1). - student2.ru , Критерий Байеса относительно выигрыша (К1). - student2.ru

Критерий Байеса относительно выигрыша (К1). - student2.ru

Критерий Байеса относительно выигрыша (К1). - student2.ru

Критерий Байеса относительно выигрыша (К1). - student2.ru

Критерий Байеса относительно выигрыша (К1). - student2.ru

Итак, Критерий Байеса относительно выигрыша (К1). - student2.ru

Теорема об эквивалентности К1 и К2.

Рассмотрим показатели эффективности стратегий относительно риска:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Критерий Байеса относительно выигрыша (К1). - student2.ru достигает своего минимума если Критерий Байеса относительно выигрыша (К1). - student2.ru достигает своего максимума.

Критерий Лапласса относительно выигрыша/риска.

Все состояния природы считаются равновероятными.

Критерий Байеса относительно выигрыша (К1). - student2.ru , j = 1, ..., n

Далее, все формулировки аналогичны критериям Байеса.

Критерий относительных значений вероятностей состояний природы с учетом рисков. Так же, как и в случае предыдущего критерия располагаем неизвестные вероятности состояний природы в виде монотонной последовательности пропорционально последовательности положительных чисел τ1,..., τn, т.е. имеем равенство (2.20.27), из которого для вероятностей qi, i=1,…, n, выводим формулу (2.20.31)

Критерий Байеса относительно рисков при вероятностях состояний природы (2.20.31) назовем критерием относительных значений вероятностей состояний природы с учетом рисков. При этом показатель неэффективности стратегии подсчитывается по формуле (2.20.10), вероятности qi,..., qn в которой представлены формулой (2.20.31):

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.20.38)

где rij - риски, заполняющие матрицу (2.20.9).

Поскольку величина Критерий Байеса относительно выигрыша (К1). - student2.ru не зависит от номера i=l,..., n, то в качестве показателя неэффективности стратегии Аi,- поданному критерию можно рассматривать величину

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.30.29)

Оптимальной среди чистых стратегий по обсуждаемому критерию является
стратегия с минимальным показателем неэффективности (2.20.39).

Показателем неэффективности смешанной стратегии P=(pi,..., рm) по рассматриваемому критерию является величина Критерий Байеса относительно выигрыша (К1). - student2.ru , определяемая формулой (2.20.13), в которой вероятности qj, j=l,.., n, задаются формулой (2.20.31):

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.20.40)

где риск r(P, Пj) применения смешанной стратегий Р при состоянии природы Пj определяется формулой (2.20.12).

Оптимальной среди всех смешанных стратеги Р множества SA по данному критерию является стратегия, для которой показатель неэффективности (2.20.40) минимален.

Теорема 2.20.2 при вероятностях состояний природы (2.20.31) говорит о том, что чистая стратегия, оптимальная среди чистых по критерию относительных значений вероятностей состояний природы с учетом рисков является оптимальной по тому же критерию и среди всех смешанных стратегий.

Пример 2.20.6. В условиях примера 2.20.5 найдем оптимальную стратегию по критерию относительных значений вероятностей состояний природы с учетом рисков.

Выпишем матрицу рисков (2.20.26) (без последнего столбца) для платежной матрицы (2.20.37) (без последнего столбца) и добавим к ней столбец показателей неэффективности стратегий ri, вычисленных по формуле (2.20.39):

Ai \ Пj П1 П2 П3 П4 Критерий Байеса относительно выигрыша (К1). - student2.ru
A1
A2
A3
A4

(2.20.41)

Так, например, Критерий Байеса относительно выигрыша (К1). - student2.ru =4*7+3*1+2*6+1*4=47.

Из последнего столбца матрицы (2.20.41) мы видим, что

минимальным показателем неэффективности Критерий Байеса относительно выигрыша (К1). - student2.ru =12 обладает стратегия А3 и, значит, она по критерию относительных значении вероятностей состояний природы с учетом рисков является оптимальной.

Результаты в примерах 2.20.5 и 2.20.6 совпадают. Теорема 2.20.3 при вероятностях состояний природы, вычисляемых по формуле (2.20.31), показывает, что это не случайность, а именно показывает, что критерии относительных значений вероятностей состояний природы с учетом выигрышей и с учетом рисков эквивалентны. Для лучшей обозримости сведем рассмотренные в этом параграфе критерии в таблице.

Таблица 2.20.1

Критерии относительно выигрышей

№№ п/п Критерий Вероятности состояний природы Критерий Байеса относительно выигрыша (К1). - student2.ru Показатель эффективности стратегии Критерий Байеса относительно выигрыша (К1). - student2.ru
1B Критерий Бейса относительно выигрышей Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru
2B Критерий Лапласа относительно выигрышей Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru
3B Критерий относительный значений вероятностей Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru

По каждому из этих критериев оптимальной является стратегия Критерий Байеса относительно выигрыша (К1). - student2.ru , показатель эффективности которой Критерий Байеса относительно выигрыша (К1). - student2.ru , т.е. Критерий Байеса относительно выигрыша (К1). - student2.ru = Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru . Очевидно, что каждый из этих критериев является по существу критерием Байеса относительно выигрышей и отличаются они друг от друга лишь способом добывания информации о вероятностях состояний природы.

По каждому из этих критериев является стратегия Критерий Байеса относительно выигрыша (К1). - student2.ru показатель

неэффективности Критерий Байеса относительно выигрыша (К1). - student2.ru который минимален, т.е. Критерий Байеса относительно выигрыша (К1). - student2.ru = Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru .

Каждый из этих критериев является критерием Байеса относительно рисков и отличаются они друг от друга только способом получения информации о вероятностях состояний природы.

Таблица 2.20.21

Критерии относительно рисков состояний природы с учетом рисков

№№ п/п Критерий Вероятности состояний природы Критерий Байеса относительно выигрыша (К1). - student2.ru Показатель эффективности стратегии Критерий Байеса относительно выигрыша (К1). - student2.ru
1P Критерий Бейса относительно рисков Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru
2P Критерий Лапласа относительно рисков Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru
3P Критерий относительный значений вероятностей состояний природы с учетом рисков Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru

Наконец, напомним, что, как следует из теоремы 2.20.3, критерии 1В, 2В, 3В эк­вивалентны соответственно критериям 1р,2р,3р.

Заканчивая обсуждение способов принятия решения в условиях риска, мы видим, что информация о вероятностях состояний природы может быть как объективной, так и субъективной. Оптимальные стратегии, определенные на основе субъективной оценки вероятностей состояний природы, в общем случае также оказываются субъективными. Степень субъективности оптимальных решений можно уменьшить, если вероятности состояний природы, назначенные одним экспертом, заменить на средние вероятностей, назначенных различными экспер­тами независимо друг от друга.

Критерий Байеса относительно выигрыша (К1). - student2.ru ПРИНЯТИЕ РЕШЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

В предыдущей лекции мы рассмотрели подходы к принятию решений в условиях риска, т.е. в условиях, когда мы существенно использовали вероятности состояний природы, добытые тем или иным путем.

В настоящем параграфе мы обсудим некоторые критерии принятия оптималь­ных решений в условиях неопределенности, т.е. когда вероятности, с которыми природа может принимать то или иное состояние, неизвестны и отсутствует вся­кая возможность получения о них какой-либо статистической информации.

Пусть в игре с природой П игрок А обладает m возможными чистыми страте­гиями А1...,Аm, а природа П может находится в одном из n состояний П1..., Пn. Пусть (20.1) является матрицей выигрышей игрока А.

Обобщенный критерий пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами λ123,…λn .

Переставим выигрыши аi1i2,...,аin при каждой стратегии Ai, (т.е. элементы каждой строки матрицы (2.20.1)), расположив их в неубывающем порядке, и обо­значим элементы полученной матрицы через bij, а саму матрицу — через B:

Bi \ j n
B1 b11 b12 b1n
B2 b21 b21 b2n
Bm bm1 bm2 bmn

B =

Таким образом,

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.1)

Каждая строка Bi матрицы В является перестановкой выигрышей при страте­гии Ai, (i = 1,..., m). Не исключена возможность, что для некоторых номеров i и j будет иметь место равенство bij = aij. В силу неравенств (2.21.1), в первом столбце матрицы В стоят минимальные выигрыши при каждой стратегии

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.2)

а в последнем n-м столбце — максимальные выигрыши при каждой стратегии

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.3)

Пусть числа λ123,…λn, удовлетворяют условиям

Критерий Байеса относительно выигрыша (К1). - student2.ru и Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.4)

Показателем эффективности стратегии Аi по рассматриваемому критерию назовем число

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.5)

Из этого определения видно, что показатель эффективности стратегии Аi, учи­тывает все выигрыши при этой стратегии bi1,..., bin и зависит от чисел λi,j=1,..., n, удовлетворяющих условиям (2.21.4).

Выражение (2.21.5) является выпуклой комбинацией выигрышей ни строки матрицы В с коэффициентами λi,j=1,..., n,. В обозначении Критерий Байеса относительно выигрыша (К1). - student2.ru можно было бы не указывать один из коэффициентов, например, λ1, поскольку он одно­значно определяется остальными n-1 коэффициентами из нормировочного ра­венства (2.21.4).

Обобщенным критерием пессимизма-оптимизма Гурвица относительно выигрышей с коэффициентами Критерий Байеса относительно выигрыша (К1). - student2.ru назовем критерий, по которому опти­мальной среди чистых стратегий считается стратегия Критерий Байеса относительно выигрыша (К1). - student2.ru . с максимальным пока­зателем эффективности (2.21.5), т.е.

Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru

Числа

Критерий Байеса относительно выигрыша (К1). - student2.ru и Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.6)

назовем показателями соответственно пессимизма и оптимизма. В обозначе­ниях (2.21.6) индекс «р» — первая буква английского pessimism [, pesi'mizm], ин­декс «о» — первая буква английского optimism ['optimizm], a Критерий Байеса относительно выигрыша (К1). - student2.ru — целая часть числа Критерий Байеса относительно выигрыша (К1). - student2.ru , т.е. наибольшее целое число, непревосходящее числа n/2; очевидно, что

Критерий Байеса относительно выигрыша (К1). - student2.ru

, если n-число четное ( Критерий Байеса относительно выигрыша (К1). - student2.ru 2)

, если n-число нечетное ( Критерий Байеса относительно выигрыша (К1). - student2.ru 2)

Коэффициенты λ123,…λn выбираются из субъективных соображений следующим образом: чем опаснее ситуация, тем больше возникает желание в ней подстраховаться, тем больше, т.е. ближе к единице, должен быть коэффициент пессимизма λp (см. 2.21.6) и, следовательно, тем меньше, т.е. ближе к нулю, будет коэффициент оптимизма λo. В безопасной ситуации коэффициенты λ123,…λn выбираются так, чтобы показатель пессимизма λp был ближе к нулю, а показатель оптимизма λo— ближе к единице. Таким образом, показатели пессимизма λp и оптимизма λo в данном критерии выражают количественную меру соответственно пессимизма и оптимизма игрока A, выбирающего коэффициенты λ1,…λn.

Если показатель оптимизма λo > 1/2 и, следовательно показатель пессимизма λp< < 1/2, то критерий более «оптимистический», чем «пессимистический»; если, наоборот, показатель оптимизма λo < ½ и, следовательно показатель пессимизма λр > ½, то критерий более пессимистический чем оптимистический; если же показатели оптимизма и пессимизма равны: λoр=1/2, то критерий можно считать реалистическим.

Критерий Байеса относительно выигрыша (К1). - student2.ru Чуть позже мы предложим некоторый формализованный метод выбора коэффициентов λ123,…λn, учитывающий все выигрыши игрока А.

Если bij=aij для всех i=1,...,n и j=1,...,n, т.е. если матрица В совпадает с матрицей (2.20.1), то коэффициенты λ1,…λn, можно формально интерпретировать как вероятности состояний природы: q11...,qnn, и тогда показатель эффективности стратегии Ai, по обобщенному критерию Гурвица относительно выигрышей, определяемый формулой (2.21.5), превращается в показатель эффектив­ности стратегии Ai по критерию Байеса относительно выигрышей, вычисляемый по формуле (2.20.2) : Критерий Байеса относительно выигрыша (К1). - student2.ru . Следовательно, в этом случае, обобщенный критерий Гурвица относительно выигрышей превращается в критерий Байеса относительно выигрышей.

Если коэффициенты Критерий Байеса относительно выигрыша (К1). - student2.ru , то их можно формально трактовать как вероятности равновероятных состояний природы и из (2.21.5) получим:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Но поскольку bi1,...,bin есть перестановка элементов ai1,...,ain i-строки матрицы (2.20.1), то Критерий Байеса относительно выигрыша (К1). - student2.ru и, следовательно,

Критерий Байеса относительно выигрыша (К1). - student2.ru

т.е. показатель эффективности стратегии Ai по обобщенному критерию Гурвица относительно выигрышей совпадает, как это следует из равенства (2.20.23), с по­казателем эффективности стратегии Ai - по критерию Лапласа относительно выиг­рышей. Значит, обобщенный критерий пессимизма-оптимизма Гурвица относи­тельно выигрышей с равными коэффициентами λ1=…= λn=1/2, превращается в критерий Лапласа относительно выигрышей.

Критерий Вальда (критерий крайнего пессимизма).

Критерий Вальда есть частный случай обобщенного критерия Гурвица относительно выигрышей со специальными коэффициентами

λ1=1,λ2=0…= λn=0 (2.21.7)

которые, очевидно, удовлетворяют условиям (21.4).

Подставляя значения коэффициентов (2.21.7) в формулу (2.21.5) и учитывая (2.21.2), получим показатель эффективности стратегии Аi- по критерию Вальда:

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.8)

представляющий собой минимальный выигрыш игрока А при применении им стратегии Ai. Оптимальной среди чистых стратегий по критерию Вальда является, таким образом, стратегия Критерий Байеса относительно выигрыша (К1). - student2.ru , имеющая максимальный показатель эффективности (2.21.8):

Критерий Байеса относительно выигрыша (К1). - student2.ru

Другими словами, оптимальной среди чистых стратегий по критерию Вальда считается та чистая стратегия, при которой минимальный выигрыш является мак­симальным среди минимальных выигрышей всех чистых стратегий. Таким обра­зом, оптимальная стратегия по критерию Вальда гарантирует при любых состоя­ниях природы выигрыш, не меньший, чем максимин

Критерий Байеса относительно выигрыша (К1). - student2.ru

Из (2.21.7) и (2.21.6) получаем, что для критерия Вальда показатель пессимизма λр=1 а показатель оптимизма λо=0. Это говорит о том, что критерий Вальца являет­ся критерием крайнего пессимизма, ибо ориентирует игрока А на наихудшие для не­го состояния природы и, следовательно, на крайне осторожное, осмотрительное по­ведение при выборе стратегий. Хотя арабская пословица и гласит «Кто боится соб­ственной тени, тому нет места под солнцем», тем не менее этот критерий уместен в тех случаях, когда игрок А не столько хочет выиграть, сколько не хочет проиграть. Принципом критерия Вальда часто пользуются в обиходе, что подтверждается та­кими поговорками, как «Семь раз отмерь—один раз отрежь», «Береженного бог бережет», «Лучше синица в руках, чем журавль в небе».

Максимаксный критерий (критерий крайнего оптимизма). Противоположностью критерию Вальда является так называемый максимаксный критерий, представляющий собой также частный случай обобщенного кри­терия Гурвица относительно выигрышей, когда коэффициенты λ12,…, λn выби­раются следующим образом:

λ1=…=λn-1=0, λn=1 (2.21.9)

Коэффициенты (2.21.9) удовлетворяют условиям (2.21.4). Если эти коэффици­енты подставить в (2.21.5) и учесть (2.21.3), то получим формулу для показателя эффективности стратегии Ai, по максимаксному критерию:

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.10)

Значит, в качестве показателя эффективности стратегии Ai по максимаксному критерию выбирается максимальный выигрыш при этой стратегии.

Тогда оптимальной среди чистых стратегий по максимаксному критерию яв­ляется стратегия Критерий Байеса относительно выигрыша (К1). - student2.ru с максимальным показателем эффективности„(2.21.10):

Критерий Байеса относительно выигрыша (К1). - student2.ru

т.е. стратегия, максимальный выигрыш при которой максимален среди макси­мальных выигрышей всех чистых стратегий. По-другому можно сказать, что оп­тимальной будет та чистая стратегия, при которой (хотя-бы) один из выигрышей

является максимальным среди выигрышей всех чистых стратегии. Оптимальная по максимаксному критерию стратегия гарантирует игроку А возможность наибольшего выигрыша, равного максимаксу

Критерий Байеса относительно выигрыша (К1). - student2.ru

Подставляя коэффициенты (2.21.9) в (2.21.6), найдем для максимаксного критерия показатель пессимизма λp=0 и показатель оптимизма λo=1. Таким образом, максимаксный критерий является критерием крайнего оптимизма, так как ориентирует лицо, принимающее решение, (игрока А) на наилучшие, благоприятнейшие для него состояния природы и, как следствие отсюда — на порой неоправданно легкомысленное, шапкозакидательское поведение при выборе стратегий. Вместе с тем, в некоторых случаях этим критерием пользуются осознанно, например, в ситуации, когда перед игроком А стоит дилемма: либо получить наибольший выигрыш, либо стать банкротом.

Критерий пессимизма-оптимизма Гурвица относительно выигрышей, с показателем оптимизма Критерий Байеса относительно выигрыша (К1). - student2.ru

Данный критерий является как бы промежуточным между критериями крайнего пессимизма и крайнего оптимизма и представляет собой частный случай обобщенного критерия Гурвица относительно выигрышей с коэффициентами

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.11)

удовлетворяющими, очевидно, условиям (2.21.4).

Из (2.21.11), (2.21.5), (2.21.2) и (2.21.3) следует, что показателем эффективности стратегии А, по рассматриваемому критерию является величина

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.12)

Оптимальной же стратегией по этому критерию считается стратегия Аi0 с максимальным показателем эффективности (2.21.12):

Критерий Байеса относительно выигрыша (К1). - student2.ru

Из (2.21.11) и (2.21.6) получаем, что показатели пессимизма и оптимизма в этом критерии равны соответственно λр=1-λ и λo=λ. При λ=0 мы из критерия Гурвица получаем критерий Вальда, а при λ=1 — максимаксный критерий. Чем ближе к нулю показатель оптимизма λ, тем ближе к единице показатель пессимизма 1-λ, и тем меньше оптимизма и больше пессимизма. И наоборот, чем ближе λ к единице, тем больше оптимизма и меньше пессимизма. Если показатель оптимизма Критерий Байеса относительно выигрыша (К1). - student2.ru , то и показатель пессимизма Критерий Байеса относительно выигрыша (К1). - student2.ru . В этом случае показатель эффективности стратегии Аi, как следует из формулы (2.21.12), примет вид:

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.13)

а так как множитель 1/2 в правей части этого равенства не зависит oт номера i, то в качестве показателя эффективности стратегии Аi по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма λ=1/2 можно рассмотреть правую часть равенства (2.21.13) без коэффициента 1/2:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Отметим, что критерий Вальда, максимаксный критерий и критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма Критерий Байеса относительно выигрыша (К1). - student2.ru не учитывают всех выигрышей игрока А при каждой его стратегии: критерий Вальда принимает во внимание только минимальные выигрыши при каждой стратегии, максимаксный критерий учитывает лишь максимальные выигрыши при каждой стратегии, а критерий пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма Критерий Байеса относительно выигрыша (К1). - student2.ru опирается на минимальные и максимальные выигрыши. В отличие от этого обобщенный критерий Гурвица учитывает все выигрыши при каждой стратегии игрока А, используя тем самым полную информацию об игре, поскольку вся имеющаяся информация об игре с природой в условиях неопределенности содержится в матрице выигрышей игрока A .

Перейдем к вопросу о формализации метода выбора коэффициентов λ1, λ2,..., λn в обобщенном критерии Гурвица относительно выигрышей.

Пусть

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.14)

— сумма выигрышей, стоящих в j-м столбце матрицы В;

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.15)

— среднее значение выигрышей bi j , стоящих в j-м столбце матрицы В;

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.16)

— сумма всех выигрышей матрицы В, или, что то же, сумма всех выигрышей матрицы А (см. (2.20.1)).

Просуммировав неравенства (2.21.1) по индексу i от 1 до m, получим с учетом обозначений (2.21.14):

Критерий Байеса относительно выигрыша (К1). - student2.ru

откуда, в обозначениях (2.21.15):

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.17)

В случае опасной ситуации выбор стратегии игроком А должен быть осторожным, «направленным» в сторону убывания выигрышей. Поэтому коэффициенты λj по мере убывания выигрышей должны возрастать. Учитывая (2.21.17), эти коэффициенты можно выбрать обратно пропорциональными средним выигрышам (21.15):

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.18)

Так как неравенства (2.21.17) можно переписать так:

Критерий Байеса относительно выигрыша (К1). - student2.ru

то принцип (2.21.18) выбора коэффициентов λj , j =1,..., n, можно назвать «принципом невозрастания средних выигрышей».

Выразим коэффициенты λj , j =1,..., n, через выигрыши bij .

Из (2.21.18):

Критерий Байеса относительно выигрыша (К1). - student2.ru

откуда

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.19)

Подставляя эти выражения в нормировочное равенство (2.21.4), получим

Критерий Байеса относительно выигрыша (К1). - student2.ru ,

откуда

Критерий Байеса относительно выигрыша (К1). - student2.ru

или, в силу (2.21.15) и (2.21.16):

Критерий Байеса относительно выигрыша (К1). - student2.ru

Подставляя найденное значение λ1 в (2.21.19) и используя (2.21.15), будем иметь:

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.20)

Таким образом, выбирая в опасной ситуации коэффициенты λj , j =1,..., n, в соответствии с принципом невозрастания средних выигрышей, мы видим, что j-й коэффициент λj представляет собой отношение суммы bn-j+1 элементов bi,n-j+1, i =1,.... m, стоящих в (n-j+1)-м столбце матрицы B, к сумме b всех ее элементов, т.е. коэффициент λj есть доля суммы элементов (n-j+1)-го столбца в сумме всех элементов матрицы В.

В случае безопасной ситуации коэффициенты λj при возрастании выигрышей должны возрастать; поэтому их можно выбрать по «принципу неубывания средних выигрышей» прямо пропорционально средним выигрышам (2.21.15):

Критерий Байеса относительно выигрыша (К1). - student2.ru

Аналогичным способом можно показать, что в данном случае коэффициенты λj выражаются через выигрыши следующим образом:

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.21)

Распространим критерий Гурвица относительно выигрышей, а значит и его частные случаи — критерии Вальда и максимаксный критерий, на смешанные стратегии.

Пусть SA - множество всех смешанных (в том числе и чистых) стратегий игрока A и Р=(р1,…, pm) — некоторая смешанная стратегия игрока А из множества Критерий Байеса относительно выигрыша (К1). - student2.ru . Тогда выигрыш игрока А при применении им смешанной стратегии P=(p1,…,pm), соответствующий состоянию природы Пj, равен

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.26)

где ai j, i=1,…, m; j=1,…, n, — элементы матрицы (2.20.1).

Показателем эффективности смешанной стратегии Р = (p1,..., pm) по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма Критерий Байеса относительно выигрыша (К1). - student2.ru назовем число

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.27)

где

Критерий Байеса относительно выигрыша (К1). - student2.ru и Критерий Байеса относительно выигрыша (К1). - student2.ru

— соответственно минимальный и максимальный выигрыши игрока А при использовании им смешанной стратегии Р.

Так как каждой смешанной стратегии Р соответствуют единственные значения минимального и максимального выигрышей, то W(P) и М(Р), а, следовательно, и G(P; λ), являются числовыми функциями векторного аргумента Р = (p1,..., pm) определенными на множестве SA.

Если, в частности, смешанная стратегия Р = (p1,..., pm) является чистой Аk, то pi = 0 при i ≠ к, и рk =1; следовательно, по формуле (2.21.26), H(P, Пj) = Н(Ак, Пj) = akj и показатель эффективности G(P; λ) превращается в показатель эффективности Gk(λ) чистой стратегии Аk , определяемый формулой (2.21.12) при i = k.

Оптимальной среди всех смешанных стратегий множества SA по критерию пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма Критерий Байеса относительно выигрыша (К1). - student2.ru назовем стратегию Критерий Байеса относительно выигрыша (К1). - student2.ru с максимальным показателем эффективности G(P; λ):

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.28)

В связи с бесконечностью множества SA встает вопрос о существовании определяемой формулой (2.21.28) оптимальной стратегии Р0, т.е. о достижимости функцией G(P; λ) своей верхней грани на множестве SA. Ответ на этот вопрос положителен. Для доказательства этого сначала докажем непрерывность функций W(P) и М(Р) на множестве SA.

Функция H(P, Пj), задаваемая формулой (2.21.26), линейна и, следовательно, непрерывна по аргументу P на множестве SA, т.е. для любого ɛ>0 найдется δj>0, зависящее от ɛ, номера j и точки P, такое, что для любой точки Критерий Байеса относительно выигрыша (К1). - student2.ru , отстоящей от точки P на расстоянии, не большем чем δj : ρ(P,U) ≤ δj , справедливо неравенство

Критерий Байеса относительно выигрыша (К1). - student2.ru

которое можно переписать так :

Критерий Байеса относительно выигрыша (К1). - student2.ru

или так:

Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru . (2.21.29)

Под paccтоянием Критерий Байеса относительно выигрыша (К1). - student2.ru понимается обычное евклидово paccтояние в пространстве Rm, определяемое формулой

Критерий Байеса относительно выигрыша (К1). - student2.ru

Eсли точка Критерий Байеса относительно выигрыша (К1). - student2.ru такова, что

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.30)

то неравенство Критерий Байеса относительно выигрыша (К1). - student2.ru ,будет выполняться для каждого j= 1,..., n, и, следовательно, для каждого j= 1,..., n, 6yдут выполняться неравенства (2.21.29).

Taк как

Критерий Байеса относительно выигрыша (К1). - student2.ru

то из левого неравенства (2.21.29) получим:

Критерий Байеса относительно выигрыша (К1). - student2.ru

B частности последнее неравенство будет выполняться для того номера j, который доставляет функции Критерий Байеса относительно выигрыша (К1). - student2.ru минимум, т.е.

Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru

Из этого неравенства и правого неравенства (2.21.29) будем иметь:

Критерий Байеса относительно выигрыша (К1). - student2.ru

В частности, справедливы неравенства

Критерий Байеса относительно выигрыша (К1). - student2.ru

которые можно переписать следующим образом :

Критерий Байеса относительно выигрыша (К1). - student2.ru

или

Критерий Байеса относительно выигрыша (К1). - student2.ru (2.21.31)

Taким o6paзом, mы noказали, что для любого Критерий Байеса относительно выигрыша (К1). - student2.ru найдётся Критерий Байеса относительно выигрыша (К1). - student2.ru такое, что из неравенства (2.21.30) следует неравенство (2.21.31). Это означает, что функция W(P) нeпpepывна b каждой точке P множества SA, T.e. нeпpepывна нa мhoжестве SA.

Доказательство непрерывности на множестве SA функции M(P) проводиться аналогично, в силу непрерывности функции H(P, nj) пo apryментy P нa мнoжестве SA, для любого Критерий Байеса относительно выигрыша (К1). - student2.ru найдётся Критерий Байеса относительно выигрыша (К1). - student2.ru тaкoe, что для любой точки Критерий Байеса относительно выигрыша (К1). - student2.ru , удовлетворяющей нepaвeнствy (2.21.30), 6yдут выполняться нepaвeнствa (2.21.29) для каждого j = 1,..., n. Из пpaвoгo нepaвeнствa (2.21.29) получим:

Критерий Байеса относительно выигрыша (К1). - student2.ru

Так как это неравенство верно для любого j = 1,..., n, to, b частности, имеем

Критерий Байеса относительно выигрыша (К1). - student2.ru

Отсюда и из левого неравенства (2.21.29) получим :

Критерий Байеса относительно выигрыша (К1). - student2.ru

Поскольку полученное неравенство имеет место для каждого j = 1,..., n, to справедливо неравенство

Критерий Байеса относительно выигрыша (К1). - student2.ru

из котoporo вытекает неравенство

Критерий Байеса относительно выигрыша (К1). - student2.ru .

Этим доказана непрерывность функции M(P) нa множестве SA. Из Heпpepывности функций W(P) h M(P) следует нeпpepывность функции Критерий Байеса относительно выигрыша (К1). - student2.ru кaк cyммы нeпpepывых функций Критерий Байеса относительно выигрыша (К1). - student2.ru Критерий Байеса относительно выигрыша (К1). - student2.ru и Критерий Байеса относительно выигрыша (К1). - student2.ru .

Taк кaк мнoжество SA является симплексом (cm. § 2.7), то oho замкнуто и ограничено (o6ocновaние этого факта cm. b доказательстве теоремы 2.8.1). Следовательно, по теореме Вейерштрасса [6. C. 274], нeпpepывная функция Критерий Байеса относительно выигрыша (К1). - student2.ru достигает на множестве SA своей верхней грани, т.e. найдётся стратегия Критерий Байеса относительно выигрыша (К1). - student2.ru , удовлетворяющая равенству (2.21.28).

При Критерий Байеса относительно выигрыша (К1). - student2.ru из формулы (2.21.27) полу

Наши рекомендации