Выбор оптимальной стратегии статистика

Для перехода к выбору наилучшей стратегии необходимо упростить матрицу игры с учётом доминирования стратегий статистика. Отбрасывать те или иные состояния природы нельзя, т.к. она может реализовать любое своё состояние независимо от того, выгодно оно статистику или нет. Иногда выгоднее перейти от упрощённой платёжной матрицы к матрице рисков. Если в платёжной матрице alk > ast, то это ещё не значит, что стратегия Ak лучше стратегии As. Такую ситуацию может прояснить матрица рисков.

Риском rij статистика, когда он пользуется чистой стратегией Ai при состоянии Пj природы, называются разность между максимальным выигрышем max aij, который он мог бы получить, достоверно зная, что природой будет реализовано именно состояние Пj, и тем выигрышем aij, который он получит, используя стратегию Ai, не зная, какое из состояний Пj природа реализует.

Таблица 7

Ai Пj ̅ri
П1 Пn
А1 … Аm r11 … rm1 … … … r1n … rmn ̅r1 … ̅rm
qj q1 qn

Т.о., элементы rij матрицы рисков Выбор оптимальной стратегии статистика - student2.ru (табл. 7) определяются по формуле

Выбор оптимальной стратегии статистика - student2.ru

где βj – максимально возможный выигрыш статистика при состоянии Пj (максимальный элемент j-того столбца платёжной матрицы (см.табл. 4)), т.е. βj = max aij.

Матрица рисков, составленная по матрице выигрышей рассматриваемого примера (см. табл. 6), приведена в табл. 8.

Таблица 8

Ai Пj max rij
П1 П2 П3
А1 А2 А3

Рассмотрим критерии выбора оптимальной стратегии статистика с использованием вероятностей qj состояний природы. В этом случае пользуются как средним значением ̅aij выигрыша

Выбор оптимальной стратегии статистика - student2.ru

определяемым для каждой чистой стратегии Аi статистика (табл. 6. 11), так и средним значением ̅ri риска

Выбор оптимальной стратегии статистика - student2.ru

которое находится аналогично по матрице рисков (см. табл. 6).

В качестве оптимальной по критерию Байеса принимается чистая стратегия Аi, при которой максимизируется средний выигрыш ̅ai статистика, т. е. обеспечивается max ̅ai.

Предположим, что вероятности q1, q2, q3 потребления сырья в количествах 10, 11 и 12 единиц соответственно равны 0,3; 0,1; 0,6.

Тогда на основании формулы (8) находим значения средних выигрышей (дополнительных затрат) (табл. 9) и устанавливаем, что наименьшей величины, равной 1,4 они достигают при стратегии А3 (надо запасать 12 единиц сырья), которая и будет оптимальной по Байесу.

Таблица 9

Ai Пj ̅ai.
П1 П2 П3
А1 А2 А3 -2 -4 -5 -2 -10 -5 -6,5 -3,6 -1,4
qj 0,3 0,1 0,6  

Если статистик не располагает объективной информацией об априорных вероятностях qj состояний природы Пj и считает в равной мере правдоподобными все состояния, то их вероятности полагают одинаковыми, т. е. q1 = … = qn = 1/n.

Этот приём называют принципом недостаточного основания Лапласа, в соответствии с которым оптимальной считается стратегия, обеспечивающая

Выбор оптимальной стратегии статистика - student2.ru

Критерий Вальда – это максиминный критерий как для чистых, так и для смешанных стратегий.

Критерий Вальда – это критерий крайнего пессимизма, т.к. здесь статистик исходит из предположения, что природа «действует» против него наихудшим образом, т.е. реализует такие свои состояния Пj, при которых величина его выигрыша принимает наименьшее значение minaij.

Исходя из этого, статистик выбирает такую чистую стратегию Ai, при которой наименьший выигрыш minaij будет максимальным, т. е. обеспечивается максимин

Выбор оптимальной стратегии статистика - student2.ru

Говоря иначе, здесь определяется обычная максиминная чистая стратегия игрока А.

Как видно из табл. 6, в нашем примере максимин

α=max (-10; -5; -4) = -4.

Следовательно, оптимальной по Вальду чистой стратегией является A3, т.е. запас сырья на предприятии должен составлять 12 единиц. При этом дополнительные затраты будут равны 4 единицам.

Критерий Сэвиджа, как и критерий Вальда, является критерием крайнего пессимизма, ибо здесь статистик исходит из предположения, что природа реализует самые неблагоприятные для него состояния.

Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту чистую из стратегий Ai, при которой максимизируется величина maxrij максимального риска, т.е. достигается

Выбор оптимальной стратегии статистика - student2.ru

Как следует из матрицы рисков (см. табл. 8), в нашем примере оптимальной по Сэвиджу будет чистая стратегия А3, т.к. для неё выполняется условие Выбор оптимальной стратегии статистика - student2.ru

Критерий Гурвица, называемый критерием пессимизма-оптимизма, рекомендует рассчитывать на нечто среднее.

В области чистых стратегий оптимальной считается стратегия, найденная из условия

Выбор оптимальной стратегии статистика - student2.ru

где Выбор оптимальной стратегии статистика - student2.ru и выбирается из субъективных соображений. При α = 1 критерий Гурвица превращается в критерий Вальда (крайнего пессимизма)
Выбор оптимальной стратегии статистика - student2.ru

При α = 0 – в критерий крайнего оптимизма:

Выбор оптимальной стратегии статистика - student2.ru

При 0 < α < 1 получается нечто среднее.

Пусть в нашем примере α = 0,6. Тогда из (10) получаем

Выбор оптимальной стратегии статистика - student2.ru

Все промежуточные результаты приведены в таблице 10.

Таблица 10

Ai Пj minaij 0,6minaij maxaij 0,4maxaij hj
П1 П2 П3
А1 А2 А3 -2 -4 -5 -2 -10 -5 -10 -5 -4 -6,0 -3,0 -2,4 -6,0 -3,0 -2,4

Из последнего столбца видно, что Выбор оптимальной стратегии статистика - student2.ru и соответствует стратегии А3, которая и будет оптимальной.

Анализ практических ситуаций следует проводить по нескольким критериям, что позволит глубже вникнуть в суть явления и выбрать обоснованное решение.

Наши рекомендации