Выбор оптимальной стратегии статистика
Для перехода к выбору наилучшей стратегии необходимо упростить матрицу игры с учётом доминирования стратегий статистика. Отбрасывать те или иные состояния природы нельзя, т.к. она может реализовать любое своё состояние независимо от того, выгодно оно статистику или нет. Иногда выгоднее перейти от упрощённой платёжной матрицы к матрице рисков. Если в платёжной матрице alk > ast, то это ещё не значит, что стратегия Ak лучше стратегии As. Такую ситуацию может прояснить матрица рисков.
Риском rij статистика, когда он пользуется чистой стратегией Ai при состоянии Пj природы, называются разность между максимальным выигрышем max aij, который он мог бы получить, достоверно зная, что природой будет реализовано именно состояние Пj, и тем выигрышем aij, который он получит, используя стратегию Ai, не зная, какое из состояний Пj природа реализует.
Таблица 7
Ai | Пj | ̅ri | ||
П1 | … | Пn | ||
А1 … Аm | r11 … rm1 | … … … | r1n … rmn | ̅r1 … ̅rm |
qj | q1 | … | qn |
Т.о., элементы rij матрицы рисков (табл. 7) определяются по формуле
где βj – максимально возможный выигрыш статистика при состоянии Пj (максимальный элемент j-того столбца платёжной матрицы (см.табл. 4)), т.е. βj = max aij.
Матрица рисков, составленная по матрице выигрышей рассматриваемого примера (см. табл. 6), приведена в табл. 8.
Таблица 8
Ai | Пj | max rij | ||
П1 | П2 | П3 | ||
А1 А2 А3 |
Рассмотрим критерии выбора оптимальной стратегии статистика с использованием вероятностей qj состояний природы. В этом случае пользуются как средним значением ̅aij выигрыша
определяемым для каждой чистой стратегии Аi статистика (табл. 6. 11), так и средним значением ̅ri риска
которое находится аналогично по матрице рисков (см. табл. 6).
В качестве оптимальной по критерию Байеса принимается чистая стратегия Аi, при которой максимизируется средний выигрыш ̅ai статистика, т. е. обеспечивается max ̅ai.
Предположим, что вероятности q1, q2, q3 потребления сырья в количествах 10, 11 и 12 единиц соответственно равны 0,3; 0,1; 0,6.
Тогда на основании формулы (8) находим значения средних выигрышей (дополнительных затрат) (табл. 9) и устанавливаем, что наименьшей величины, равной 1,4 они достигают при стратегии А3 (надо запасать 12 единиц сырья), которая и будет оптимальной по Байесу.
Таблица 9
Ai | Пj | ̅ai. | ||
П1 | П2 | П3 | ||
А1 А2 А3 | -2 -4 | -5 -2 | -10 -5 | -6,5 -3,6 -1,4 |
qj | 0,3 | 0,1 | 0,6 |
Если статистик не располагает объективной информацией об априорных вероятностях qj состояний природы Пj и считает в равной мере правдоподобными все состояния, то их вероятности полагают одинаковыми, т. е. q1 = … = qn = 1/n.
Этот приём называют принципом недостаточного основания Лапласа, в соответствии с которым оптимальной считается стратегия, обеспечивающая
Критерий Вальда – это максиминный критерий как для чистых, так и для смешанных стратегий.
Критерий Вальда – это критерий крайнего пессимизма, т.к. здесь статистик исходит из предположения, что природа «действует» против него наихудшим образом, т.е. реализует такие свои состояния Пj, при которых величина его выигрыша принимает наименьшее значение minaij.
Исходя из этого, статистик выбирает такую чистую стратегию Ai, при которой наименьший выигрыш minaij будет максимальным, т. е. обеспечивается максимин
Говоря иначе, здесь определяется обычная максиминная чистая стратегия игрока А.
Как видно из табл. 6, в нашем примере максимин
α=max (-10; -5; -4) = -4.
Следовательно, оптимальной по Вальду чистой стратегией является A3, т.е. запас сырья на предприятии должен составлять 12 единиц. При этом дополнительные затраты будут равны 4 единицам.
Критерий Сэвиджа, как и критерий Вальда, является критерием крайнего пессимизма, ибо здесь статистик исходит из предположения, что природа реализует самые неблагоприятные для него состояния.
Критерий Сэвиджа рекомендует выбирать в качестве оптимальной ту чистую из стратегий Ai, при которой максимизируется величина maxrij максимального риска, т.е. достигается
Как следует из матрицы рисков (см. табл. 8), в нашем примере оптимальной по Сэвиджу будет чистая стратегия А3, т.к. для неё выполняется условие
Критерий Гурвица, называемый критерием пессимизма-оптимизма, рекомендует рассчитывать на нечто среднее.
В области чистых стратегий оптимальной считается стратегия, найденная из условия
где и выбирается из субъективных соображений. При α = 1 критерий Гурвица превращается в критерий Вальда (крайнего пессимизма)
При α = 0 – в критерий крайнего оптимизма:
При 0 < α < 1 получается нечто среднее.
Пусть в нашем примере α = 0,6. Тогда из (10) получаем
Все промежуточные результаты приведены в таблице 10.
Таблица 10
Ai | Пj | minaij | 0,6minaij | maxaij | 0,4maxaij | hj | ||
П1 | П2 | П3 | ||||||
А1 А2 А3 | -2 -4 | -5 -2 | -10 -5 | -10 -5 -4 | -6,0 -3,0 -2,4 | -6,0 -3,0 -2,4 |
Из последнего столбца видно, что и соответствует стратегии А3, которая и будет оптимальной.
Анализ практических ситуаций следует проводить по нескольким критериям, что позволит глубже вникнуть в суть явления и выбрать обоснованное решение.