Решение статистических игр по различным критериям
Статистическая игра (игра с природой) – это парная матричная игра, в которой сознательный игрок А(статистик), заинтересованный в наиболее выгодным для него исходе игры выступает против участника, совершенно безразличного к результатам игры (назовем его природой П).
Статистик может использовать несколько стратегий А1, А2,…,Аm. Природа также обладает множеством стратегий (состояний) П1, П2,…,Пn. Под состоянием природы будем понимать полную совокупность внешних условий, в которых статистику приходится выбирать свою стратегию. Из прежнего опыта статистику обычно известны возможные состояния природы, а иногда и вероятности qj, с которыми природа реализует их. Эти вероятности называют априорными. Статистик может уточнить свои знания о состоянии Пj природы и вероятности qj, их реализации путем проведения экспериментов. Вероятности, установленные таким образом, называют апостериорными.
В своих взаимоотношениях, с природой статистик может пользоваться как
чистыми стратегиями Аi, так и смешанными стратегиями =(p1;…..pm). Если он имеет возможность оценить последствия применения каждой своей чистой стратегии Аi в зависимости от любого состояния Пj природы, т.е. если ему известен численный результат aij для каждой допустимой комбинации (Аi;Пj),то статистическую игру можно задать платежной матрицей [aij]m*n.
Критерий Вальда
Критерий Вальда – это максиминный критерий, и его можно сформулировать как для чистых, так и для смешанных стратегий. Критерий Вальда является критерием крайнего пессимизма, так как здесь статистик исходит из предположения, что природа «действует» против него наихудшим образом, т.е. реализует такие состояния Пj, при которых величина его выигрыша принимает наименьшее значение. Исходя из этого, статистик выбирает такую чистую стратегию Аi, при которой наименьший выигрыш будет максимальным, т.е. обеспеченным (См. пример 5, п. 2, стр.17).
, i,j=
Как видно из этой таблицы v= =6
Следовательно, оптимальной по Вальду является чистая стратегия А2 (открывать ателье на 4тыс ремонтов в год).
Для смешанных стратегий критерий Вальда формируется следующим образом: оптимальной смешанной стратегией статистика считается та, при которой его минимальный средний выигрыш максимизируется. В рассмотренном примере для нахождения оптимальной по Вальду смешанной стратегии * = ( *, *,..., *) решается соответствующая задача линейного программирования. В результате получится *=(0,75;0;0;0,25), v=9. С практической точки зрения результат решения удобней использовать в следующем виде: показатель эффективности телеателье будет максимальным и составит 9 тыс.ден.ед., если открыть ателье на 2*0,75+4*0+6*0+8*0,25=3,5 тыс. ремонтов в год. Найденное значение в смешанных стратегиях явно рациональней, нежели в чистых стратегиях, так как мощности ателье меньше (3,5<4), а показатель эффективности выше (9>6).
2. критерий Гурвица, называемый критерием пессимизма-оптимизма, рекомендует рассчитывать на нечто среднее. В области чистых стратегий оптимальной считается стратегия, найденная в условиях
, где принимает значение из интервала (0;1) и выбирается из субъективных соображений. При =1 критерий Гурвица превращается в критерий Вальда (крайнего пессимизма), а при =0 в критерий крайнего оптимизма.
Пусть в нашем примере =0,8, тогда имеем
= .
Все промежуточные результаты приведены в исходной таблице в последнем столбце (См. пример 5, п. 2, стр.17).
Отсюда maxGi=12 и соответствует стратегии А2 (открыть ателье на 4 тыс.ремонтов год, которая и будет оптимальной).
Критерий Сэвиджа
Критерий Сэвиджа, как и критерий Вальда является критерием крайнего пессимизма. Согласно критерию Сэвиджа рекомендуется выбрать в качестве оптимальной ту чистую стратегию Аi, при которой величина максимального риска будет минимальной.
где rij – элементы матрицы [rij]4*4
Элементы rij матрицы рисков определяются по формуле rij=βj-aij≥0, где βj – максимально возможный выигрыш при состоянии Пj (максимальный элемент j-го столбца платежной матрицы), т.е. (j= ),
Отсюда, матрица рисков будет
Аi | Пj | П1(2) | П2(4) | П3(6) | П4(8) | S |
А1(2) | ||||||
А2(4) | ||||||
А3(6) | ||||||
А4(8) |
Из нее следует S=min(84;56;28;36)=28, т.е. оптимальной чистой стратегией по Сэвиджу будет стратегия А3 (открывая ателье на 6 тыс. ремонтов в год), так как именно при этой стратегии минимизируется максимальный риск.
При использовании критерия Сэвиджа в области смешанных стратегий вместо среднего выигрыша (как было в критерии и Вальда) рассматривается средний риск. Самым неблагоприятным для статистика является такое состояние Пj природы, при котором величина среднего риска достигает наибольшего значения. Критерий Сэвиджа рекомендует в качестве оптимальной стратегии выбирать ту смешанную стратегию *, при которой максимальное значение среднего риска будет минимальным.
Другая группа критериев – это критерий Байеса и Лапласа. В этих критериях пользуются как средние значения , для
определяемые для каждой чистой стратегии Ai, так и средние значением ri риска, которые определяются по матрице рисков.
В качестве оптимальной стратегии по критерию Байеса принимается чистая стратегия Аi, при которой средний выигрыш статистика будет максимальным. Предположим, что вероятности qj состояний природы Пj известны и соответственно равны (0,2;0,35;0,25;0,2). Тогда значения средних выигрышей для каждой чистой стратегий определяется:
A1 =0,2*18+0,35*8+0,25(-2)+0,2*(-12)=3,5
A2 =0,2*6+0,35*36+0,25*26+0,2*16=23,5
A3=0,2*(-6)+0,35*24+0,25*54+0,2*44=29,5
A4=0,2*(-18)+0,35*12+0,25*42+0,2*72=25,5
Наибольший средний выигрыш, равный 29,5,достается при стратегии А3 (открытие ателье на 6 тыс.ремонтов в год), которая и будет оптимальной по Байесу.
Аналогично можно найти оптимальную по Байесу стратегию, используя матрицу рисков. В этом случае средний риск следует минимизировать. Можно доказать, что стратегия, максимизирующая средний выигрыш, совпадает со стратегией, минимизирующей средний риск.
Если статистик не располагает объективной информацией об априорных вероятностях qj состояний природы Пj и считает в равной мере правомерным все состояния, то их вероятности полагаются одинаковыми, т.е. q1=q2=….qn=1/n. Этот пример называют принципом недостаточного основания Лапласа. Отсюда и критерий Лапласа, в соответствии с которым оптимальной считается чистая стратегия, обеспечивающая максимальный средний выигрыш Аi при равенстве всех априорных вероятностей. В нашем примере для критерия Лапласа априорные вероятности
q1=q2= q3=q4=0,25
Средний выигрыш составят:
q1 =0,25(18+8-2-12)=3
q2 =0,25(6+36+26=16)=21
q3=0,25(-6+24+54+44)=29
q4=0,25(-18+12+42+72)=27
Наибольший средний выигрыш, равный 29, достигается при стратегии А3 (открыть ателье на 6 тыс.ремонтов в год),который будет оптимальный по Лапласу.
В интересах объективности можно найти средние значения j вероятностей, определенных квалифицированными экспертами для каждого состояния на основе субъективного опыта экспертов.
9 Тестовые вопросы
0011234 Суть игры состоит в том, что:
1. Следует последовательно распределить все запасы, имеющиеся в первом, во втором и т.д. пунктах производства, по первому, второму и т.д. пунктах потребления;
2. Каждый из участников принимает такие решения в развивающийся конфликтной ситуации, которые, как он полагает, могут обеспечить наилучший исход:
3. Найти максимум или минимум выбранной в соответствии с интересами аналитика целевой функции при имеющихся ограничениях;
4. Квадрат суммы разностей между фактически значением результативного признака и его теоретическим значением сводится к минимуму.
0022134 Исход игры – это:
1. Значение некоторой функции, называемой функцией выигрыша, которая может задаваться аналитическим выражением;
2. Выбор и реализация игроком одного из предложенных вариантов;
3. Значение некоторой функции выигрыша, которая может задаваться либо
аналитическим, или таблично;
4. Значение некоторой функции, называемой функции выигрыша, которая может задаваться только таблично.
0034123 Стратегия игры – это:
1.Математическая дисциплина конфликтных ситуаций, разрабатывающая рекомендации по наиболее рациональному образу действий каждого из участников в ходе конфликтной ситуации;
2. Упрощенная математическая модель конфликтных ситуаций, отличающаяся от реальных конфликтов тем, что ведётся по определенным правилам;
3. Совокупность правил, однозначно определяющих последовательность действий игрока в каждой конкретной ситуации, складывающаяся в процессе игры;
4. Действия, которые обеспечили бы наилучший результат.