Занятие 12-13. Тема 4. Игры с природой. (Принятие решений в условиях неопределенности. Теория статистических решений.) Критерии Вальда, Гурвица, Сэвиджа, миниминный, максимаксный.
Пример.«Покупка акций»
Инвестирование средств в приобретение акций является одним из самых доступных для широкого круга инвесторов, но в то же время и одним из самых рискованных видов инвестиций.
Предположим, что инвестор может купить акции одной из трех компаний К1, К2, K3. При этом он намерен руководствоваться доходностью акций, которая определяется как отношение дохода к цене акций и выражается в процентах. Доход по акциям представляет собой сумму дивидендов и курсовых разниц в цене акций. Информация о доходности акций в различные временные периоды систематически публикуется.
Более сложной задачей для инвестора является оценка надежности эмитентов акций, поскольку соответствующая информация в проспектах эмиссии, публикуемых перед выпуском акций, или в листингах фондовой биржи, на которой котируются акции, совершенно недостаточна и быстро устаревает. Поэтому инвесторам приходится использовать косвенные данные, формируя представления о надежности эмитентов по колебанию доходности их акций. Практическая статистика показывает, что большое колебание доходности чаще всего говорит о низкой надежности эмитента акций, т.е. об опасности ситуации, а низкий показатель колебания свидетельствует об обратном.
В качестве математической модели описанной ситуации можно рассмотреть игру с природой, в которой роль сознательного игрока играет инвестор, а роль природы П исполняет ситуация на фондовом рынке, складывающаяся в разные временные периоды по разному, и влияющая на доходность акций объективно, не противодействуя осознанно инвестору.
Предположим, что имеются данные о доходности в процентах годовых при состоянии природы П, характеризующихся месяцами с января по апрель: П1 — данные за январь, П2 — данные за февраль, П3 — данные за март и П4 — данные за апрель. Из этих данных сформируем матрицу игры
Пi | П1 | П2 | П3 |
| ||
Ai | ||||||
А1 | ||||||
А2 | ||||||
А3 |
Таким образом, в распоряжении игрока А (инвестора) имеется три стратегии: Аi — покупка акций компании Ki, i=1,2,3, а природа П может находится в одном из четырех состояний (рынка ценных бумаг): Пj, j =1,2,3,4.
Инвестору надлежит принять решение в условиях неопределенности, какой компании отдать предпочтение? Другими словами надо найти решение описанной игры с природой в чистых стратегиях.
Среди стратегий игрока А нет доминирующих остальные стратегии. Так, что явно предпочтительной стратегии нет. Среди стратегий также нет доминируемых, которые, как заведомо невыгодные, можно было бы отбросить.
Средние доходности при стратегиях А1, А2, А3, вычисляемые как средние арифметические элементов строк матрицы (1), равны соответственно 9,5; 7; 9, а колебания доходностей равны соответственно 20-4=16; 7-7=0, 12-6=6. Отсюда видно, что хотя средняя доходность при выборе стратегии А1 самая высокая, но и самая высокая предположительная ненадежность компании К1, поскольку при стратегии А1 самый высокий показатель колебания доходности 16. При стратегии А2 самый низкий показатель колебания доходности 0, т.е. компания К2 является надежной, но, к сожалению, и самый низкий средний уровень доходности 7. Стратегия А3 занимает как бы промежуточное положение между стратегиями А1 и А2 со средней доходностью 9 и колебанием 6.
Найдем и сравним между собой оптимальные стратегии по каждому из критериев: крайнего пессимизма Вальда, крайнего оптимизма, пессимизма-оптимизма Гурвица относительно выигрышей в опасной и безопасной ситуациях и по обобщенному критерию Гурвица относительно выигрышей в опасной и безопасной ситуациях.
Расположив доходности в каждой строке матрицы (1) в неубывающем порядке и матрицу с переставленными элементами дополнив строкой сумм элементов каждого столбца, получим матрицу (2):
j | Wi | Mi | ||||
Bi | ||||||
В1 |
| |||||
В2 | ||||||
В3 | ||||||
bj |
где Wi и Mi — минимальная и максимальная доходности i — строки, i =1,2,3, а bj — сумма доходностей j-го столбца матрицы (2), j = 1,2,3,4.
Применим критерий Вальда. Из первого столбца матрицы (2) показатели эффективности стратегий А1, А2, А3 по критерию Вальда соответственно равны W1=4, W2=7, W3=6 и, следовательно, максимин W=max{4, 7, 6}=7=W2. Поэтому, по критерию Вальда, оптимальной является стратегия А2.
Таким образом, инвестор, будучи безнадежным пессимистом, предполагает, что ситуация на рынке ценных бумаг складывается для него наихудшим образом, т.е. природа действует против него осознанно и злонамеренно. Поэтому он принимает крайне осторожное решение: приобрести акции компании К2, минимальная доходность которых (W2=7) больше минимальных доходностей акций остальных двух компаний (W1=4, W3=6). К тому же компания К2 надежнее компаний K1 и K3 (показатель колебания доходности ее акций, равный нулю, самый низкий), но с самой низкой средней доходностью.
Теперь найдем оптимальную стратегию, руководствуясь критерием крайнего оптимизма. В четвертом столбце матрицы (2) стоят показатели эффективности стратегий по максимаксному критерию: M1=20, М2=7, М3=12. Тогда макси-макс М=max{20; 7; 12}=20=М1. Следовательно, по критерию крайнего оптимизма оптимальной будет стратегия А1, при выборе которой инвестор уверен, что природа будет находится в благоприятнейшем для него состоянии П4 и, таким образом, он получит наибольшую доходность акций, правда при самой низкой надежности компании K1.
Перейдем к нахождению оптимальной стратегии под углом зрения критерия пессимизма-оптимизма Гурвица относительно выигрышей с показателем оптимизма λ .
Сначала предположим, что выбор стратегии инвестору приходится делать в опасной ситуации, которую он прогнозирует либо на основании своей интуиции, либо основываясь на каких-то показателях, отрицательно характеризующих ситуацию на фондовом рынке. Поэтому показатель оптимизма λ можно выбрать в соответствии с принципом невозрастания средних выигрышей в первом и четвертом столбцах матрицы (2) по формуле (2.21.20) при j = п = 4 :
Тогда показатель пессимизма . Следовательно, по формуле (2.21.12) с использованием формул (2.21.8) и (2.21.10) можем вычислить показатели эффективности стратегии А1, А2, А3 по рассматриваемому критерию:
Тогда
и потому оптимальной по критерию Гурвица относительно выигрышей с показателем оптимизма будет стратегия А1.
Теперь допустим, что ситуация на фондовом рынке безопасна для инвестора. В таком случае показатель оптимизма λ можно выбрать по принципу неубывания средних выигрышей в первом и четвертом столбцах матрицы (2), используя формулу (2.21.21) при j = n = 4 :
Стало быть показатель пессимизма . Мы видим, что в безопасной ситуации по сравнению с опасной показатели оптимизма и пессимизма поменялись местами. По формуле (2.21.12) с учетом формул (2.21.8) и (2.21.10) для показателей эффективности стратегий по рассматриваемому критерию получим следующие значения:
Следовательно,
и, значит, в качестве оптимальной по критерию Гурвица с показателем оптимизма надо рассматривать опять же стратегию А1.
Таким образом, критерий Гурвица с показателями оптимизма и рекомендует в качестве оптимальной выбирать одну и ту же стратегию А1. Это говорит о том, что в рассматриваемом примере при выборе показателя оптимизма в соответствии с предложенным принципом, критерий Гурвица не различает опасную и безопасную ситуации. Ниже мы увидим, что в случае обобщенного критерия Гурвица это не так.
Найдем оптимальные стратегии по обобщенному критерию Гурвица.
В опасной ситуации, выбирая коэффициенты λ1, λ2, λ3, λ4 по принципу невозрастания средних выигрышей, находим их по формуле (2.21.20) при n = 4 :
(3)
Тогда по формуле (2.21.5) показатели эффективности стратегий будут иметь следующие значения:
Поэтому
и, следовательно, оптимальной будет стратегия A3.
В рассматриваемой опасной ситуации с коэффициентами (3) на основании формул (2.21.6) при п = 4 показатели пессимизма и оптимизма равны соответственно:
В безопасной ситуации коэффициенты λ1, λ2, λ3, λ4 вычисляем по формуле (2.21.21) в соответствии с принципом неубывания средних выигрышей:
(4)
Следовательно, по формуле (2.21.5) находим показатели эффективности стратегий А1, А2, А3, A4 :
откуда
и потому оптимальной является стратегия А1.
В безопасной ситуации с коэффициентами (4) вычисленные по формулам (2.21.6) при п = 4 показатели пессимизма и оптимизма соответственно равны
Таким образом, обобщенный критерий Гурвица в данном примере при указанном выборе коэффициентов λ1, λ2, λ3, λ4 в отличие от критерия Гурвица делает различие между опасной и безопасной ситуациями, в которых принимается решение о выборе оптимальной стратегии.
Для лучшей обозримости сведем полученные в данном примере результаты в таблицу.
Таблица
Выбор оптимальной стратегии
№ п/п | Критерий | Опасность ситуации | Коэффициенты критерия | Показатель | Максимальный показатель эффективностей стратегий | Оптимальная стратегия | |
оптимизма | пессимизма | ||||||
Критерий крайнего пессимизма Вальда | Крайне опасная ситуация | λ1=1, λ2=λ3=λ4=0 | λo=0 | λp=1 | W=G(1,0,0,0)=W2 | А2 | |
Максимальный критерий крайнего оптимизма | Крайне безопасная (благоприятная) ситуация | λ1=λ2=λ3=0, λ4=1 | λo=1 | λp=0 | M=G(0,0,0,1)=M1 | А1 | |
Критерий пессимизма | Опасная ситуация | , λ2=λ3=0, | А1 | ||||
оптимизма Гурвица | Безопасная ситуация | , λ2=λ3=0, | А1 | ||||
Обобщенный критерий пессимизма — оптимизма Гурвица | Опасная ситуация | , , , | А3 | ||||
Безопасная ситуация | , , , | А1 |
Пример .Рассмотрим игру с природой, задаваемой матрицей выигрышей
Табл.(4)
Ai, Пj | П1 | П2 |
А1 | ||
А2 |
Переставив элементы в первой строке матрицы (4), получим матрицу (5) :
Табл. (5)
Вi, j | Wi | |
B1 | ||
B2 |
Найдём чистою стратегию, оптимальную по критерию Вальда среди чистых стратегий. Из первого столбца матрицы (5) имеем показатели эффективности стратегий A1 и А2, равные соответственно W1=2 и W2=1. Тогда максимин W=max{2,1}=2= W1 и потому, оптимальной среди чистых будет стратегия A1, гарантирующая выигрыш, не меньше показателя её эффективности W1=2.
Пусть P=(p1, p2) — произвольная смешанная стратегия из множества SA. Если обозначить p1 = p, то, в силу нормировочного равенства p1+ p2 =1, будем иметь:
p2=1-p и, следовательно стратегию P можно переписать так: P = (p,l-p), . Тогда, используя матрицу выигрышей (4), получим для выигрышей H(P, П1) и H(P, П2) игрока A при применении им смешанной стратегии P, соответствующих состоянием природы П1 и П2, следующие представления:
Следовательно показатель эффективности стратегии P будет иметь следующий вид:
W(P) = min{H(P,nl), H(P,n2)}= min{3p +1, -5p + 7}.
Ha pис.1 изображены графики выигрышей H(P, П1), H(P, П2) как функций аргумента , представляющие собой отрезки прямых, и график показателя эффективности W(P) как функции от , являющийся нижней огибающей функций H(P, П1) и H(P, П2) и выделенный жирной линией
Для того чтобы показатель эффективности W(P) был больше 2 : W(P)>2, нeo6ходимо и достаточно, чтобы
Решая эту систему неравенств, получим:
Таким образом, показатель эффективности смешанной стратегии P(p,1-p), определяемой любой вероятностью , критерию Вальда выше показателя эффективности W1=2 стратегии A1, оптимальной среди чистых стратегий по тому же критерию.
Puc. 1--------------------------------
Найдём смешанную стратегию , оптимальной среди всех смешанных стратегий множества SA покритерию Вальда.
Так как по определению стратегии P0, оптимальной среди всех смешанных стратегий множества по критерию Вальда.
W(P°)=maxW(P),
то оптимальная стратегия P0 находиться во множестве {P=(p, l-p) : }и определяется значением вероятности p°, являющейся абсциссой наивысшей точки N нижней огибающей (cm. pиc. 1). Ho toчка N является точкой пересечения отрезков H(P, П1) = 3p+l и H(P, П2) = -5p+7 . Поэтому для нахождения абсциссы p° точкиN достаточно решить уравнение
3p+1=-5p+7.
Решением является p° = 3/4.
Таким образом, смешанная стратегия
P°= (3/4, ¼)
является оптимальной среди всех смешанных стратегий множества SA по критерию Вальда с наибольшим показателем эффективности
.
Оптимальной по критерию Вальда стратегия P°= (3/4, ¼) среди всех смешанных стратегий множества SA гарантирует игроку A при любых состояниях природы выигрыш, не меньший, чем 3'/4, в то время как чистая стратегия Al, оптимальной по тому же критерию среди чистых стратегий, гарантировала выигрыш, не меньший всего лишь 2.
Хотя и критерий Вальда, и критерий Cэвиджa являются критериями крайнего пессимизма, но они не эквивалентны. Для доказательства этого вернемся к примеру 2.23.2.
IIpимер 2.21.3. B IIpимере мы показали, что оптимальной (среди чистых стратегий) по критерию Вальда является стратегия A1. Найдём оптимальную стратегию по критерию Сэвиджа. Перепишем матрицу игры (2.21.24), дополнив её строкой максимальных выигрышей , j=1,2, при каждом состоянии природы:
Ai, Пj | П1 | П2 |
A1 | ||
A2 | ||
По этой матрице составим матрицу выигрышей (2.21.34):
Ai, Пj | П1 | П2 |
A1 | ||
A2 |
(2.21.44)
Переставив элементы первой строки этой матрицы, получим матрицу
Di ,j | ||
D1 | ||
D2 |
(2.21.45)
В первом столбце матрицы (2.21.45) стоят показатели неэффективности стратегий A1 и A2:
R1(1,0)=5, R2(l,0)=3.
Поэтому
min{R1(1,0), R2(l,0)}= min{5; 3}=3 =R2(1,0)
и, следовательно, оптимальной по критерию Cэвиджa будет стратегия A2.
Таким образом, в игре с матрицей (2.21.24) оптимальными по критериям Вальда и Севиджа будут разные стратегии, что и доказывает наше утверждение о неэквиволентности этих критериев.
Выше мы доказали неэквивалентность критерия Вальда и Сэвиджа, а из теоремы 2.23.2 следует неэквивалентность максимаксного и миниминного критериев. Это означает, что критерии Гурвица относительно выигрышей и относительно рисков неэквивалентны при покателях оптимизма λ=0 и λ=1. В связи с этим возникает вопрос: может быть эти критерии эквивалентны при всех остальных показателях оптимизма λ∈(0,1)? Оказывается, что ответ на этот вопрос также отрицателен. Приведем соответствующийпример.
Пример 2.21.4. Обратимся к игре с природой, рассмотренной в примере 2.223.2. пусть λ∈(0,1). По матрице (2.21.35), в первом столбце которой расположены минимальные выигрыши W1=2, W2=1, а во второй – максимальные М1=4, М2=7, определим показатели эффективности стратегий А1 и А2 по критерию Гурвица относительно выигрышей с показателем оптимизма λ.
В соответствии с формулой (2.21.12):
G1(λ)=(1- λ)*2+λ*4=2λ+2; G2(λ)=(1- λ)*1+λ*7=6λ+1. (2.21.51)
По матрице (2.21.45), в которой первый столбец состоит из максимальных рисков, а второй – из минимальных рисков, выпишем показатели неэффективности стратегий А1 и А2 по критерию Гурвица относительно рисков с тем же показателем оптимизма. По формуле (2.21.50):
R1(λ)=(1- λ)*5+λ*0=5-5λ; R2(λ)=(1- λ)*3+λ*0=3-3λ. (2.21.52)
Рассмотрим λ𝜖(0, 1/4). Имеем: λ<1/4, откуда 4* λ<1. Последнее неравенство можно переписать так: 6-6λ<2-1, откуда 6λ+1<2λ+2. Таким образом, [см.(2.21.51)], G2(λ)<G1(λ) и потому max{ G1(λ),G2(λ)}= G1(λ). Следовательно, оптимальной среди чистых стратегий по критерию Гурвица относительны выигрышей с показателем оптимизма λ𝜖(0, 1/4) является стратегия А1.
Если 1/4 <λ<1, то 1<4λ или 2-1<6λ-2λ, откуда по (2.21.51), G1(λ)=2λ+2<6λ+1= G2(λ) и, следовательно, max{ G1(λ),G2(λ)}= G2(λ). Значит оптимальной среди чистых стратегий по критерию гурвица относительно выигрышей с показателем оптимизма λ𝜖(1/4, 1) является стратегия А2.
При λ=1/4 в силу (21.51): G1(λ)= G1(1/4)=2*1/4+2=2*1/2; G2(λ)= G2(1/4)=6*1/4+1=2*1/2, т.е. G1(1/4)=G2(1/4) и, следовательно, в качестве оптимальной по критерию Гурвица относительно выигрышей с показателем оптимизма λ=1/4 можно взять любую из стратегий А1, А2.
Так как λ<1, то 2λ<2, откуда 5λ-3λ<5-3 или с учетом формул (2.21.52): R2(λ)=3-3λ<5-5λ=R1(λ) и, следовательно, min{R1(λ), R2(λ)}=R2(λ), т.е. оптимальной среди чистых стратегий по критерию Гурвица относительно рисков с показателем оптимальности λ𝜖(0, 1) является стратегия А2.
Для более обозримого сравнения применения критериев Гурвица относительно выигрышей и рисков к игре с природой с матрицей (2.21.34), составим сводную таблицу оптимальных по этим критериям стратегий, которые мы получили в примерах 2.23.2, 2.23.3, в доказательстве теоремы 2.23.2 и данном примере 2.23.4.
В этой таблице на пересечении строки «название критерия» и столбца «значение показателя оптимизма λ» стоит оптимальная стратегия по этому критерию с данным показателем оптимизма.
Из таблицы 2.21.2 мы видим, что оптимальные стратегии по критериям Гурвица относительно выигрышей и рисков разные для показателя оптимизма λ𝜖(0, 1/4), одинаковые для λ𝜖(1/4, 1), а при λ=1/4 и λ=1 оптимальные стратегии могут быть одинаковыми или разными в зависимости от выбора игрока А.
Распространим критерий Гурвица относительно рисков и его частные случаи – критерий Сэвиджа и миниминный критерий на смешанные стратегии.
Значения показателя оптимизма Критерии | λ=0 | 0<λ<1/4 | λ=1/4 | 1/4<λ<1 | λ=1 |
Критерий Гурвица относительно выигрышей с показателем оптимизма λ | Критерий вальда А1 | А1 | А1,А2 | А2 | Максимаксный критерий А2 |
Критерий Гурвица относительно рисков с показателем оптимизма λ | Критерий Сэвиджа А2 | А2 | А2 | А2 | Миниминный критерий А1, А2 |
может существовать смешанная, не чистая, стратегия игрока А, показатель неэффективности которой по критерию Сэвижда будет ниже показателя неэффективности стратегии, оптимальной среди чистых стратегий по тому же критерию.
Это утверждение доказывает следующий
Пример. Рассмотрим игру с природой, которая задается матрицей выигрышей (21.34). В примере 2.21.3 было показано, что стратегия является оптимальной среди чистых стратегий по критерию Сэвиджа, причем, показатель неэффективности этой стратегии по критерию Сэвиджа .
Пусть - произвольная смешанная стратегия из множества . Так как , то . Поэтому , если обозначить , то и стратегия P запишется в виде .
Используя равенство (2.20.17) и матрицу рисков (2.21.44) для матрицы (2.21.34), найдем риски и смешанной стратегии P, соответствующие состояниям природы и :
,
Тогда показатель неэффективности стратегии P по критерию Сэвиджа, определяемый формулой (2.21.55), будет равен
.
Таким образом, каждый из рисков , представляет собой линейную функцию аргумента p, определенную на отрезке [0,1], а показатель неэффективности стратегии P является верхней огибающей этих двух функций. На рис. 2.21.2 построены графики рисков , , представляющие собой отрезки прямых, пересекающихся в точке N, а верхняя огибающая этих отрезков выделена жирной линией.
Для того, чтобы выполнялось неравенство <3 необходимо и достаточно, чтобы <3 и <3. Решением неравенства <3 является p>0, а решением неравенства <3 является p<3/5. Таким образом показатель неэффективности смешанной стратегии при по критерию Сэвиджа меньше показателя неэффективности чистой стратегии , оптимальной среди чистых стратегий по тому же критерию:
r(P,Пj), j=1,2
5 R(P;0)=max{3-3p,5p}
3
1*7/8
N r(P,Пj)=3-3p
R(P,П2)=5p
0
3/8 3/5 1 Р
Рис. 2.21.2
Легко найти смешанную стратегию оптимальную среди всех смешанных стратегий множества по критерию Сэвиджа.
Поскольку, по определению, , то оптимальная стратегия будет находиться среди стратегий , , и определяться значением вероятности , являющемся абсциссой наинизшей точки N верхней огибающей (см. 2.21.2). Поскольку точка N является точкой пересечения отрезков
и , , то для нахождения абсциссы этой точки надо решить уравнение . Решением этого уравнения является . Таким образом смешанная стратегия является оптимальной среди всех смешанных стратегий множества по критерию Сэвиджа с наименьшим показателем неэффективности