Принятие решений в условиях неопределенности и риска

Лекция 2. Виды стратегий и игровых равновесий.

Пусть имеется сообщество N, членов которого мы будем обозначать с помощью индекса Принятие решений в условиях неопределенности и риска - student2.ru и называть игроками. Каждый игрок имеет свою цель и определенные возможности для ее достижения; при этом цели различных игроков не обязательно совпадают, а достижение цели каждым отдельным игроком в некоторой степени зависит от действий других игроков. Кроме того, игроки могут не располагать полной информацией о целях и возможностях других игроков. Как формализовать и проанализировать такую ситуацию?

Определение 1.

Игрой n лиц в нормальной форме называется совокупность

Принятие решений в условиях неопределенности и риска - student2.ru , (1)

Содержащая для каждого игрока Принятие решений в условиях неопределенности и риска - student2.ru :

– множество стратегий Принятие решений в условиях неопределенности и риска - student2.ru , элементы которого (возможные действия игрока Принятие решений в условиях неопределенности и риска - student2.ru ) обозначаются Принятие решений в условиях неопределенности и риска - student2.ru ;

– функцию выигрыша (функцию полезности, целевую функцию, критерий оптимальности) Принятие решений в условиях неопределенности и риска - student2.ru , являющуюся отображением из Принятие решений в условиях неопределенности и риска - student2.ru в Принятие решений в условиях неопределенности и риска - student2.ru . Элемент Принятие решений в условиях неопределенности и риска - student2.ru множества Принятие решений в условиях неопределенности и риска - student2.ru называется исходом (ситуацией) игры (1).

Каждый игрок Принятие решений в условиях неопределенности и риска - student2.ru выбирает любую стратегию Принятие решений в условиях неопределенности и риска - student2.ru . После того, как все игроки выбрали свои стратегии, определяется исход Принятие решений в условиях неопределенности и риска - student2.ru и выигрыш каждого игрока Принятие решений в условиях неопределенности и риска - student2.ru при этом исходе. Таким образом, выигрыш каждого игрока зависит в общем случае от действий всех остальных игроков.

Предположим, что игроки в игре (1) действуют изолированно, т.е. каждый игрок выбирает свою стратегию независимо от того, какие стратегии выбирают другие участники. Игроки не обмениваются информацией. На выбор игроков не оказывает влияния прошлое.

Будем пока считать, что каждому игроку известна только его собственная функция выигрыша; функций выигрыша остальных игроков он может не знать.

Определение 2.

Стратегия Принятие решений в условиях неопределенности и риска - student2.ru игрока Принятие решений в условиях неопределенности и риска - student2.ru в игре в нормальной форме (1) доминирует стратегию Принятие решений в условиях неопределенности и риска - student2.ru , если

Принятие решений в условиях неопределенности и риска - student2.ru ,

Принятие решений в условиях неопределенности и риска - student2.ru ,

где Принятие решений в условиях неопределенности и риска - student2.ru , Принятие решений в условиях неопределенности и риска - student2.ru , Принятие решений в условиях неопределенности и риска - student2.ru .

Обозначим через Принятие решений в условиях неопределенности и риска - student2.ru множество всех деноминируемых стратегий i-го игрока:

Принятие решений в условиях неопределенности и риска - student2.ru : Принятие решений в условиях неопределенности и риска - student2.ru доминирует Принятие решений в условиях неопределенности и риска - student2.ru .

Стратегия i-го игрока Принятие решений в условиях неопределенности и риска - student2.ru доминирует Принятие решений в условиях неопределенности и риска - student2.ru , если независимо от поведения «остального мира» Принятие решений в условиях неопределенности и риска - student2.ru стратегия Принятие решений в условиях неопределенности и риска - student2.ru для него не дает большего выигрыша, чем Принятие решений в условиях неопределенности и риска - student2.ru , а для некоторого допустимого стратегического выбора игроков Принятие решений в условиях неопределенности и риска - student2.ru ему строго выгоднее выбрать Принятие решений в условиях неопределенности и риска - student2.ru , чем Принятие решений в условиях неопределенности и риска - student2.ru . Отсюда следует, что игроку Принятие решений в условиях неопределенности и риска - student2.ru всегда имеет смысл выбирать стратегию только из множества Принятие решений в условиях неопределенности и риска - student2.ru .

Подчеркнем, что для вычисления Принятие решений в условиях неопределенности и риска - student2.ru i-му игроку достаточно знать множества стратегий Принятие решений в условиях неопределенности и риска - student2.ru остальных игроков; знание их функций выигрыша не требуется.

Определение 3.

Стратегия Принятие решений в условиях неопределенности и риска - student2.ru игрока Принятие решений в условиях неопределенности и риска - student2.ru в игре (1) называется доминирующей (абсолютно оптимальной), если

Принятие решений в условиях неопределенности и риска - student2.ru .

Обозначим через Принятие решений в условиях неопределенности и риска - student2.ru множество всех доминирующих стратегий i-го игрока.

Определение 4.

Исход Принятие решений в условиях неопределенности и риска - student2.ru называется равновесием в доминирующих стратегиях, если Принятие решений в условиях неопределенности и риска - student2.ru является доминирующей стратегией i-го игрока при всех Принятие решений в условиях неопределенности и риска - student2.ru .

Лемма 1.

Пусть для любого Принятие решений в условиях неопределенности и риска - student2.ru множество Принятие решений в условиях неопределенности и риска - student2.ru компактно, а функция Принятие решений в условиях неопределенности и риска - student2.ru непрерывна. Тогда множество Принятие решений в условиях неопределенности и риска - student2.ru недоминируемых стратегий i-го игрока не пусто.

Применим эту лемму без доказательства. Не будем давать также определения компактности и непрерывности, отметив лишь, что сделанные предположения являются достаточно слабыми и выполняются в большом числе реальных ситуаций. Таким образом, можно считать, что условия леммы 1 практически почти всегда выполняются.

В противоположность этому, доминирующие стратегии могут не существовать даже в весьма простых играх. В самом деле, доминирующая стратегия должна одновременно быть решением зада максимизации

Принятие решений в условиях неопределенности и риска - student2.ru

При всех значениях параметра Принятие решений в условиях неопределенности и риска - student2.ru ; в общем случае не приходится ожидать, что такое решение существует

Определение 5.

Стратегии i-го игрока Принятие решений в условиях неопределенности и риска - student2.ru и Принятие решений в условиях неопределенности и риска - student2.ru называются эквивалентными, если они не различимы с его точки зрения:

Принятие решений в условиях неопределенности и риска - student2.ru .

Лемма 2.

Пусть в игре (1) множество недоминируемых стратегий i-го игрока не пусто: Принятие решений в условиях неопределенности и риска - student2.ru , множества стратегий Принятие решений в условиях неопределенности и риска - student2.ru компактны, функции выигрыша Принятие решений в условиях неопределенности и риска - student2.ru непрерывны, Принятие решений в условиях неопределенности и риска - student2.ru .

Тогда следующие утверждения эквивалентны:

– существует доминирующая стратегия i-го игрока: Принятие решений в условиях неопределенности и риска - student2.ru ;

– все стратегии в множестве Принятие решений в условиях неопределенности и риска - student2.ru эквивалентны.

…..если у игрока есть хотя бы одна доминирующая стратегия, то все доминирующие стратегии эквивалентны и совпадают с его недоминируемыми стратегиями. В этом случае будем считать, что если игрок использует одну из них (при некооперативном поведении, то есть действуя изолированно от других игроков). С другой стороны, если у i-го игрока нет доминирующей стратегии (наиболее частый случай), то его недоминируемые стратегии неэквивалентны, поэтому его некооперативное поведение не может быть определенно однозначно. Требуется дополнительные предположения об информации, которой располагают игроки (в частности, о функциях выигрыша).

Равновесие в доминирующих стратегиях постулируется рациональным некооперативным поведением изолированных игроков.

Пример 1: «дилемма заключенного».

Каждый из двух игроков располагает двумя стратегиями А и Р, где А обозначает агрессивность, Р – миролюбие. Предположим, что «мир» (оба игрока миролюбивы) лучше для обоих игроков, чем «война» (оба игрока агрессивны), но односторонняя агрессия (один игрок агрессивный, а другой миролюбивый) выгоднее агрессорам. Типичная структура выигрышей имеет следующий вид:

Р1
А1
Р2 А2

Стратегиями первого игрока являются строки платежной матрицы: Принятие решений в условиях неопределенности и риска - student2.ru а стратегиями второго игрока – столбцы Принятие решений в условиях неопределенности и риска - student2.ru результаты игры приведены в матрице 2х2, причем «северо-западное» число обозначает выигрыш первого игрока, а «юго-восточное» - выигрыш второго игрока, например Принятие решений в условиях неопределенности и риска - student2.ru

Очевидно, для обоих игроков стратегия А доминирует стратегию Р. Таким образом, единственное равновесие в доминирующих стратегиях имеет вид Принятие решений в условиях неопределенности и риска - student2.ru , т.е. постулируется, что результатом некооперативного поведения является война. В то же время исход Принятие решений в условиях неопределенности и риска - student2.ru (мир) дает больший выигрыш сразу обоим игрокам.

Таким образом, некооперативное эгоистическое рациональное поведение вступает в противоречие с коллективными интересами, которые в данном случае диктует выбор мирных стратегий. В то же время, если игроки не обмениваются информацией, то война является наиболее вероятным исходом; изолированность стратегических выборов может нанести определенный ущерб общественным интересам.

Определение Исход Принятие решений в условиях неопределенности и риска - student2.ru в игре (1) доминирует по Парето исход Принятие решений в условиях неопределенности и риска - student2.ru , если

Принятие решений в условиях неопределенности и риска - student2.ru

Исход х называется оптимальным по Парето, если он не доминирует по Парето.

Пример 2: «услуга за услугу».

Если у одного участника есть несколько доминирующих стратегий, то для него они эквивалентны, но, возможно, неэквивалентны для остальных. Рассмотрим следующую игру двух лиц, в которой стратегии каждого участника влияют только на выигрыш другого, но не на свой собственный:

благожелательность к игроку 2  
 
неблагожелательность к игроку 2  
 
  благожелательность к игроку 1 неблагожелательность к игроку 1  
 

Любой исход является равновесием в доминирующих стратегиях (проверьте!), но только один из них (благожелательность к игроку 2, благожелательность к игроку 1) оптимален по Парето.

Если у Принятие решений в условиях неопределенности и риска - student2.ru -го игрока не имеется информации о функциях выигрыша остальных игроков, то он не может исключать из рассмотрения какие-либо допустимые стратегии их Принятие решений в условиях неопределенности и риска - student2.ru .

Один из способов исключения стратегий на множестве состоит в удалении доминируемых стратегий. Другой путь соответствует пессимистическому предположению (исключающему риск), что случиться худшее.

Определение 7. В игре (9.1) стратегия Принятие решений в условиях неопределенности и риска - student2.ru является осторожной стратегией Принятие решений в условиях неопределенности и риска - student2.ru -го игрока, если

Принятие решений в условиях неопределенности и риска - student2.ru

Обозначим через Принятие решений в условиях неопределенности и риска - student2.ru множество осторожных стратегий Принятие решений в условиях неопределенности и риска - student2.ru -го игрока. Осторожное поведение практически реализуемо и совместимо с правилом исключения доминирующих стратегий. Именно, справедлив следующий результат.

Лемма 3. Пусть множества Принятие решений в условиях неопределенности и риска - student2.ru компактны, а функции Принятие решений в условиях неопределенности и риска - student2.ru непрерывны для всех Принятие решений в условиях неопределенности и риска - student2.ru . Тогда множество Принятие решений в условиях неопределенности и риска - student2.ru осторожных стратегий не пусто, компактно и пересекается с множеством недоминируемых стратегий:

Принятие решений в условиях неопределенности и риска - student2.ru

Используя осторожную стратегию, игрок Принятие решений в условиях неопределенности и риска - student2.ru гарантирует себе выигрыш Принятие решений в условиях неопределенности и риска - student2.ru , который называется гарантированным выигрышем. Если набор Принятие решений в условиях неопределенности и риска - student2.ru гарантированных выигрышей оптимален по Парето, то осторожные стратегии также могут быть названы оптимальными.

Определение 8. Игра в нормальной форме (1) несущественна, если нет исхода Принятие решений в условиях неопределенности и риска - student2.ru , для которого

Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru

Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru

В несущественной игре осторожные стратегии оптимальны в следующем смысле.

Теорема 1. Пусть игра Принятие решений в условиях неопределенности и риска - student2.ru несущественна, Принятие решений в условиях неопределенности и риска - student2.ru - осторожная стратегия игрока Принятие решений в условиях неопределенности и риска - student2.ru для всех Принятие решений в условиях неопределенности и риска - student2.ru . Тогда:

1. Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru для всех Принятие решений в условиях неопределенности и риска - student2.ru и Принятие решений в условиях неопределенности и риска - student2.ru ;

2. Принятие решений в условиях неопределенности и риска - student2.ru – оптимальный по Парето исход;

3. для любого подмножества Принятие решений в условиях неопределенности и риска - student2.ru и любого набора стратегий Принятие решений в условиях неопределенности и риска - student2.ru одновременное выполнение следующих двух условий невозможно:

Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru

Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru

Доказательство. Поскольку Принятие решений в условиях неопределенности и риска - student2.ru - осторожная стратегия Принятие решений в условиях неопределенности и риска - student2.ru -го игрока, то

Принятие решений в условиях неопределенности и риска - student2.ru

Поскольку игра несущественна, то Принятие решений в условиях неопределенности и риска - student2.ru для всех Принятие решений в условиях неопределенности и риска - student2.ru и утверждение 1 теоремы доказано.

Утверждение 2 следует из 3 при Принятие решений в условиях неопределенности и риска - student2.ru . Для доказательства утверждения 3 выберем Принятие решений в условиях неопределенности и риска - student2.ru и Принятие решений в условиях неопределенности и риска - student2.ru такие, что

Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru (9.2)

Применяя утверждение 1 к Принятие решений в условиях неопределенности и риска - student2.ru , получаем

Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru

Объединяя обе системы неравенств для всех Принятие решений в условиях неопределенности и риска - student2.ru и учитывая несущественность игры, получаем Принятие решений в условиях неопределенности и риска - student2.ru . Следовательно, строгое неравенство в (9.2) невозможно.

Согласно утверждению 1, если игрок Принятие решений в условиях неопределенности и риска - student2.ru использует оптимальную (т.е. осторожную) стратегию и ожидает, что остальные сделают то же самое, то он получит гарантированный выигрыш Принятие решений в условиях неопределенности и риска - student2.ru . Если некоторые игроки Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru откажутся от использования оптимальных стратегий, то это может быть только выгодно игроку Принятие решений в условиях неопределенности и риска - student2.ru .

Свойство 3 означает, что никакой отдельный игрок и никакая коалиция (подмножество) игроков не имеют причин для одностороннего отхода от оптимальных стратегий.

Заметим, что в игре, которая не является несущественной, никакой набор стратегий Принятие решений в условиях неопределенности и риска - student2.ru не может быть назван оптимальным. В самом деле, два требования оптимальности суть Принятие решений в условиях неопределенности и риска - student2.ru для всех и оптимальность исхода по Парето. По определению 8 эти условия вместе приводят к тому, что для некоторого Принятие решений в условиях неопределенности и риска - student2.ru

Принятие решений в условиях неопределенности и риска - student2.ru

Иначе говоря, игрок Принятие решений в условиях неопределенности и риска - student2.ru не может гарантировать себе выигрыш Принятие решений в условиях неопределенности и риска - student2.ru и может подвергнуться угрозам со стороны дополнительной коалиции Принятие решений в условиях неопределенности и риска - student2.ru .

Определение 9: Стратегия Принятие решений в условиях неопределенности и риска - student2.ru называется доминантной стратегией игрока i, если для любой обстановки Принятие решений в условиях неопределенности и риска - student2.ru и для любых Принятие решений в условиях неопределенности и риска - student2.ru справедливо неравенство Принятие решений в условиях неопределенности и риска - student2.ru

Это определение означает, что, если у игрока, независимо от действий противников, есть стратегия, дающая ему максимальный по сравнению с другими его стратегиями выигрыш, то эта стратегия называется доминантной.

Целесообразность использования каждым игроком своих доминантных стратегий очевидна.

Определение 10: Если для каждого игрока i существует доминантная стратегия Принятие решений в условиях неопределенности и риска - student2.ru ,то исход Принятие решений в условиях неопределенности и риска - student2.ru называется равновесием в доминантных стратегиях (РДС).

Равновесие в доминантных стратегиях существует далеко не для всех игр. Приведем несколько лемм, определяющих некоторые классы игр, в которых существует равновесие в доминантных стратегиях.

Принятие решений в условиях неопределенности и риска - student2.ru Лемма 2. Если в игре n лиц Принятие решений в условиях неопределенности и риска - student2.ru функции выигрыша непрерывны по совокупности стратегий и для каждого игрока частная производная Принятие решений в условиях неопределенности и риска - student2.ru существует и везде знакопостоянна, то существует РДС. При этом доминантной стратегия Принятие решений в условиях неопределенности и риска - student2.ru , i-гоигрока будет стратегия

Принятие решений в условиях неопределенности и риска - student2.ru = Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru

Идею леммы 2 можно обобщить на значительно более широкий класс игр.

Лемма 3. Если в игре п лиц Принятие решений в условиях неопределенности и риска - student2.ru а функция выигрыша произвольного игрока i сепарабельна по стратегии этого игрока, то есть Принятие решений в условиях неопределенности и риска - student2.ru имеет единственный максимум на множестве действий Принятие решений в условиях неопределенности и риска - student2.ru то существует РДС, причем для игрока i его доминантная стратегия:

Принятие решений в условиях неопределенности и риска - student2.ru

Для доказательства лемм 2 и 3 достаточно проверить определение РДС.

Равновесие Нэша. Гораздо чаще, чем РДС, существует равновесие Нэша (РН). Джон Нэш, американский математик, в начале 50-х годов XX века предложил следующее: устойчивым исходом взаимодействия агентов можно считать такой вектор их действий, от которого в одиночку никому из них не выгодно отклоняться. Это значит, что ни один из агентов, в одиночку меняя свою стратегию на другую, не может увеличить свой выигрыш при условии, что остальные своих стратегий не меняют.

Формальное определение равновесия Нэша Принятие решений в условиях неопределенности и риска - student2.ru таково:

(5) Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru Принятие решений в условиях неопределенности и риска - student2.ru ,

то есть для любого агента и для любого допустимого его действия выбор им равновесного по Нэшу действия дает ему выигрыш не меньший, чем при выборе любого другого действия при условии, что остальные игроки играют равновесные по Нэшу стратегии.

Отличие между изложенными подходами (РДС и равновесием Нэша) заключается в том, что в формулировке равновесия в доминантных стратегиях (3) фигурирует произвольная обстановка, то есть доминантная стратегия – наилучшая при любой обстановке. А стратегия по Нэшу – наилучшая при «нэшевской» обстановке (см. (5)).

Равновесие Нэша хорошо тем, что в большинстве моделей оно существует. Одним из его недостатков является то, что оно не всегда единственно. Ведь если есть два равновесия, то как предсказать, в каком из них окажутся агенты. Нужны дополнительные предположения.

Кроме того, равновесие по Нэшу не устойчиво к отклонению двух и более игроков. По определению одному агенту не выгодно отклоняться, но это не значит, что если два агента договорились и одновременно отклонились от равновесной ситуации, то они не смогут оба выиграть. То есть равновесие Нэша – существенно некооперативная концепция равновесия.

Принятие решений в условиях неопределенности и риска.

(Игры с природой. Теория статистических решений.)

Рассмотрим ситуацию принятия решений в условиях неопределенности внешней среды (состояние экономики, политики, природы). (Далее внешнюю среду будем называть природой.) Нет оснований считать, что природа расположена или нерасположена к нам, она нейтральна. Поэтому в этих случаях пользоваться результатами теории антагонистических игр было бы неразумно (крайне пессимистично). В то же время многое из теории игр оказывается полезным при анализе принципов оптимальности и в этом случае.

Итак, ситуацию принятия решений в условиях неопределенности внешней среды назовем «игрой с природой». Игрок А – человек (лицо, принимающее решения - ЛПР), игрок П – природа. Решение ЛПР – стратегия. Поведение природы описывается одним из ее состояний.

Возможны следующие принципы оптимальности

1) Доминирующие стратегии

2) Удаление доминируемых стратегий.

3) Осторожные стратегии (МГР).

4) Принцип благоприятствования стратегий.

Рассмотрим конечную игру с природой. Пусть задана A - матрица выигрыша. H (Ai, Пj) = aij

  П1 Пn
A1      
  aij  
Am      

Определение. Показателем благоприятствования состояния природы (игрока) Пj к выигрышу игрока А называется βj = max aij .Риском i-той стратегии игрока А в состоянии Пj называется

Величина rij = βj - aij.

Таким образом, по матрице выигрышей можно построить матрицу рисков:

А→Ra=║rij║, например:

Принятие решений в условиях неопределенности и риска - student2.ruПринятие решений в условиях неопределенности и риска - student2.ru

Как привести неопределенность задачи принятия решений к определенности?

1) Задать вероятности состояний природы.

2) Задать относительные вероятности состояний природы.

3) Получить экспертнуюя информацию о вероятностях.

4) В условиях неизвестных вероятностей состояния природы (неопределенность) субъективным путем устранить неопределенность.

Наши рекомендации