Проблема выбора решения и принципы оптимальности.

ТЕОРИЯ ПРИНЯТИЯ РЕШЕНИЙ

Курс лекций.

ВВЕДЕНИЕ

Искусство принятия наилучших решений, основанное на опыте и интуиции, является сущностью любой сферы человеческой деятельности. Наука о выборе приемлемого варианта решения сложилась сравнительно недавно, а математической теории принятия решений - около 50 лет.

Основы теории принятия решений разработаны Джоном фон Нейманом и Отто Моргенштерном. По мере усложнения задач появилось много различных направлений этой науки, которые имеют дело с одной и той же проблемой анализа возможных способов действия с целью нахождения оптимального в данных условиях решения проблемы.

Как самостоятельная дисциплина общая теория принятия решений (ТПР) сформировалась в начале 60-х годов, тогда же была сформулирована основная цель этой теории - рационализировать процесс принятия решений. В последующие годы была создана и прикладная теория статистических решений, позволяющая анализировать и решать широкий класс управленческих задач, связанных с ограниченным риском - проблемы выбора, размещения, распределения и т.п.

В настоящее время теория принятия решений применяется преимущественно для анализа тех деловых проблем, которые можно легко и одназначно формализовать, а результаты исследования адекватно интерпретировать. Так, например, методы ТПР используют в самых различных областях управления - при проектировании сложных технических и организационных систем, планировании развития городов, выборе программ развития экономики и энергетики регионов, организации новых экономических зон и т.п.

Необходимость использования подходов и методов ТПР в управлении очевидна: быстрое развитие и усложнение экономических связей, выявление зависимости между отдельными сложными процессами и явлениями, которые раньше казались не связанными друг с другом, приводят к резкому возрастанию трудностей принятия обоснованных решений. Затраты на их осуществление непрерывно увеличиваются, последствия ошибок становятся все серьезнее, а обращение к професиональному опыту и интуиции не всегда приводит к выбору наилучшей стратегии. Использование методов ТПР позволяет решить эту проблему, причем быстро и с достаточной степенью точности.

В курсе “Теория принятия решений" особое внимание сосредоточено на способах решения конкретных практических задач. Минуя сложную математику, которая лежит в основе методов принятия решений, слушатели знакомятся со всеми основными достижениями в прикладной ТПР - от возможных способов моделирования до принципов оптимальности выбранного решения.

В результате изучения дисциплины студент ориентируется в классах задач ТПР, может грамотно сформулировать задачу в терминах ТПР и адекватно ее формализовать, обоснованно выбрать методы для решения поставленной задачи, сформулировав принципы оптимальности для выбора окончательного решения, и правильно интерпретировать полученные результаты решения задачи.

В задаче ТПР человек (или группа лиц) сталкивается с необходимостью выбора одного или нескольких альтернативных вариантов решений (действий, планов поведения). Необходимость такого выбора вызвана какой-либо проблемной ситуацией, в которой имеются два состояния: желаемое и действительное, а способов достидения желаемой цели-состояния - не менее двух. Таким образом, у человека в такой ситуации есть некоторая свобода выбора между несколькими альтернативными вариантами. Каждый вариант выбора (выбор альтернативы) приводит к результату, который называется исходом. У человека есть свои представления о достоинствах и недостатках отдельных исходов, свое собственное отношение к ним, а следовательно, и к вариантам решения. Таким образом, у человека, принимающего решение, есть система предпочтений.

Под принятием решений понимается выбор наиболее предпочтительного решения из множества допустимых альтернатив.

В общем случае процесс принятия решений включает в себя два этапа: подготовительный и деловой. На первом этапе формализуется и решается задача, а на втором результат предьявляется ЛПРу - Лицу Принимающему Решение, который одобряет его или отвергает. Таким образом процесс принятия решений может быть циклическим, поэтому важно, чтобы сам ЛПР владел методом и мог сам поставить задачу, либо аналитик, который работает с задачей, был "в команде" и понимал суть решаемой проблемы.

Обычно активные субьекты, которые участвуют в процессе - ЛПР и его контрагенты, имеют различные интересы и стремяться воздействовать на ППР - Процесс Принятия Решений в своих целях. Это может выражаться в сокрытии истинного мнения и намерений при принятии решения, искажении информации и т.п. Такое поведение участников может привести к решению, далекому от оптимального или справедливого.

Участники ППР должны в общем случае обладать: памятью (способностью накапливать информацию), способностью к прогнозу (могут использовать информацию для предвидения результатов решения), индивидуальными предпочтениями (различные результаты оценивают поразному), могут быть благожелательны (из двух равных для себя решений субьект может выбрать тот, который устроит противника).

Основополагающий принцип ТПР, сформулировали Нейман и Моргенштерн: лицо, принимающее решение, должно всегда выбирать альтернативу с максимально ожидаемой полезностью. Этот результат строится на ряде аксиом, его называют гипотезой ожидаемой полезности. Поэтому и задачи формулируются соответственным образом: чем полезнее, предпочтительнее альтернатива - тем выше численная оценка - “чем больше, тем лучше”.

В общем случае задача ТПР строится следующим образом: установливаются

1. Все возможные способы действия - альтернативы

2. Их последовательность и числовая оценка

3. Цели участников процесса принятия решений

4. Природа влияния на этот процесс различных случайных и детерминированных управляющих факторов.

Затем подбирается соответствующая модель и метод решения задачи. На сегодняшний день теория достигла состояния, когда разработаны модели для описания практически всех задач принятия решений. В рамках современной ТПР разработаны модели для описания практически всех типов задач принятия решений, каждому из которых отвечают определенные аналитические методы. Существует довольно много классификаций задач теории принятия решений: с учетом времени: статические и динамические, по количестве целей исследования: одна или несколько, по количеству критериев: один или несколько, по структуре участников: с одним участником,двумя, конечным числом и бесконечным, по характеру исходных данных: детерминированные и стохастические и т.д. Каждому классу задач соответствуют методы ТПР: линейное и нелинейное программирование, критериальный анализ, теория игр и вариационных рядов. Все эти классификации верны, но охватывают неравноценные области проблем, многие из дисциплин перекрывают друг друга по постановке задач и методам решения.

В нашем курсе мы воспользуемся классификацией по моделям:

МОДЕЛИ ПРИНЯТИЯ РЕШЕНИЙ  
ДЕТЕРМИНИСТИЧЕСКИЕ СТОХАСТИЧЕСКИЕ
критериальный анализ теория игр
линейное и нелинейное статистические стратегические
программирование   нестратегические
       

определенность <-----------------------------------------> неопределенность

методы

Структура курса определена классификацией моделей по целям исследования и характеру исходных данных: детерминированные, стохастические и статистические, которым соответствуют методы критериального анализа и теории игр - стратегические, нестратегические и статистичекие игры.

Постановка задачи. Основные понятия.

При постановке задачи критериального анализа предполагается, что у ЛПР есть несколько вариантов выбора, несколько альтернатив u U, где U - множество всевозможных альтернатив, включающее не меннее двух элементов. В зависимости от характера задачи множество U может быть как непрерывным, так и дискретным. Если решается задача стратегического плана, то под u обычно понимается стратегия, то есть набор правил, определяющих состав и порядок действий в любой из возможных ситуаций, а множество U - в этом случае дискретно и конечно.

При решении задач тактического плана, например, выбора варианта какого-либо проекта, распределения средств между обьектами, определения состава различных видов городского транспорта множество U может быть как непрерывным, так и дискретным.

В нашем курсе будем полагать, что U дискретно и счетно, а u - эмпирический обьект, задаваемый "своим именем" ( например, названия банков ).

Выбор из множества альтернатив происходит на основании заранее заданной системы или функции предпочтений Р(р). В критериальном анализе предпочтения р задаются в виде некоторого набора характеристик, которые обозначаются k и называются критериями.

В общем виде: k - функция от альтернативы u: k(u)

U = ( u1 ,u2 ,...un ), n - число альтернатив

K(u) = ( k1 (u), k2(u),...km(u)), где m - число частных критериев ki(u)

1.Если m = 1 - однокритериальная задача, то есть задача линейного программирования.

2.Если m > 1, но k(u) P k(v) - тривиальный вариант, так как u всегда лучше v.

3.Если по одним критериям вариант u предпочтительнее варианта v, а по другим - наоборот, то это задача критериального анализа, способы решения которой будут расмотрены в этом курсе.

Введем обозначения: K (u) P K (v) - вариант u предпочтительнее, K (u) I K (v) - одинаковы по предпочтени,K(u) N K(v) - несравнимы.

ТЕОРИЯ ИГР.

Антагонистические игры

Игра Г = < X,Y,H>, где X,Y - непустые множества стратегий соответственно первого и второго игроков, H - функция выигрыша Н1 = -Н2 называется антагонистической.

В процессе игры каждый игрок выбирает свою стратегию, в результате чего образуется ситуация (x,y), которой соответствует выигрыш Н(x,y) для первого игрока и - Н(x,y) для второго.

В множестве всех возможных антагонистических игр выделяются классы аффинно-эквивалентных игр.

Две антагонистические игры Г = < X,Y,H> и Г’ = < X’,Y’,H’>, называются аффинно-эквивалентными, если X = X’, Y = Y’ и H’ = k H + a, где а - вещественное, а k > 0. В этом случае используется обозначение Г ~ Г’.

Антагонистические игры, в которых каждый игрок имеет конечное множество стратегий, называются матричными играми. Для задания такой игры достаточно выписать так называемую платежную матрицу, в которой строки соответствуют стратегиям первого игрока, а столбцы - стратегиям второго игрока. Элементами матрицы служат выигрыши первого игрока.

Седловыке точки и минимаксы

Устойчивое решение игры может быть получено путем следующих рассуждений:

В самом неблагоприятном случае выигрыш первого игрока не может быть уменьшен по вине противника, если он удовлетворяет условию:

a ij* = min аij

С другой стороны, руководствуясь принципом выгоднгодности первый игрок будет стремиться увеличить свой выигрыш, сохраняя свойство устойчивости, поэтому vн = max min аij

Это нижняя цена игры. Рассуждая подобным образом за второго игрока получим верхнюю цену игры:

vв = min max аij

Интуитивно ясно, что значение ( цена ) игры лежит между vн и vв.

Теорема. Для того, чтобы в матричной игре существовали минимаксы, необходимо и достаточно, чтобы равны были минимаксы:

max min аij= min max аij

Глава . Биматричные игры

[VU1]

Функция выигрыша биматричной игры представляет собой две платежные матрицы : А - определяет выигрыш первого игрока, а В - выигрыш второго игрока. Первый игрок имеет m чистых стратегий ( m строк в матрицах А и В ) Второй игрок имеет n чистых стратегий ( n столбцов в матрицах А и В ).

В результате выбора первым игроком i-той стратегии, а вторым игроком j-той стратегии, первый игрок получает выигрыш aij, а второй - bij .

Решение биматричных игр сводится к отысканию ситуаций равновесия и равновесных (оптимальных) стратегий игроков.

В биматричной игре ситуация i*j называется приемлемой для первого игрока, если его выигрыш в этой ситуации не меньше, чем в любой другой:

аi*j ³ аij j=1:n

Для второго игрока ситуация ij* приемлема, если его выигрыш в этой ситуации не меньше, чем в любой другой:

bi*j ³ bij i=1:m

Tаким образом, приемлемые ситуации для первого игрока - это максимальные элементы встолбцах матрицы А, а для второго игрока - максимальные (тоже!) элементы в строках матрицы В.

Ситуация i*j* в биматричной игре называется равновесной, если она приемлема для обоих игроков, то есть если любое отклонение от нее как для первого игрока, так и для второго только лишь уменьшает их выигрыш:

аi*j* ³ аij*

bi*j* ³ bi*j

Множество ситуаций равновесия G образуется как пересечение множеств приемлемых ситуаций первого и второго игроков.

Пример.

     
А:   В:
     

G1={(1,1),(1,3),(3,2),(3,3)}

G2={(1,1),(2,1),(2,3),(3,2)} G = {(1,1),(3,2)}

I v(1,1)= 3 II v(1,1)= 3

v(3,2)= 3 v(3,2)= 2

Таким образом, если в биматричной игре несколько равновесных ситуаций, то по выгодности они не равнозначны, в отличие от матричных игр.

Из примера хорошо видно, что хотя (1,1) и (3,2) - ситуации равновесия, ситуации (1,2) и (3,1) таковыми не являются, в отличие от матричных игр.

Принципиальным отличием биматричных игр от матричных является отсутствие в них антагонизма.В матричных играх переговоры между игроками были бессмысленны, так как их интересы были прямо противоположны, в биматритчных играх договоры между участниками имеют реальное основание.

Так, в рассматриваемом примере второй игрок заинтересован в том, чтобы первый выбрал i=1, так как при этом v(II)= 3. Первому же игроку с точки зрения выгоды безразлично какую стратегию выбрать - первую или третью - в любом случае его выигрыш составляет 3. Если первый игрок доброжелательно настроен по отношению к противнику, то он выберет первую стратегию, чтобы и второй игрок получил максимальный выигрыш. В противном случае первый потребует за выбор более выгодной для второго стратегии дополнительную плату, и если эта плата будет меньше единицы, то очевидно, что второй игрок согласится на эту сделку.Такая игра называется игрой с побочными платежами.

Если в биматричной игре ситуаций равновесия нет, но игроки имеют возможность договориться между собой, то обычно применяют такой искусственный прием: находится i*j* такая,что:

max ( aij + bij ) = ( ai*j* + bi*j* )

и делится между игроками по заранее оговоренному правилу.

Пример.

     
А:   В:
     

Ситуаций равновесия нет. Находим максимальный элемент в матрице А+В

 
А+В:
 

max = 5, ( i, j ) = (3,2). Эта сумма должна быть разделена между первым и вторым игроками.

В случае, если договор между игроками невозможен, игра станет неустойчивой и игрокам будет выгодно скрывать свои стратегии. Решение такой игры будет в смешанных, вероятностных стратегиях.

Понятие смешанных стратегий в биматричных играх такое же, как и в матричных играх, то есть это полный набор вероятностей применения их чистых стратегий. Выигрыш игроков тоже находится как математическое ожидание.

Задание по биматричным играм

Придумать условие биматричной игры n*m, n = m > 3 и найти ее решения в чистых стратегиях ("игра с побочными платежами")

Аффинно-эквивалентные игры.

Существенные и несущественные игры тоже делятся на классы.

Кооперативная игра с множеством игроков I и характеристической функцией vназываетсяаффинно-эквивалентнойигре с тем же множеством игроков и характеристической функцией v’, если найдутся такое положительное число k и произвольные вещественные ci ( i Î I ), что для любой коалиции KÌ L имеет место равенство:

v’(K) = k v(K) + å ci , iÎK.

При афинной эквивалентности v ~ v’ дележ x соответствует дележу х’ так, что: xi ’ = k xi + ci.

Иногда вместо аффинной эквивалентности самих кооперативных игр удобно говорить об аффинной эквивалентности их характеристических функций.

Введенное понятие эквивалентности кооперативных игр сходно с понятием стратегической эквивалентности бескоалиционных игр, но и имеет существенные отличия. Во-первых, в кооперативных играх не оговариваются стратегии для эквивалентных игр. Во-вторых, если в бескоалиционных играх в качестве функции выигрыша рассматривались платежи, то в кооперативных играх задаются характеристические функции, то есть максимально гарантированные выигрыши коалиции.

Выделенные пары аффинно-эквивалентных игр на всем множестве кооперативных игр образуют бинарные отношения, которые обладают свойствами рефлексивности, симметричности и транзитивности, что позволяет судить о них как о классах эквивалентности. Следовательно, для изучения свойств какой-либо кооперативной игры достаточно рассмотреть одну, наиболее простую из соответствующего класса.

Рассмотрим с позиций стратегической эквивалентности несущественные игры.

Нулевойназывается характеристическая функция, тождественно равная нулю. Кооперативная игра с множеством игроков I называется нулевой, если все значения ее характеристической функции равны нулю.

Теорема. Всякая существенная игра аффинно эквивалентна нулевой игре.

Следствие. Все несущественные игры с одним и тем же множеством игроков аффинно эквивалентны друг другу.

Таким образом, свойства любой несущественной игры можно изучать по эквивалентной ей нулевой игре. В нулевой игре все игроки безразличны к ее исходам, это случай полной незаинтересованности.

Для изучения существенных игр наиболее удобна a-b редуцированная форма, то есть такая, в которой v(i) = a, v(I) = b. Обычно используются варианты a=0, b=1 и a=1, b=0.

Теорема. Всякая существенная игра аффинно эквивалентна одно и только одной игре в 0-1 редуцированной форме.

То есть любую существенную кооперативную игру можно свести к редуцированной форме и в этом виде производить ее исследование и изучение. От существенной кооперативной игры к ее редуцированной форме можно перейти следующим образом. Для произвольной коалиции К:

v’(K) = ( v(K) - å iÎK v(i))/ ( v(I) - å iÎI v(i)) (3.1.)

Нетрудно видеть, что 0-1 редуцированная форма существенной кооперативной игры позволяет по характеристической функции сразу же судить об эффективности обьединения в коалицию (см.знаменатель), то есть в чистом виде рассматривать свойство супераддитивности.

Все дележи в 0-1 редуцированной форме должны отвечать условиям: xi ³0, так как v(i) = 0, но есть еще D, так как игра существенная å xi = v(I) = 1.

Пример. Дана кооперативная игра, I = {1,2,3,4}. Задана характеристическая функция: v(1) = -1; v(2) = v(3) = -2; v(1,2,4) = v(1,3,4) = 2; v(2,3,4) =1;

v(4)= v(1,2)= v(1,3) = v(1,4) = v(2,3)= v(2,4) = v(3,4) = v(1,2,3) = v(1,2,3,4) = 0;

Найти характеристическую функцию 0-1 редуцированной формы.

Воспользуемся формулой 3.1. В знаменателе выражения стоит постоянная величина v(I) - å iÎI v(i) = 0 - (-1-2-2) = 5. Остальные вычисления занесем в таблицу:

К
v’ 0,6 0,6 0,2 0,8 0,4 0,4

Доминирование дележей.

Рассмотрим кооперативную игру Г = < I, v > и два дележа в этой игре: х = ( х1, х2, ... хn) и y = ( y1, y2, ... yn). Допустим, K Ì I - некоторая коалиция в игре.

Дележ х доминирует дележ у по коалиции К, если выполняются неравенства å iÎK хi £ v(К) и хi > yi , iÎ К. Доминирование дележа по коалиции К обозначается хñК у, х dom К y, или x Rк y.

Первое неравенство определения утверждает, что коалиция К способна обеспечить такой дележ, так как сумма выигрышей, получаемых членами коалиции не превышает ее максимального гарантированного выигрыша V(K). Второе означает, что каждый член коалиции К получает по дележу х больше, чем по дележу у ( именно в этом смысл доминирования). Иногда, определяя отношение доминирования, не указывают конкретно коалицию, а просто говорят, что дележ х доминирует дележ у (хñ у). Однако, при этом подразумевается, что существует коалиция К, по которой это доминирование имеет место, то есть справедливо хñК у.

Для коалиции К доминирующий дележ полезнее, чем доминируемый. Эта коалиция будет его отстаивать. Иной случай, когда с этим дележом не согласятся остальные игроки (входящие в множество I\K). Но коалиция К может сама обеспечить себе такой дележ, так как å iÎK хi £ v(К).

Следует отметить, что доминирование возможно по любой коалиции, кроме коалиции из одного игрока и из всех игроков. В первом случае К = {i} из определения следует, что хi £ v(i), что противоречит свойству индивидуальной рациональности дележа х ( х ³ v(i)).

В случае К = I из хi > yi следует , что åхi > åyi = v(I), то есть дележ х должен давать в сумме больше, чем гарантированный выигрыш для всех игроков.

Важно, что отношение доминирования дележей выполняется для аффинно эквивалентных кооперативных игр, то есть доминирование инвариантно относительно аффинной эквивалентности.

Теорема. Если v и v’ - аффинно-эквивалентные характеристические функции, причем дележам х и у в v соответствуют дележи x’ и y’ в v’, то из х ñК у следует х’ ñК у’.

Отношение доминирования выполняется для всех кооперативных аффинно эквивалентных игр и является свойством не одной игры, а всего класса эквивалентных игр. Поскольку, например, в несущественной игре всего один дележ, то для них понятие доминирования не имеет смысла. Существенные игры исследовать на доминирование можно используя 0-1 редуцированную форму.

Так как в кооперативной игре в качестве меры полезности выступает не выигрыш, а дележ, поэтому сравнение кооперативных игр сводится к сравнению векторов дележей. Множество дележей дает набор возможных решений, так как дележи отвечают условиям индивидуальной и коллективной рациональности. Но дележей много и они разные. Какой из них предпочесть? Это задача векторной оптимизации, а принцип оптимизации может быть самым разнообразным.

В достаточно общей модели принятия решения трудно сказать принимающему решение, какую альтернативу он должен выбрать или какая его стратегия является оптимальной. Главным в такой модели является прогноз действий партнеров, так как если он имеется, то остальное - сравнительно простая задача максимизации выгоды участника в условиях риска. Поэтому оптимальность в теории игр и понимается как ожидаемое, возможное. Оптимальными исходами называются исходы, возможные в условиях допустимых действий игроков и коалиций, совершаемых согласно их интересам.

Например,в игровой модели Шепли-Шубик, 1969 года (кооперация производства с обменом продуктами) или просто модели обменов, вопрос о том, как кооперировать, может быть заменен вопросом: какое понятие оптимальности следует применять для дележа прибыли?

Ответить на этот вопрос по заданной характеристической функции невозможно, поскольку ответ существенно зависит от дополнительных свойств модели. Например, правила дележа будут различными в зависимости от того, является ли правило обьектом переговоров между участниками кооперации или оно издается правительством в качестве закона и поэтому должно соблюдаться в принудительном порядке. В каждом из этих двух случаев существенными могут оказаться и другие условия. Может потребоваться такое правило, при котором партнеры по кооперации будут незаинтересованы скрывать друг от друга свои ресурсы ( делать их дефицитными для модели) или отказываться от запланированных поставок. Иногда приходится не забывать об элементарном требовании, чтобы никто не получал доли прибыли без соответствующего вклада в общий выпуск, и т.д.

В общем, принцип оптимальности с точки зрения приложений есть такое правило, какое нужно для решения рассматриваемой проблемы.

Рассмотрим в качестве принципов оптимизации устойчивость коалиционной структуры и принцип справедливости.

Эксцессомдележа х для коалиции К в условиях характеристической функции v называется разность

ev(x,K) = v(K) - å iÎK хi , колторая показывает, насколько может коалиция К увеличить свой выигрыш по сравнению с суммой, предлагаемой по дележу. Если эксцесс положителен, то соответственный дележ реализуем для данной коалиции, в этом случае дележ называется эффективным.

Если дележ не эффективен, то это значит, что сумма платежей превышает выигрыш коалиции. Коалиция увеличить его не может, поэтому неэффективный дележ оптимален по принципу устойчивости.

Дележ называется абсолютно неэффективным, если он не эффективен ни для какой коалиции.

Для игры с постоянной суммой эксцесс положителен и всегда эффективен.

Пример. Рассмотрим существенную игру трех лиц с постоянной суммой. С позиций доминирования в этой игре можно рассматривать только коалиции {1,2}, {1,3}, {2,3}. Пусть х = ( х1, х2, ... хn) и y = ( y1, y2, ... yn) - дележи и х dom 1,2 y . Из определения доминирования следует, что должно выполняться

х1+ х2 = 1 - х3 £ v(1,2) и х1 > у1 , х2> у2 .

Поскольку по свойству дополнительности для 0-1 редуцированной формы v(1,2) = v (1,2,3) - v(3) = 1 - 0 = 1, то неравенство x1 + x2 = 1 - x3 £ 1 всегда выполняется. Вторая группа неравенств из определения доминирования дележей и х1 > у1 , х2> у2 и условие ее выполнения лучше всего иллюстрируются графически.

Так как рассматривается 0-1 редуцированная форма, то

х1+ х2+ х3 = y1+ y2+ y3 = 1 и любой дележ в такой задаче можно представить как точку симплекса, задаваемую барицентрическими координатами.

Симплекс - простейший выпуклый многогранник данного числа измерений n. При n = 3 cимплекс - произвольный, в том числе неправильный тетраэдр. При n = 2 симплекс - произвольный треугольник, при n = 1 - отрезок, при n = 0 - одна точка, таким образом, n-мерный симплекс имеет n+1 вершину.

Если в пространстве Rm дана система декартовых координат х1, х2, ... хm в которой вершина еi ( i=0: n) имеет координаты х1(i), х2(i), ... хm(i), то симплекс с вершинами е0, е1, е2,...еn состоит из всех точек пространства, координаты которых имеют вид:

хk = a0хk (0) + a1хk (1) + ...+ anхk(n), k = 1: m, a ³ 0 - произвольные, å ai= 1.

Барицентрические координаты точки М на плоскости по отношению к трем базисным (не лежащим на одной плоскости) точкам А1, А2, А3 этой плоскости - такие три числа m1, m2, m3 (å mi= 1), что точка М представляет собой центр тяжести системы из трех материальных точек с массами m1, m2, m3 , расположенными в точках А1, А2, А3 ( или вершинах симплекса).

В нашем примере роль масс играют полезности, которые получают игроки по рассматриваемым дележам. Если х1 > у1, то точка х должна быть расположена ближе к вершине 1, чем точка у. Все точки, соответствующие стороне симплекса 32 имеют нулевую барицентрическую координату х1, а все точки линии, параллельной ребру 32 - одинаковую барицентричекую координату х1 . Поэтому “расстоянием” между любой точкой симплекса и какой-либо его вершиной является длина перпендикуляра, опущенного из этой вершины на прямую, проходящую через рассматриваемую точку параллельно стороне, противоположной вершине.

Для определения всех точек симплекса, соответствующих дележам, доминируемым дележом х по коалиции {1,2}, необходимо провести через х прямые, параллельные сторонам симплекса 2,3 и 1,3. Заштрихованная область и дает множество доминируемых дележей. Пунктир означает, что внутренние границы области в нее не входят. Точно так же можно построить все области доминирования дележом х по коалициям {1,2}, {2,3} и {1,3}. Незаштрихованные области - соответствуют дележам у1, доминирующим дележ х1.

Для того, чтобы дележи не доминировали друг друга, соответствующие им точки должны лежать на прямой, параллельной одной из сторон треугольника (ab, cd и ef на рисунке для дележа х).

Для игры с непостоянной суммой могут иметь место и неэфективные дележи, поэтому неравенство хi + xj £ v(i,j) , хi+ хj+ хl = 1, может быть нарушено. Так как это равносильно 1- хl £ v(i,j) , то условия доминирования принимают вид:

хi > уi , хj > уj , хl ³ 1 - v(i,j).

С - ядро (core).

Наличие доминирующих и доминируемых дележей в кооперативной игре приводит к появлению коалиций, заинтересованных в тех или иных дележах. Следовательно, если найдется дележ, не доминируемый никаким другим дележом, то он, скорее всего, не вызовет возражений у игроков и не приведет к образованию коалиций с "собственными интересами".

Множество дележей в кооперативной игре, каждый из которых не доминируется какими - либо другими дележами, называется С-ядром этой игры.

Теорема. Для того, чтобы дележ х принадлежал С-ядру кооперативной игры с характеристической функцией v , необходимо и достаточно, чтобы для любой коалиции К выполнялось неравенство :

å iÎK хi ³ v(K), ( т.е. все дележи в С-ядре абсолютно неэффективны ).

Таким образом, не доминируются те дележи, в которых для любой коалиции сумма платежей больше, чем эта коалиция может гарантированно выиграть. Это означает, что любая коалиция должна согласиться на такой дележ, так как при этом игроки получают больше, чем могут выиграть самостоятельно (получить такой выигрыш "в одиночку" члены коалиции не могут).

Принадлежность дележа х к С-ядру означает только то, что дележ х не доминируется другими дележами, но это не значит, что он доминирует другие дележи. Из определения доминирования и теоремы следует, что дележ х , принадлежащий С-ядру, сам не может доминировать другие дележи ни по какой коалиции. Таким образом, множество дележей, образующий С-ядро, свойством внешней устойчивости не обладает.

Теорема. Во всякой существенной игре с постоянной суммой С-ядро пусто.

Качественно это можно обьяснить так: если дележ входит в С-ядро, то любая коалиция должна получить больше, чем она может выиграть самостоятельно. Но поскольку сумма выигышей постоянна, это можно сделать только за счет других коалиций, откуда обязательно возникнет отношение доминирования дележей (уже по другим причинам). Таким образом, любое ограничение доходов приведет к пустому С-ядру.

Пример. Рассмотрим общую кооперативную игру трех лиц в 0-1 редуцированной форме. Имеем: v(Æ ) = v(1) = v(2) = v (3) = 0; v (1,2,3) = 1; v(1,2) = C3; v (2,3) = C1; V (1,3) = C2; 0 £ Ci £ 1, i = 1:3.

Из определения свойств дележей, принадлежащих С-ядру, имеем:

x1 + x2 ³ C3 ; x1 + x2 ³ C3; x1 + x2 ³ C3; а поскольку для любого дележа справедливо правило групповой рациональности, x1 + x2 + x3 = 1, то условие принадлежности дележа к С-ядру имеет окончательный вид в форме:

1 - x3 ³ C3 ; 1 - x2 ³ C2; 1 - x1 ³ C1; или x3 £ 1- C3 ; x2 £ 1- C2 ; x1 £ 1- C1.

Сложим почленно все неравенства: x1 + x2 + x3 £ 3 - (C1 + C2 + C3). Имеем: C1 + C2 + C3 £ 2. Это условие является необходимым для существования непустого С-ядра.

Вектор Шепли.

До сих пор были рассмотрены решения игр, отвечающие принципам оптимальности в смысле выгодности и устойчивости ( maxmin в чистых или смешанных стратегиях ) или только устойчивости ( C-ядро и Н-М решение в кооперативных играх ). Рассмотрим решения, оптимальные в смысле справедливости.

Задача состоит в том, чтобы найти вектор распределения общего выигрыша между участниками игры: Ф(v) = ( Ф1(v), Ф2(v),... Фn(v))

При этом необходимо, чтобы Ф(v) был дележом в условиях кооперативной игры, то есть отвечал бы требованиям игдивидуальной и групповой рациональности.

Предлагаемое решение носит аксиоматический характер, то есть выводится формальным образом из некоторой полной и непротиворечивой системы аксиом. Эта система включает в себя: аксиому эффективности, аксиому симметрии и аксиому агрегации.

Аксиома эффективности: распределение выигрыша носителя игры ( N ) происходит только между игроками, входящими в носитель. Иными словами, все приращение выигрыша, достигаемое только за счет обьединения в коалицию (эффект супераддитивности), распределяется только между теми, кто его обеспечил. С другой стороны, все болваны получают только то, что они выиграли бы в одиночку или в составе коалиции.

Формально эти условия выражаеюся в том, что å Фi(v) = v (N), iÎN, и Фj(v) = v(j), jÎ I\N.

Аксиома симметрии: игроки, входящие в игру симметрично, должны получать одинаковый доход. Здесь симметричность понимается как одинаковое влияние на характеристическую функцию. Это утверждение равносильно тому, что доход игрока не зависит от его номера или "имени".

Формально Фj(v) = Фpj(v), где p - целое положительное число.

Аксиома агрегации: если игрок принимает участие в двух играх с характеристическими функциями v’ и v”, то причитающаяся ему доля:

Ф(v’ + v”) = Ф(v’) + Ф(v”), если множества игроков в обоих играх совпадают.

Совокупность аксиом является непротиворечивой и полной: для всякой характеристической функции v вектор Ф(v) существует и является единственным (вектор Шепли). Непротиворечивость обеспечивает существование, а полнота его единственность.

Теорема. Для любой характеристической функции v над I={1,2,...n} компоненты вектора Шепли определяются по формуле

Проблема выбора решения и принципы оптимальности. - student2.ru

Пример. Для кооперативной игры трех лиц в 0-1 редуцированной форме эта формула имеет вид: Фi(v) = 1/6 (2 - 2Ci + Cj + Cf).

Следовательно, координаты вектора Шепли:

Ф1(v) = 1/6 (2 - 2C1 + C2 + C3), где C1 = v(2,3);

Ф2(v) = 1/6 (2 - 2C2 + C1 + C3), где C2 = v(1,3);

Ф3(v) = 1/6 (2 - 2C3 + C1 + C2), где C3 = v(1,2).

Для того, чтобы вектор Шеп

Наши рекомендации