Модель принятия оптимальных решений.

2.1. Базовая модель рационального поведения.В настоящем разделе описываются два «варианта» модели рационального поведения субъекта, осуществляющего выбор. В первой модели предпочтения моделируются функцией полезности, и рациональность поведения заключается в стремлении выбора альтернатив, максимизирующих полезность. Во второй модели предпочтения моделируются бинарным отношением предпочтения, и рациональность поведения заключается в стремлении выбора недоминируемых с точки зрения этого отношения предпочтения альтернатив.

2.1.1. Функции полезности.Как описывается поведение человека? В экономике с середины XIX века существует концепция максимизации полезности, т.е. концепция экономического человека (homo economicus), который ведет себя таким образом, чтобы максимизировать свою полезность. Несмотря на всю априорную ограниченность этой теории (потому что не всегда понятно, что такое полезность, почему человек стремиться ее максимизировать), концепция оказалась плодотворной.

Пусть имеется один субъект (агент), который может выбирать действия из какого-то множества. Предположим, что предпочтения этого субъекта описывается функцией полезности Модель принятия оптимальных решений. - student2.ru (или целевой функцией, функцией предпочтения – будем использовать в настоящем разделе эти термины как синонимы), которая отображает множество его допустимых действий (альтернатив) A на числовую ось Â1. Значения этой функции позволяют сравнивать разные альтернативы (действия). Если есть два варианта – два элемента из множества допустимых действий, то лучшим будет тот, который приводит к большему значению функции. Предположим, что агент будет максимизировать свою полезность и производить выбор из множества выбора, которое представляет собой множество максимумов его целевой функции:

(1) Модель принятия оптимальных решений. - student2.ru .

Значит, множество выбора агента зависит от его предпочтений f(×) и от того множества A, из которого он производит выбор.

Множество выбора зависит от двух составляющих: от функции и от допустимого множества. Предположение, что агент производит выбор из множества выбора (то есть, стремится максимизировать свою целевую функцию) называется гипотезой рационального поведения, которая заключается в том, что агент выбирает с учетом всей имеющейся у него информации наилучшую с его точки зрения допустимую альтернативу, т.е. одну из альтернатив y*, на которых достигается максимум его целевой функции:

(2) y* = arg Модель принятия оптимальных решений. - student2.ru f(y).

Пример 2.1. Рассмотрим экономического агента – производственное предприятие – принимающего решение об объеме выпускаемой продукции y. Технология производства такова, что может быть произведен любой объем продукции, не превышающий технологического ограничения y+ > 0, то есть множество допустимых действий агента A = [0; y+]. Предположим, что известна рыночная цена l > 0 на продукцию, производимую агентом, и известна функция затрат агента c(y) = y2 / 2 r, где r > 0 – тип агента (параметр, отражающий эффективность его деятельности).

Если считать, что агент заинтересован в максимизации своей прибыли (разности между выручкой от продаж и затратами), то его функция полезности примет вид:

(3) f(y) = l y – y2 / 2 r.

Максимум этой функции на положительной полуоси достигается при выборе действия ymax = l r. Значит решение задачи (2) имеет вид:

(4) y* = min{l r, y+},

то есть агенту следует выбирать объем производства, максимизирующий его прибыль (если такой объем является технологически допустимым), либо максимально возможный (с точки зрения технологических ограничений) объем производства. ·

Помимо принципа (1) принятия решений, агент может использовать принципы ограниченной рациональности, то есть выбирать e-оптимальные действия:

(5) Pe(f(×) ,A) = {y Î A | f(y) ³ f(y*) – e},

или действия, обеспечивающие ему заданный уровень полезности Модель принятия оптимальных решений. - student2.ru :

(6) P(f(×), A, Модель принятия оптимальных решений. - student2.ru } = {y Î A | f(y) ³ Модель принятия оптимальных решений. - student2.ru }.

Пример 2.2. Рассмотрим Пример 2.1, в котором агент готов выбирать e-оптимальные действия, то есть, действия, которые обеспечивают ему прибыль, отличающуюся от максимально возможной не более чем на e. Предполагая, что технологические ограничения отсутствуют (y+ = +¥), из (3) и (5) получим:

(7) Pe(f(×), A) = [l r – Модель принятия оптимальных решений. - student2.ru ; l r + Модель принятия оптимальных решений. - student2.ru ],

В свою очередь, из (3) и (6) получим:

(8) P(f(×), A, Модель принятия оптимальных решений. - student2.ru } = [l r – Модель принятия оптимальных решений. - student2.ru ; l r + Модель принятия оптимальных решений. - student2.ru ]

Отметим, что при e = 0 или Модель принятия оптимальных решений. - student2.ru = f(y*), получаем, что (7) и (8) превращаются в соответствующее целевой функции (3) выражение (1). Последнее свойство называется принципом обобщения – при предельном переходе к случаю, который был обобщен, все результаты должны соответствовать обобщаемым результатам (отметим, что принцип обобщения справедлив в рамках одной научной парадигмы).

Кроме того, интересно отметить, что имеет место принцип монотонности по уровню притязаний – с ростом e (тех потерь, которые агент считает допустимыми) или с уменьшением значения Модель принятия оптимальных решений. - student2.ru (той полезности, которой агент считает достаточной), множества (7) и (8) расширяются. ·

2.3. Принятие решений в условиях игровой неопределенности.Выше рассмотрены модели принятия решений в условиях природной неопределенности. Давайте усложнять ситуацию дальше. Мы начали с того, что агент, описывался функцией полезности, зависящей только от его действия, потом добавили неопределенность в виде параметра, описывающего внешнюю среду. Но, возможно, помимо рассматриваемого агента, существуют другие агенты, с которыми он взаимодействует, а, значит, необходимо отразить в моделях принятия решений и это взаимодействие. В теории игр это взаимодействие принято называть конфликтом.

Модель конфликта. Практической стороной конфликта может быть любая ситуация реальной человеческой деятельности (война, экономика, юриспруденция, семейная жизнь, групповое взаимодействие, конкуренция за приз, карточная, спортивная или интеллектуальная игра и т.п.). Во всех реальных конфликтах есть нечто общее: конфликтом называется всякое явление, характеризуемое набором участников, набором их интересов (целевых функций), набором их стратегий поведения, набором исходов явления. Действующей стороной (т.е. стороной, выбирающей ту или иную стратегию) конфликта может быть как отдельный участник игры, так и коалиция,т.е. множество участников. Причем могут складываться коалиции действия и коалиции интересов. Если коалиции интересов и коалиции действия совпадают, участников игры принято называть игроками. Ситуация, когда каждая из сторон конфликта выбрала свою стратегию, называется исходом конфликта (игры).

В математической теории игр все множества (игроков, целевых функций, стратегий, исходов) считаются абстрактными (точечными, числовыми, функциональными и т.п.). Исход игры не всегда детерминирован: допустимыми являются исходы, представляющие собой множества, случайные величины. Некоторые комбинации выбранных стратегий могут быть неосуществимыми, тогда считается, что конфликт (игра) не состоялся. Интерес игрока состоит в том, что каждый исход игры представляет для него определенную ценность, т.е. все исходы упорядочены (допуская эквивалентные исходы) с его точки зрения. Другими словами, для каждого игрока определены бинарные соотношения на множестве исходов игры. Частным случаем упорядоченности служат функции (функции выигрыша), заданные на множестве исходов.

Итак, формальная модель конфликта (игры) есть следующий кортеж:

{множество игроков, множество стратегий, множество исходов, множество функций выигрыша}

Некоторые из действующих сторон в игре могут и не существовать реально, а только в воображении других сторон конфликта. Например, одной из действующих сторон деятельности человека является природа. Непознанные природные закономерности, представляющие угрозу для деятельности (такие как стихийные бедствия, засухи и пр.) могут восприниматься человеком как противодействующая сторона конфликта. Такие конфликты получили название «игры с природой».Об этом говорилось выше.

Формализация принятия решений.Как игрок определяет множество своих стратегий или различает элементы этого множества? Если множество стратегий конечно и дискретно, это не является проблемой. Как отражается на множестве стратегий и функций выигрыша динамическая природа внешней среды? Если игра разыгрывается однократно и мгновенно, это не является проблемой. В случае же повторяющихся игр учет зависимостей от внешних обстоятельств достаточно важен (такие игры получили название динамических игр). Важно также отметить, что определение элементов игры отражает не реальность, а представления игроков о ней, т.е. носит субъективный характер. Каждое информационное состояние игрока можно понимать как некоторый класс его истинных состояний который объединяет в себе неразличимые на данный момент стратегии игрока. Функции выигрыша в этом случае определяются теми же обстоятельствами, которые вызвали данное информационное состояние игрока. Поэтому учет информированности игроков вносит существенный вклад в определение всех компонентов игры.

Оптимальностьрешения, принимаемого в условиях конфликта труднее поддается формализации. Эта задача всегда была основной в теории игр. Действительно, оптимальность в условиях конфликта всегда есть некоторый компромисс между его сторонами и/или между стратегиями каждой из сторон. До сих пор в теории игр не сложилось единого понимания оптимальности: в разных концепциях игр существуют разные понятия оптимальности. Понятие оптимальности тесно связано с понятием устойчивости. Возможный исход игры только тогда будет реализуемым практически. Если он устойчив, т.е. ни у одной из сторон не должно возникать соблазна его изменить. Поэтому реализуемые исходы называют игровым равновесием. Это обстоятельство существенно уменьшает оптимальность исходов для каждого из участников игры.


Наши рекомендации