Виды природной неопределенности
В жизни редко бывает так, что выбор агента однозначно определял его выигрыш. Иногда вмешиваются какие-то факторы, которые не подконтрольны ЛПР. Попробуем учесть их в модели следующим образом: пусть существует неопределенный фактор – состояние природы. Предпочтения ЛПР уже зависят от того, что выбирает он, и от состояния природы, т.е. предпочтения определены на декартовом произведении множества допустимых действий и множества возможный состояния природы, и целевая функция (функция полезности) отображает это декартово произведение в числовую ось: .
Если агент будет выбирать действие, максимизирующее его целевую функцию, то максимум будет зависеть от того, каково будет состояние природы. Для того чтобы описать принятие решений в условиях неопределенности, нужно ввести новую гипотезу – гипотезу детерминизма: субъект, принимая решение, стремится устранить неопределенность и принимать решения в условиях полной информированности. Для этого он должен перейти от целевой функции, зависящей от неопределенных факторов, к целевой функции, которая зависит только от того, что он может выбрать сам.
В зависимости от той информации о состоянии природы, которой обладает ЛПР на момент принятия решений, выделяют:
- интервальную неопределенность (ЛПР известно только множество W возможных значений состояния природы);
- вероятностную неопределенность (ЛПР известно распределение вероятностей значений состояния природы на множестве W);
- нечеткую неопределенность (ЛПР известна функция принадлежности различных значений состояния природы на множестве W).
Рассмотрим последовательно модели принятия решений в рамках перечисленных видов неопределенности.
Интервальная неопределенность.Так, пусть ЛПР известно только множество W возможных значений состояния природы. Тогда возможны следующие варианты:
1. Подстановка в целевую функцию f(y, q)какого-то конкретного значения q' Î W состояния природы, после чего задача сводится к известной и остается найти максимум по y.
2. Предположим, что агент – пессимист и считает, что реализуется наихудшее состояние природы. Такой принцип принятия решений называется принципом максимального гарантированного результата (МГР) и заключается в следующем: действие агента будет доставлять максимум его целевой функции при условии, что он рассчитывает на наихудшее для себя значение неопределенного параметра. Тогда он берет сначала минимум по состоянию природы, а потом максимум по своему действию:
(1) .
Преимущества данного принципа принятия решений: он дает оценку снизу значения целевой функции, т.е. это точка отсчета снизу. Плох этот принцип своей крайней пессимистичностью, т.к., если природа «нейтральна» (не настроена против агента), то такое допущение неверно. Если под природой понимать не социально-экономическое окружение, а дословно природные факторы, то в этом смысле природе безразлично то, что мы с вами делаем.
3. Поэтому, естественно, можно использовать и другую крайность – крайний оптимизм. Т.е., рассчитывать на то, что природа к нам благосклонна, и выбирает действие, которое для нас наиболее благоприятно. Тогда нужно выбирать максимум целевой функции при условии реализации наилучшего состояния природы:
(2) .
Это называется критерий оптимизма, и он дает оценку сверху. Этим принцип оптимизма хорош, но этим он и плох.
Понятно, что крайний оптимизм, как и крайний пессимизм, в жизни редко встречаются и редко выживают.
Возможны любые комбинации этих критериев, можно брать их линейную свертку, то есть балансировать между оптимизмом и пессимизмом.
Мы перечислили три наиболее распространенных варианта устранения неопределенности в условиях, когда о неопределенном параметре агент знаем только то, что он принадлежит заданному множеству. Такая неопределенность называется интервальной – агент знает «интервал» значений неопределенного параметра. Эту информацию он использует, когда берет минимум или максимум по множеству возможных значений неопределенного параметра.
Пример. Усложним Пример 1, предположив, что неопределенной является рыночная цена l единицы продукции, то есть l Î W = [q-;q+].
В соответствии с первым вариантом агент может рассчитывать, например, на «среднюю» цену q’ = (q- + q+) / 2. Тогда ему следует выбирать действие
(3) y’ = min{(q- + q+) r / 2, y+}.
При использовании принципа МГР агент будет рассчитывать на минимальную цену и выберет действие
(4) yг = min{q- r, y+}.
При использовании принципа оптимизма агент будет, наоборот, рассчитывать на максимальную цену и выберет действие
(5) yо = min{q+ r, y+}.
В данном примере из (3)-(5) видно, что yг £ y’ £ yо. Отметим, что модель принятия решений ничего не говорит о том, каков будет реальный выигрыш агента. Для этого нужно знать, какое на самом деле реализуется состояние природы, в примере – какова будет рыночная цена. Если реализуется значение цены Î [q-;q+], а агент рассчитывал на наихудший случай (то есть, выбрал действие (4)), то его выигрыш будет равен f(yг, ) = yг – (yг)2 / 2 r, что выше выигрыша f(yг, q-) = q- yг – (yг)2 / 2 r, на который он рассчитывал (так как q- £ ). С другой стороны, выигрыш агента меньше, чем тот выигрыш, который он мог бы получить, если бы ему на момент принятия решений было известно значение состояния природы. В последнем случае он выбрал бы действие y*( ) = min{ r, y+} и получил бы выигрыш
f(y*( ), ) = y*( ) – (y*( ))2 / 2 r ³ f(yг, ) = yг – (yг)2 / 2 r. ·
Вывод, сделанный в заключении последнего примера, является достаточно универсальным: при наличии неопределенности выигрыш ЛПР не выше его выигрыша в условиях полной информированности (хотя бывают и исключения).
Вероятностная неопределенность.Предположим, что у агента появилась дополнительная информация о значении неопределенного параметра q, принадлежащего множеству W. Допустим, агенту известно распределение вероятностей на этом множестве (соответствующая неопределенность называется вероятностной), тогда логично использовать это знание, и устранять неопределенность следующим образом: у агента есть целевая функция f(×), зависящая от его действия и значения неопределенного параметра. Давайте возьмем от нее математическое ожидание по известному распределению, получим функцию ожидаемой полезности («ожидаемой» с точки зрения математического ожидания) . Таким образом, устранив неопределенность взятием математического ожидания, снова получили детерминированную модель (в выражение (2) раздела 2.1.1 можно вместо f(y) подставить E f(y)) и теперь можно максимизировать функцию ожидаемой полезности, зависящей только от действия агента, выбором этого действия.
Возможны и другие способы устранения неопределенности. Можно рассчитать риск, например, вероятность того, что значение целевой функции окажется меньше, чем заданное. И этот риск минимизировать, т.е. использовать не первый момент распределения, а дисперсию и другие характеристики. Подходы могут быть разными, но, главное – устранить зависимость от неопределенного параметра (что необходимо в силу гипотезы детерминизма), а потом принимать решения в условиях полной информированности.
Пример. Усложним Пример 1, а именно, предположим, что агент полагает, что рыночная цена l описывается вероятностным распределением p(l). Обозначим E l = – математическое ожидание цены. В силу линейности целевой функции (3) раздела 2.1.1 по цене, получаем, что E f(y) = (E l) y – y2 / 2 r. Действием агента, максимизирующим его ожидаемую полезность, будет y* = min{(El) r, y+}. ·
Отношения предпочтения. Неопределенность может присутствовать и в моделях предпочтений, описываемых бинарными отношениями. Приведем пример.
Пример. Усложним Пример 3 c фирмой, выходящей на рынок, а именно, предположим, что результат z действия y зависит не только от самого действия ЛПР, но и от некоторых внешних по отношению к ЛПР факторов, то есть зависимость результата от действия имеет вид z = w(y, q, u), где q и u – факторы, не зависящие от ЛПР. Множества возможных значений этих параметров обозначим W и U соответственно. Если эти факторы известны на момент принятия решения, задача сводится к детерминированному случаю. Если же они неизвестны, возникает неопределенность.
Так, множество W может быть совокупностью объективных рыночных факторов. Например, состояние q1 = «новая продукция фирмы найдет спрос» приводит к высоким прибылям (исход z3), а состояние q2 = «новая продукция не найдет спроса» – к исходу «разорение» (z0). Множество U описывает неопределенность действий других лиц и может иметь, например, вид: {u1, u2}, где вариант u1 соответствует тому, что конкуренты предпримут активные действия по вытеснению фирмы с традиционного рынка, а вариант u2 – их пассивному поведению по поводу нового конкурента. Будем считать, что в первом случае фирма сможет получать лишь низкие прибыли (исход z1), а во втором – средние (z2).
Теперь уже выбор ЛПР некоторого действия y* не приводит к единственному возможному результату. В зависимости от реализации не зависящих от ЛПР факторов q и u может реализоваться любой результат из множества R(y*) = {w(y*,q, u) | q Î W, u Î U}. Чтобы сделать выбор, ЛПР необходимо научиться сравнивать эти множества. Однако отношение предпочтения на системе множеств R(×) не задано условиями задачи. Его необходимо получать (возможно, используя некоторые дополнительные предположения) из отношения предпочтения на множестве результатов A0.
Так, если известно распределение вероятностей реализации событий из W и U, то можно определить вероятности появления различных результатов при выборе определенного действия.
Например, пусть P(q1) = 80 %, P(q2) = 20 % (то есть шансы того, что новая продукция найдет спрос – четыре к одному), и, кроме того, P(u1) = 50 %, P(u2) = 50 % (то есть различное отношение к новому конкуренту на традиционном рынке равновероятно).
Тогда, если фирма выходит на новый рынок (выбирает действие y1), то:
P(z3|y1) = 80%.
P(z0|y1) = 20%.
Соответственно, для других действий вероятности различных исходов будут следующими:
P(z1|y2) = 50%.
P(z2|y2) = 50%.
P(z1|y3) = 100%.
Остальные исходы имеют нулевую вероятность.
В соответствии с терминологией, введенной выше, описанная задача – это задача принятия решения в условиях вероятностной неопределенности.
Немногим отличается случай, когда ЛПР не имеет информации о вероятностях некоторых значимых событий, но имеет предположения о них. В этом случае объективные вероятности заменяются субъективными, и реализуется та же схема решения.
Таким образом, в данном примере каждое решение (действие) ЛПР приводит к лотерее, случайному процессу, в котором исходы могут реализовываться с некоторыми вероятностями. Для того, чтобы от предпочтения на множестве исходов перейти к предпочтениям на множестве действий, ЛПР должен уметь сравнивать свои предпочтения на множестве подобных лотерей, то есть определять, какая из лотерей для него лучше или хуже. Тогда оптимальным решением будет действие, приводящее к наилучшей лотерее.
Нечеткая неопределенность
Помимо интервальной или вероятностной, возможен другой тип информированности – агент может знать значения функции принадлежности для состояний природы (нечеткая неопределенность).