Принятие решения в условиях неопределенности.
Предположим , что ЛПР (Лицо, Принимающее Решения ) рассматривает четыре возможных решения. Но ситуация на рынке не определенная, она может быть одна из четырех. С помощью экспертов ЛПР составляет матрицу последствий или доходов Q . Элемент этой матрицы qi,jпоказывает доход , получаемый ЛПР, если им принято i-ое решение, а ситуация j-ая. В этой ситуации полной неопределенности могут быть высказаны лишь некоторые соображения и том, какое решение принять. Сначала матрицу рисков.
Строится эта матрица так: в каждом столбце матрицы находится максимальный элемент d j, после чего элементы rij = dj- qijи образует матрицу рисков, смысл рисков таков: если бы ЛПР знал , что в реальности имеет место j-ая ситуация, то выбрал бы решение с наибольшим доходом, но он не знает, поэтому, принимая i-ое решение он рискует недобрать dj — qi,j– что и есть риск. Матрица R = rijназывается матрицей рисков.
Матрица доходов
Матрица рисков
Правило Вальда называют правилом крайнего пессимизма: ЛПР уверен , что какое бы решение он ни принял, ситуация сложится для него самая плохая, так, что принимая i-ое решение, он получит минимальный доход :
qi =min qij : j=1, ... ,4. , но теперь из чисел qi ЛПР выбирает максимальное и принимает соответствующее решение.
По правилу Сэвиджа находят в каждой строке матрицы рисков максимальный элемент ri и затем из чисел ri находят минимальное и принимают соответствующее решение. Так принимает решение ЛПР, не любящий рисковать.
По правилу Гурвица для каждой строки матрицы доход находят величину
zi =a*max{qij: j=1, ... 4}+(1-a)*min{qij: j=1, ... 4} , потом находят из чисел zi наибольшее и принимают соответствующее решение. Число а каждый ЛПР выбирает индивидуально – оно отображает его отношение к доходу и риску, при приближении а к 0 правило Гурвица приближается к правилу Вальда, при приближении к 1 – правилу розового оптимизма , а в нашем случае а равно 1/2.
Предположим , что ЛПР (Лицо, Принимающее Решения ) рассматривает четыре возможных решения. Но ситуация на рынке не определенная, она может быть одна из четырех. Однако известны вероятности этих ситуаций pj. Имея матрицу доходов Q теперь можно сказать, что доход от i-го решения есть с.в. Qi с доходами qij и вероятностями этих доход pj. Кроме того, риск i-го решения есть также с.в. Ri с рисками ri j и вероятностями этих рисков pj. Математическое ожидание с.в. Qi и Ri называют также средним ожидаемым доходом и средним ожидаемым риском i-го решения. Теперь можно принять решение (провести операцию), у которого наибольший средний ожидаемый доход и наименьший средний ожидаемый риск.
Матрица доходов | Доход | Средний ожидаемый риск | Матрица рисков |
вероятности ситуаций (x/xx) | вероятности ситуаций |
Нанесем средние ожидаемые доходы Q и средние ожидаемые риски R на плоскость - доход откладываем по вертикали, а риски по горизонтали (см.рис.).
Q Q2
Q4
Q1
Q3
R
Получили 4 точки. Чем выше точка (Q,R), тем более доходная операция, чем точка правее - тем более она рисковая. Значит, нужно выбирать точку выше и левее. Точка (Q',R’) доминирует точку {Q,R), если Q' ≥ Q и R' ≥ R и хотя бы одно из этих неравенств строгое. В нашем случае 2-я операция доминирует все остальные. Точка, не доминируемая никакой другой называется оптимальной по Парето, а множество всех таких точек называется множеством оптимальности по Парето. Легко видеть, что если из рассмотренных операций надо выбрать лучшую, то ее обязательно надо выбрать из операций, оптимальных по Парето. В нашем случае, множество Парето, т.е. оптимальных по Парето операций, состоит только из одной 3-й операции.
Для нахождения лучшей операции иногда применяют подходящую взвешивающую формулу, которая для пар (Q, R) дает одно число, по которому и определяют лучшую операцию. Например, пусть взвешивающая формула есть f(Q)=2Q - R. Тогда получаем: f(Q1)= 3, f(Q2)= 33, f(Q3)= -12, f(Q4)= 27. Видно, что 2-я операция — лучшая, а 3-я — худшая.
Иногда в условиях полной неопределенности применяют правило Лапласа равновозможности, когда все вероятности рj считают равными.
Матрица доходов | Доход | Средний ожидаемый риск | Матрица рисков |
вероятности ситуаций (x/xx) | вероятности ситуаций |
Нанесем средние ожидаемые доходы Q и средние ожидаемые риски R на плоскость - доход откладываем по вертикали, а риски по горизонтали (см.рис.).
Q Q4
Q2
Q1
Q3
R
В нашем случае, множество Парето, т.е. оптимальных по Парето операций, состоит только из одной 3-й операции. f(Q1)= -2, f(Q2)= 25, f(Q3)= -14, f(Q4)= 26,5. Видно, что 4-я операция — лучшая, а 3-я — худшая.
После этого можно выбрать какое-нибудь из двух приведенных выше правил-рекомендаций принятия решений.
Для уточнения распределения вероятностей можно провести пробную операцию. После ее проведения вероятности состояний, характеристики операций и оптимальное решение могут стать совершенно иными.
В рамочках переменные первоначальной характеристики, жирным курсивом — после проведения пробной операции.
Первоначальные вероятности и характеристики операции | |||||
вероятности ситуаций | доход | средний ожидаемый риск | вероятности ситуаций | ||
до пробной операции | |||||
матрица доходов | матрица рисков | ||||
25,2 6,6 | 10,8 29,4 | ||||
0.1 0.0 0.0 0.9 | после операции | 0.1 0.0 0.0 0.9 | |||
вероятности ситуаций | вероятности ситуаций | ||||
Вероятности и характеристики операции после пробной операции | |||||