Принятие решений в условиях неопределенности

Оно характеризуется тем, что при выборе альтернативы ЛПР не знает состояние среды и не имеет информации о вероятностях их проявления. Однако ЛПР известно множество возможных состояний среды и функция реализации Принятие решений в условиях неопределенности - student2.ru , где – множество допустимых альтернатив, – множество состояний среды, – множество исходов.

Оценочная структура представлена функцией Принятие решений в условиях неопределенности - student2.ru . Тогда целевая функция указывает полезность (ценность) того исхода, который получается в результате, когда ЛПР выбирает альтернативу Принятие решений в условиях неопределенности - student2.ru , а среда находится в состоянии . Таким образом, .

Пример: аренда комнат в отеле, Принятие решений в условиях неопределенности - student2.ru – число комнат, – степень заполнения комнат

В ячейках следующей таблицы должна содержаться соответствующая прибыль:

Здесь Принятие решений в условиях неопределенности - student2.ru – прибыль от аренды. Если и конечны, то целевая функция может быть задана таблично. Если приписать элементам множеств Принятие решений в условиях неопределенности - student2.ru и номера, то – выигрыш ЛПР в случае выбора -го варианта при -ом состоянии среды.

Пусть Принятие решений в условиях неопределенности - student2.ru , . Тогда матрица выигрышей (платежная матрица) имеет вид

Принятие решений в условиях неопределенности - student2.ru

Подходы к сравнению альтернатив, представленных в платежной матрице.

1-й подход. Использование принципа доминирования. Он заключается в отбрасывании доминируемых альтернатив. Тогда Принятие решений в условиях неопределенности - student2.ru , если , в противном случае и несравнимы по доминированию. Пример:

Принятие решений в условиях неопределенности - student2.ru

При попарном сравнении Принятие решений в условиях неопределенности - student2.ru имеем: , , причем других пар, находящихся в отношении доминирования, нет, то есть альтернативы , и несравнимы по отношению доминирования. Для выбора оптимальной альтернативы из оставшихся необходимо использование других методов.

2-й подход. Основной принцип: формулируется некоторая гипотеза о поведении среды, позволяющая дать каждой альтернативе единую числовую оценку, которая даёт критерии для сравнения альтернатив по предпочтению. Оптимальной будет альтернатива, имеющая наибольшую оценку (для функции потерь – наименьшую).

Основные типы критериев:

1) Критерий Лапласа. Критерий основан на гипотезе равновероятности (равновозможности) состояний среды. Тогда оценка Принятие решений в условиях неопределенности - student2.ru -й альтернативы равна и . Недостаток такого подхода состоит в эффекте компенсации маленьких выигрышей большими.

2) Критерий Вальда. Критерий основан на гипотезе антагонизма, то есть при выборе решения надо рассчитывать на самый худший возможный вариант. Тогда оценкой Принятие решений в условиях неопределенности - student2.ru -й альтернативы служит число и . – максиминная альтернатива. Принцип максимина - максимизация минимально возможного (то есть гарантированного) выигрыша. Еще одно название – принцип максимального гарантированного результата. Недостаток: при выборе решения учитывается только наихудший вариант.

Если целевая функция является функцией потерь, то оценкой альтернативы Принятие решений в условиях неопределенности - student2.ru является число и . Тогда – минимаксная альтернатива (минимакс). Это – принцип минимизации максимально возможных потерь.

3) Критерий Гурвица. Критерий связан с введением показателя Принятие решений в условиях неопределенности - student2.ru , называемого показателем пессимизма. Гипотеза поведения среды: вероятность наихудшего состояния равна , а наилучшего – Принятие решений в условиях неопределенности - student2.ru . Тогда оценка альтернативы : . Если , то это критерий крайнего пессимизма (критерий Вальда). Если , то это критерий крайнего оптимизма. Недостаток: учитываются только два крайних исхода; субъективность определения показателя Принятие решений в условиях неопределенности - student2.ru .

4) Критерий Сэведжа. Критерий основан на преобразовании первоначальной матрицы выигрышей Принятие решений в условиях неопределенности - student2.ru в матрицу рисков (матрицу сожалений) . Риском при выборе альтернативы в состоянии называется число , где . Оптимальная альтернатива минимизирует максимальный риск, то есть используется минимаксный критерий для матрицы сожалений.

Оптимальные решения, получаемые по указанным критериям, в общем случае могут не совпадать, так как критерии противоречат друг другу, поскольку основаны на разных гипотезах.

Пример: необходимо выбрать проект электростанции. Возможно 4 варианта: Принятие решений в условиях неопределенности - student2.ru – ТЭЦ, – ГЭС, – АЭС, – ПЭС. Состояния среды, влияющие на строительство и дальнейшую эксплуатацию, учитывает следующие факторы: погода, возможность наводнения, цена топлива, расходы на его транспортировку. Пусть выделено 4 варианта комбинаций факторов: Принятие решений в условиях неопределенности - student2.ru . В матрице выигрышей показана эффективность каждого из вариантов:

Принятие решений в условиях неопределенности - student2.ru

1) Критерий Лапласа. Здесь Принятие решений в условиях неопределенности - student2.ru ; ; ; . Таким образом, – оптимальная альтернатива.

2) Критерий Вальда. Принятие решений в условиях неопределенности - student2.ru ; ; ; . Таким образом, – оптимальная альтернатива.

3) Критерий Гурвица. Пусть Принятие решений в условиях неопределенности - student2.ru ; тогда ; ; ; . Таким образом, – оптимальная альтернатива.

Оценим влияние Принятие решений в условиях неопределенности - student2.ru на результат. В данной задаче , поэтому остается две альтернативы, которые могут стать оптимальными: и . Условие Принятие решений в условиях неопределенности - student2.ru сводится к неравенству . Таким образом, при оптимальной будет альтернатива , а при оптимальной будет .