Аксиомы для линейной функции полезности
В данном разделе будут рассмотрены аксиомы (или условия) для отношения на множестве Р, выполнение которых означает, что существует линейная функция полезности для отношения на Р. В работе [21] предложены аксиомы (Al, А2, A3), которых достаточно для существования линейной функции полезности для отношения на Р. Другой набор аксиом {Bl, В2, ВЗ} введен в работе [33]; выполнение этих аксиом является необходимым л достаточным условием существования совершенной линейной функции полезности для отношения на множестве Р. В каждом случае X представляет собой любое непустое множество, причем не обязательно конечное или исчислимое. Аксиомы не означают, что полезность ограничена, хотя ограниченность полезности обычно возникает в результате применения аналогичных аксиом к непростым распределениям вероятностей.
Как отмечалось в начале главы, первоначальная аксиоматика для совершенной функции полезности была предложена Нейманом и Моргенштерном в их известной книге [58], и поэтому совершенную линейную функцию и (или дополнительную к ней v на X) часто называют функцией полезности Неймана — Морген-штерна. Используется также выражение «полезность по Бернулли», поскольку Бернулли внес вклад в разработку этого вопроса [6].
При формулировке каждой аксиомы предполагается, что все р, q, r и s принадлежат множеству Р; в аксиомах А2 и В2 считается, что а лежит строго между 0 и 1.
А1. Отношение на Р нерефлексивно.
А2. Если 0< а < 1 и р q и r s, то ар + (1 — а) r аq+ (1 — а) s.
A3. Если р q и r s, то ар -+ (1 — a) s аq + (1 — a) r для некоторого а, заключенного строго между 0 и 1.
B1. Отношение на Р является слабым упорядочением.
B2. Если 0 < а < 1 и р q, то ар +(1 — а)r аq + (1 — а) r
B3. Если р q и q r, то ар + (1 — а) r q и q (bр + (1 — b) r) для некоторых а и b, лежащих строго между 0 и 1.
Аксиомы А1 и В1 уже обсуждались выше (они означают, что отношение ациклично); А2 и В2 называют по-разному: аксиомами независимости, аддитивности или условиями линейности. Линейные свойства функции и [см. уравнение (3)] получаются непосредственно из этих аксиом. Рациональное обоснование аксиом А2 и В2 обычно дается следующим образом: сначала выбирают р и r с соответствующими вероятностями а и (1 — а), а затем составляют выражение ар + (1 — а) r на основе ранее сделанного выбора.
Аксиомы ТПР
Прежде чем формулировать аксиомы теории принятия решений, введем обозначения и определения. Простой лотереей L (х1, р, х2) назовем вероятностное событие, имеющее два возможных исхода х1 и х2, вероятности наступления которых обозначим соответственно через р и (1 —р). Символами , ~, > будем соответственно обозначать понятия «предпочтительнее», «равноценно», «равноценно или предпочтительнее». Например, если xt~L(х2, р, х3), то исход хt равноценен лотерее, которая имеет исходы х2 с вероятностью р или х3 с вероятностью (1 — р). Теперь сформулируем ряд аксиом теории принятия решений, которые лишь слегка отличаются от формулировок, приведенных в [60].
Аксиома 1. Существование относительных предпочтений. Для любой пары исходов х1 и х2 их предпочтения будут таковы, что или х1 ~ х2, х1 х2, или х2 х1.
Аксиома 2. Транзитивность. Для любых лотерей L1, L2 и L3 справедливо следующее:
(а) если L1 ~ L2 и L2 ~ L3, то L1 ~ L3;
(б) если L1 L.2 и L2 ~ L3, то L1 L3 и т. д.
Поскольку исход можно интерпретировать как вырожденный случай лотереи (т. е. р = 1), то аксиомы 1 и 2 вместе означают, что лицо, принимающее решение, может провести ранжировку относительного предпочтения различных возможных исходов. Эти аксиомы не требуют стационарности ранжировки во времени и не утверждают, что лицо, принимающее решение, может объяснить свои предпочтения. Обозначим через х° исход, который не является более предпочтительным, чем любой другой исход, а через х* — исход не менее предпочтительный, чем любой другой. Таким образом, единственная возможность состоит в том, что х° и х* означают соответственно наименее и наиболее предпочтительные исходы, хотя они могут представлять собой гипотетические исходы, такие, что х* х и х х° для всех допустимых х. Продолжим изложение аксиом.
Аксиома 3. Сравнение простых лотерей. Если для лица, при-
нимающего решения, х1 х2 , то
(а) L1 (х1, р1, х2) L2 {х1, р2, х2) при р1 > р2;
(б) L1 (х1, р1, х2) ~ L2 {х1, р2, х2) при р1 = p2.
Аксиома 4. Численная оценка предпочтений. Каждому возможному исходу х лицо, принимающее решение, может поставить в соответствие число л (х) (где 0 < л (х) < 1), такое, что х ~ L (х*, л (х), х°).
Аксиомы 3 и 4 определяют для лица, принимающего решение, меру относительного предпочтения различных исходов. Величина л (х), называемая вероятностью равноценности, является такой мерой.
Аксиома 5. Численная оценка неопределенности суждений. Каждому возможному событию Е, которое может влиять на исход решения, можно поставить в соответствие число Р (Е), где
0 ≥ P(E) ≥ 1, такое, что становятся равноценными лотерея L (х*, Р (Е), х°) и ситуация, при которой лицо, принимающее решение, получает х*, если происходит событие Е, и х°, если событие Е не происходит. Значение Р (Е) определяется лицом, принимающим решение.
Для того чтобы получить достаточно приемлемые оценки вероятностей событий, возможно, потребуется просмотреть большое число выборок. Однако, как указывалось выше, для многих важных проблем это неосуществимо. Аксиома 5 дает механизм получения вероятностей суждений для обеих ситуаций. Поскольку вероятности Р (Е) удовлетворяют аксиомам теории вероятностей, все результаты этой теории можно применить для анализа проблем.
Аксиома 6. Возможность замены. Если модифицировать задачу принятия решения путем замены одного исхода (или лотереи) другим исходом (или лотереей), которые равноценны для лица, принимающего решение, то обе задачи принятия решения (старая и модифицированная) будут равноценны для этого лица.
Аксиома 7. Эквивалентность условного и безусловного предпочтений. Пусть L1 и L2 — две лотереи, возможные только при наступлении события Е. Если известно, наступит событие Е или нет, то лицо, принимающее решение, должно иметь те же предпочтения между L1 и L2, как и при отсутствии этой информации.
Как уже отмечалось, мера л π(х) описывает относительные предпочтения для х. Очевидно, что в разных ситуациях можно брать различные л-функции, поскольку граничные значения а;0 и х* для измерения л (х) являются достаточно произвольными. Однако, чтобы все возможные л-функции удовлетворяли предыдущим семи аксиомам, они должны сводиться одна к другой с помощью положительного линейного преобразования. Любое положительное линейное преобразование л следующего вида:
и (х) = а + b л (х), b> 0, (1)
будем называть шкалой полезности для исходов х. Если лицо, принимающее решение, опирается на данные аксиомы, ему надлежит всегда выбирать альтернативы так, чтобы максимизировать ожидаемую полезность. Согласно сформулированным аксиомам, не существует других процедур принятия решений.
Поскольку максимизация ожидаемой полезности эквивалентна максимизации ожидаемого значения л в (1), произвольный выбор» х* и х° не влияет на фактическое решение. Шкала полезности аналогична температурным шкалам; разные шкалы, которые получаются одна из другой с помощью положительного линейного* преобразования, эквивалентны с позиции их использования для целей принятия решений.