Раздел III. Модели принятия решений
Несмотря на зависящую от контекста природу оценки и принятия решений, их первоначальные модели свидетельствуют о том, что люди имеют устойчивый набор подходов и предпочтений, который не изменяется в зависимости от формы их применения. Принимающие решения выступают как «рациональные субъекты», стремящиеся к максимальной практичности, извлечению собственной выгоды и исповедующие принципы рационального поведения. Главы этого раздела оценивают эти модели, их недостатки и рассматривают альтернативные теории принятия решений.
Глава 7. Теория ожидаемой полезности
В 1713 году швейцарский профессор Николас Бернулли сформулировал интересный вопрос. Выражаясь современным языком, Бернулли интересовало, сколько денег рассчитывают люди истратить в игре со следующими правилами: 1) монетку подкидывают, пока она не выпадет решкой, 2) игрок платит два доллара, если после первого подбрасывания монетка выпала решкой, 4 доллара — если решка впервые выпала при втором подбрасывании, 8 долларов — если решка впервые появилась при третьем подбрасывании, 16 долларов — если решка впервые выпала только в четвертом подбрасывании, и т. д. (Анкета содержит описание этой игры в п. 30, так что можете взглянуть на свой ответ.) Большинство людей рассчитывают заплатить лишь несколько долларов.
С тех пор как Бернулли впервые поставил эту проблему, она была названа «Санкт-Петербургским парадоксом». Парадокс потому, что ожидаемая ценность игры (или количество денег, которые вам придется заплатить до первого выпадения решки) огромна и очень немногие готовы заплатить крупную сумму денег за участие в ней. Чтобы проверить, действительно ли возможная плата бесконечно велика, мы можем подсчитать ожидаемую ценность игры Бернулли, умножив плату за каждый возможный исход игры на шансы этого исхода*. Шансы выпадения монетки решкой после первого подбрасывания (которое приведет к уплате 2 долларов) равны 1/2; шансы, что после одного выпадения орла выпадет решка (плата 4 доллара) равны 1/4; шансы, что решка последует за двумя орлами (плата 8 долларов)
* В этом разделе книги больше математики и теории, чем в других ее частях. Разумеется, некоторые читатели могут счесть этот материал более сложным, чем темы, обсуждавшиеся в предыдущих разделах. Если вы не знакомы с терминологией, не расстраивайтесь: основные пункты будут понятны вам без всякого знания математики, а в последующих разделах ее вообще очень-очень мало.
равны 1/8; короче, ожидаемая ценность (ОЦ) составит (где К — количество подбрасываний):
ОЩза игру) = (V2)($2) + (V4)( $4) + (V8)( $8) + ... + (7
= $1 + $1 + $1 + $1 + ... + $1 = бесконечная сумма денег
Вопрос состоит в том, почему люди не собираются платить больше, чем несколько долларов, чтобы сыграть в игру с вероятным крупным выигрышем.
Спустя 25 лет, как Николас Бернулли поставил эту проблему, его младший кузен математик Дэниел Бернулли пришел к решению, которое включало в себя два первых положения современной ему теории принятия решений. Дэниел Бернулли (1738; 1954) обосновал это тем, что общая стоимость или «выгода» игры (в деньгах) расходится с итоговым выигрышем (или с уже имеющейся у игрока суммой). Например, он писал (с. 24): «Сумма в тысячу дукатов более существенна для бедняка, чем для богача, но оба получат одно и то же». Бернулли говорил, что количество денег может быть представлено следующим образом:
я
Богатство
Учитывая, что количество добавляющихся денег расходится с богатством, Бернулли смог показать, что в конечном счете выгода от Санкт-Петербургской игры не бесконечна. (109:()
Теория ожидаемой выгоды
Несмотря на то что ученые продолжали дебаты о том, действительно ли Дэниел Бернулли разрешил Санкт- Петербургский парадокс (например, Лопес, 1981; Уэйрич, 1984), его объяснение социальной зависимости выгоды заложило основы для более поздних теорий о поведении в ситуации выбора. Наиболее известный пример такой теории, известной сейчас как «теория ожидаемой выгоды», был опубликован Джоном фон Ньюманом и Оскаром Моргенштерном в 1947 году. Фон Ньюман и Моргенштерн считали теорию ожидаемой выгоды «нормативной» теорией поведения. То есть классическая теория выгоды не объясняла, как люди ведут себя в действительности, а как должны вести себя, если они следуют требованиям рационального принятия решений.
Одной из основных целей такой теории было оснащение определенным набором предположений или аксиом, определяющих рациональное принятие решений. Выведенные фон Ньюманом и Моргенштерном аксиомы позволили исследователям составить математический прогноз поведения реальных субъектов теории ожидаемой выгоды. Когда исследователи фиксировали нарушение аксиомы, они пересматривали теорию и делали новые прогнозы. Таким образом, исследования принятия решений циркулировали между теорией и практикой.
Каковы же аксиомы рационального принятия решений? Большинство формулировок теории ожидаемой выгоды основаны на положениях, изложенных в следующих шести принципах:
• Порядок альтернатив. Прежде всего, рационально принимающие решения должны иметь возможность сравнить любые две возможности. Нужно либо предпочесть одну другой, или остаться безразличными к обеим.
• Доминантность. Поступающие рационально никогда не должны принимать стратегию, над которой доминирует другая стратегия (в нашем случае стратегия равнозначна принятию решения). Стратегия является слабо доминантной, если при сравнении с другой стратегией она приносит лучшие результаты как минимум в одном отношении и такие же или лучшие, чем другие стратегии, в других отношениях (здесь «лучшие» означает, что они приносят большую выгоду). Стратегия является сильно доминантной, если при (110:) сравнении с другой она оказывается способной приносить лучшие результаты во всех отношениях. Например, машина А доминирует над машиной Б: она превосходит ее в скорости, ниже в цене и лучше смотрится; машина А слабо доминирует, если превосходит машину Б в скорости, а стоит и выглядит также. Согласно теории выгоды, тот, кто принимает рациональные решения, не выберет стратегию, над которой (пусть даже слабо) доминирует другая.
• Погашение. Если две связанные с риском альтернативы включают одинаковые и равновероятные последствия, их выгода не должна учитываться при выборе. Другими словами, выбор между двумя возможностями должен осуществляться только на основе их разницы, а не общего между ними. Это должно игнорироваться.
• Транзитивность. Если принимающий рациональное решение предпочитает альтернативу А альтернативе Б, а альтернативу Б — альтернативе В, то он должен предпочесть альтернативу А альтернативе В.
• Непрерывность. Для каждой группы возможностей рационально принимающий решение всегда предпочтет риск между наилучшей и наихудшей возможностями уверенности в среднем результате, если шанс получения наилучшего результата достаточно высок. Это означает, например, что такой человек предпочтет уверенность в 10 долларах риску выбора между 100 долларами и финансовым крахом, предполагая, что вероятность финансового краха равна одной из 1 000 000 000 000 000 000 000 000 000 000 000...
• Инвариантность. Принцип инвариантности означает, что принимающий решение не должен попадать под влияние способа предложения альтернатив. Например, между смешанной лотереей (лотереей, где может выиграть одна из двух альтернатив, а если выигрывают обе — вы получаете 100 долларов) и обычной лотереей (где вы с вероятностью 25% выигрываете 100 долларов).
Фон Ньюман и Моргенштерн в 1947 году обосновали математически то, что, когда принимающие решение следуют этим принципам, получаемая выгода является максимальной. Скажем для примера, что, следуя принципу транзитивности, вы выбираете между альтернативами А, Б и В. Вы предпочитаете (111:) альтернативу А альтернативе Б, альтернативу Б — альтернативе В и альтернативу В — альтернативе А. Это означает, что я могу дать вам альтернативу В и предложить — скажем, за цент — отказаться от альтернативы В и даю вам альтернативу Б. Поскольку вы предпочитаете альтернативу Б альтернативе В, вы, вероятно, примете мое предложение и заплатите пенни.
Теперь вы имеете альтернативу Б. Точно так же я предлагаю вам — за другое пенни — оставить альтернативу Б и даю вам альтернативу А (которую вы предпочитаете альтернативе Б. Но, поскольку альтернативе А вы предпосылаете альтернативу В, я предлагаю вам вернуться к ней — за третье пенни. В итоге вы вернулись к исходному за три пенни (или за 3 доллара или 3000 долларов — не важно). Другими словами, я могу пользоваться неразберихой в вашей голове, как «денежной помпой», пока у вас не кончатся деньги. В следующих главах мы обсудим ситуации, в которых принцип переходности и другие принципы рационального поведения оказываются несостоятельными.
Дополнения
После того как фон Ньюман и Моргенштерн выдвинули свою теорию ожидаемой выгоды, десятки других теоретиков занялись созданием ее продолжений и вариаций. Одна из них — «субъективная теория ожидаемой выгоды» — принадлежит Леонарду Сэвиджу (1954). Основным различием между теорией Сэвиджа и теорией фон Ньюмана и Моргенштерна является то, что Сэвидж допускал субъективные или личные возможности. До 1954 года альтернативы в теории ожидаемой выгоды были заданы как объективные возможности в классическом смысле (т.е. основанные на относительной повторяемости). Сэвидж создал теорию, включающую неожиданные субъективные альтернативы, которые тоже могут осуществиться.
Это особенно важно в тех случаях, когда объективная возможность не может быть выбрана в будущем или если альтернатива может быть реализована только однажды. Например, в рамках субъективной теории ожидаемой выгоды имеет смысл учесть возможность неповторимой ситуации, например, мировой атомной войны, поскольку нет возможности принять решение о вероятности атомной войны на основе относительной повторяемости. И наоборот, трудно решить, что значит «притягательность атомной войны» вне контекста классической теории выгоды. (112:)
Другие теоретики интерпретировали классическую теорию выгоды разнообразными способами. Например, Дункан Люс в 1959 году и другие открыли то, что они назвали «опорными» моделями выбора — модели, которые представляют возможности, имеющие основной компонент. До тех пор пока не были открыты «опорные» модели, теоретики выгоды затруднялись объяснить, почему это рационально — предпочитать сегодня суп, а завтра — салат. Люс решил эту проблему следующим образом: он предложил рассматривать предпочтение супа или салата как возможное, а не зафиксированное навсегда.
Дальнейшее развитие теории ожидаемой выгоды было предложено Питером Фишбурном (1984), Юдаром Кармаркаром (1978), Джоном Пейном (1973), Клайдом Кумбсом (1975) и др. Итак, несмотря на то что теория ожидаемой выгоды постоянно обсуждается как единственная и универсальная, общепринятой теории выгоды не существует. Теория ожидаемой выгоды — это целое семейство теорий (хотя это название также относится и к отдельно взятой теории фон Ньюмана и Моргенштерна).
Заключение
Во всестороннем обзоре теории ожидаемой выгоды и ее вариаций Поль Шумахер (1982, с. 529) писал: «Не будет преувеличением считать теорию ожидаемой выгоды основной парадигмой в исследовании принятия решений со времен второй мировой войны». Конечно, она породила больше экспериментов и дискуссий, чем любая другая теория принятия решений. Но, как увидим в следующей главе, существует несколько проблем и парадоксов, понижающих значение классической теории ожидаемой выгоды. Эти проблемы заставили многих исследователей оставить теорию ожидаемой выгоды для поиска более практичных альтернатив.