Игры с природой
Антагонистические конфликты в реальной жизни встречаются очень редко за исключением искусственно созданных конфликтных ситуаций в виде спортивных и азартных игр. Однако, часто бывает удобно в задачах принятия решения в условиях неопределенности наделить случайный фактор "разумом" и считать, что он активным образом противодействует достижению поставленной цели. В этом случае возникает антагонистическая игра с некоторым воображаемым противником, которого принято называть "природой". Такая постановка задачи позволяет оценить возможности достижения цели при самых неблагоприятных условиях.
Рассмотрим следующий пример. Пусть у фермера имеется S гектаров пахотных земель, на которых он может выращивать различные культуры K1, K2,..., Kn. Урожайность культур, а соответственно и доход, будут существенным образом зависеть от погодных условий в весенне-летний период.
На основе многолетних наблюдений можно классифицировать возможные для данной местности погодные условия P1, P2,..., Pm и объявить их стратегиями "природы". Определим матрицу выигрышей A={aij} как ожидаемый доход с участка при посадке на нем i-ой культуры и j-ых погодных условиях.
Не исключено, что получившаяся матричная игра будет иметь решение в чистых стратегиях. Это будет означать, что для данной местности существует культура, выращивание которой дает наибольший доход. Действительно, нечто подобное в мире случается, существуют целые страны, выращивающие только рис, или хлопок, или кофе, или цитрусовые и т.п. Россия, к сожалению, почти всюду является зоной рискованного земледелия, поэтому на существование решения игры в чистых стратегиях надеяться не приходится.
Однако, согласно теореме фон.Неймана, всегда будет существовать решение в смешанных стратегиях. Пусть g* –значение игры и (р1*,р2*,..,рm*) оптимальая смешанная стратегия фермера.
Тогда площадь, выделяемая под каждую культуру, будет соответственно равна Si=S∙рi га.
Если "природа" выберет активную (оптимальную с точки зрения игрока В) стратегию, то фермер все равно реализует значение игры. Поскольку "природа" реальным разумом не наделена и не обязательно будет противодействовать фермеру, то не исключено, что будет реализована пассивная стратегия. Естественно, в этом случае доход фермера превысит ожидаемый.
Игры с "природой" могут быть использованы также для решения задач выбора оборудования для предприятия, определения состава научно-исследовательского коллектива, выбора проектов строительства в сейсмоопасной зоне и т.п. В этих играх компоненты оптимальной смешанной стратегии задают уже не просто вероятности выбора, а главным образом пропорции.
В случае, когда при игре с природой необходимо выбрать одно из альтернативных решений, характеризующееся различными исходами (смешение стратегий по логическим или техническим причинам невозможно), то возникает задача принятия решений в условиях неопределенности и риска. Если вероятности исходов не известны, это ситуация неопределенности, при известных вероятностях исходов – ситуация риска.
Рассмотрим сначала правила принятия решений в условиях неопределенности (без использования численных значений вероятностей исходов – правила максимакса, Вальда, Сэвиджа, Лапласа).
Пример 2.7.3. Пусть себестоимость пирожного в нашей кондитерской составляет 7 руб., свеженькое продаем за 13 руб., а невостребованное за день сдаем на свиноферму за 3 руб. Сколько пирожных надо производить в день, если известно лишь, что спрос на них составляет от 1 до 5?
Составим таблицу возможных доходов (табл.2.7.1), расположив построчно наши альтернативы (производить от 1 до 5 пирожных), а в столбцах исходы (продать от 1 до 5), имея в виду, что доход от продажи одного пирожного составляет 6 руб., а потери при не продаже составляют 4 руб.
Таблица 2.7.1 – Доход (прибыль) в день.
Объем производства | Возможные исходы: спрос пирожных в день | Среднее | ||||
–2 | ||||||
–6 | ||||||
–10 |
Правило максимакса – максимизация максимального дохода. В каждой альтернативе найдем исход с максимальной оценкой (в табл.2.7.1 они все находятся в последнем столбце), и выбираем альтернативу, позволяющую получить самый большой доход. В нашем примере это соответствует решению производить 5 пирожных. Данный подход использует азартный карточный игрок (или пан или пропал).
Правило максимина (Вальда)– максимизация минимального дохода. В каждой альтернативе найдем исход с минимальной оценкой (в табл.2.7.1 они все находятся в первом столбце), и выбираем альтернативу, позволяющую максимизировать доход в самых худших для нас исходах. В нашем примере это соответствует решению производить 1 пирожное. Это очень осторожный подход к принятию решений – стратегия крайнего пессимиста.
Правило, основанное на принципе неопределенности Лапласа. В соответствие с этим принципом предполагается, что все исходы равновозможные, поэтому выбирается альтернатива, дающая максимальный средний доход. В нашем примере этому правилу отвечают альтернативы выпускать три или четыре пирожных в день, имеющие средний доход 12 (колонка 6 табл.2.7.1).
Правило минимакса (Сэвиджа) – минимизация максимально возможных потерь. Составим таблицу возможных потерь или упущенной выгоды (табл.2.7.2). Она составляется из таблицы доходов следующим образом:
для каждого исхода (столбца) находится максимальный доход, затем вычисляются максимально возможные потери всех альтернатив данного исхода (из максимального дохода вычитается доход соответствующей альтернативы).
Для каждой альтернативы находятся максимально возможные потери (выделены жирным цветом). Затем выбирается та альтернатива, которой соответствует минимальное значение максимальных потерь. В данном примере этому правилу подходят альтернативы выпускать три или четыре пирожных в день.
Таблица 2.7.2 – Возможные потери в день.