Теория игр: «игры с природой»
Рассмотрим принципы выбора решений при наличии недостаточной осведомленности относительно условий, в которых осуществляется выбор. Такие ситуации принято называть «играми с природой». Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, обычно называемый игроком. Игрок 2 (природа) сознательно против Игрока 1 не действует. Она выступает как не имеющий конкретной цели субъект и действует случайным образом. Поэтому термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых Игроком 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или с природными стихийными силами).
В терминах «игр с природой» задача принятия решений может быть сформулирована следующим образом.
Пусть известна матрица выигрышей А(n · m). Элемент aij характеризует выигрыш при i-й стратегии игрока и j-й стратегии природы. Столбцы матрицы А будем обозначать К1, К2… Кm и называть ситуациями, строки матрицы А будем обозначать Р1, Р2…Рn и называть стратегиями:
По известной матрице выигрышей А можно построить матрицу рисков R по следующему правилу: Rij = bj – aij, где bj = max (aij).
Задача может быть сформулирована так: на основании матриц выигрышей А и (или) рисков Rи отсутствия информации о будущей ситуации Кj найти разумную стратегию Pj.
Теория статистических решений предлагает несколько критериев оптимальности выбора решений - критерии Вальда, Сэвиджа, Гурвица.
С учетом критерия Вальда природа рассматривается как агрессивно настроенный и сознательно действующий противник. Поэтому следует перестраховаться и, рассчитывая на самый худший вариант получения выигрыша (дохода, прибыли), выбрать лучшее решение. Формально это означает, что в матрице эффективности мы ищем столбец, в котором присутствует самый малый выигрыш. Затем в этом столбце выбираем элемент (строку), которая характеризует стратегию Игрока 1:
С точки зрения Сэвиджа, на выбор стратегии субъектом влияние оказывает не возможность больше выиграть, а возможность много проиграть. Поэтому разумно иметь ввиду возможные проигрыши и выбрать такую стратегию, которая при самом плохом развитии событий (состоянии природы, в котором возможен максимальный ущерб) позволит получить наименьший риск в такой ситуации. Формально на базе матрицы рисков R, ищем столбец с самым большим значением, затем в этом столбце ищем элемент, который определит строку (стратегию Игрока 1):
.
Учет критерия Гурвица позволяет уйти от крайних взглядов на критерии оптимальности в условиях неопределенности и балансировать между безудержным оптимизмом Вальда и крайним пессимизмом Сэвиджа.
Если обратиться к практике управления, то даже классический рискофоб согласится с тем, что деятельность на рынке связана с принятием риска. Какой уровень риска принять, зависит от лица, принимающего решения, и от прибыли, ради которой, собственно, это лицо существует на рынке.
Согласно подходу Гурвица, вводится параметр α, который является уровнем риска, связанным с принимаемым решением:
Видно, что при α = 0 критерий Гурвица переходит в критерий Вальда, а при α = 1 переходит в критерий, называемый безудержным пессимизмом.