Приемы разработки и выбора управленческих решений в условиях полной неопределенности
Экономическая ситуация уникальна, и решение в условиях неопределенности может приниматься с использованием методов моделирования, основанных на теории игр (теории игр с природой) [16].
Формально изучение игр с природой должно начинаться с построения платежной матрицы, так как это, по существу, наиболее трудоемкий этап подготовки принятия решения. Ошибки в платежной матрице не могут быть компенсированы никакими вычислительными методами и приведут к неверному итоговому результату.
Отличительная особенность игры с природой состоит в том, что в ней сознательно действует только один из участников, в большинстве случаев называемый игроком 1. Игрок 2 (природа) сознательно против игрока 1 не действует, а выступает как не имеющий конкретной цели и случайным образом выбирающий очередные «ходы» партнер по игре. Термин «природа» характеризует некую объективную действительность, которую не следует понимать буквально, хотя вполне могут встретиться ситуации, в которых «игроком» 2 действительно может быть природа (например, обстоятельства, связанные с погодными условиями или природными стихийными силами).
Методы принятия решений в играх с природой зависят от характера неопределенности, точнее, оттого, известны или нет вероятности состояний (стратегий) природы, т.е. имеет ли место ситуация риска или ситуация неопределенности. Ниже будут описаны методы, применяемые в обоих случаях [16].
Рассмотрим организацию и аналитическое представление игры с природой. Пусть игрок 1 имеет т возможных стратегий: A1,A2,…, Ат, ау природы имеется п возможных состояний (стратегий): П1, П2,..., Пп, тогда условия игры с природой задаются матрицей А выигрышей игрока 1:
Платит, естественно, не природа, а некая третья сторона (или совокупность сторон, влияющих на принятие решений игроком 1 и объединенных в понятие «природа»).
Возможен и другой способ задания матрицы игры с природой — не в виде матрицы выигрышей, а в виде так называемой матрицы рисков
R = || rij ||m,n ,или матрицы упущенных возможностей. Величина риска — это размер платы за отсутствие информации о состоянии среды. Матрица R может быть построена непосредственно из условий задачи или на основе матрицы выигрышей А.
Риском rij игрока при использовании им стратегии Ai и при состоянии среды Пj будем называть разность между выигрышем, который игрок получил бы, если бы знал, что состоянием среды будет Пj, и выигрышем, который игрок получит, не имея этой информации.
Зная состояние природы (ее стратегию) Пj, игрок выбирает ту стратегию, при которой его выигрыш максимален, т.е. rij = βj - aij ,где βj = %при заданном j.
Например, для матрицы выигрышей:
β1 = 4, β2 = 8, β3 = 6, β4 = 9.
Согласно введенным определениям rij и βj получаем матрицу рисков:
Независимо от вида матрицы игры требуется выбрать такую стратегию игрока (чистую или смешанную, если последняя имеет смысл), которая была бы наиболее выгодной по сравнению с другими. Необходимо отметить, что в игре с природой понятие смешанной стратегии игрока не всегда правомерно, поскольку его действия могут быть альтернативными, т.е. выбор одной из стратегий отвергает все другие стратегии (например, выбор альтернативных проектов). Прежде всего следует проверить, нет ли среди стратегий игрока мажорируемых (мажорирование — отношение между стратегиями, наличие которого во многих практических случаях дает возможность сократить размеры исходной платежной матрицы игры), и, если таковые имеются, исключить их.
Неопределенность, связанную с отсутствием информации о вероятностях состояний среды (природы), называют «безнадежной» или «дурной». В таких случаях для определения наилучших решений используются следующие критерии: максимакса, Вальда, Сэвиджа, Гурвица.
Применение каждого из перечисленных критериев проиллюстрируем на примере матрицы выигрышей или связанной с ней матрицы рисков.
Выбор стратегии по критерию максимакса.С помощью этого критерия определяется стратегия, максимизирующая максимальные выигрыши для каждого состояния природы. Это критерий крайнего оптимизма. Наилучшим [признается решение, при котором достигается максимальный выигрыш (М):
Нетрудно увидеть, что для матрицы A наилучшим решением будет А1 ,при котором достигается максимальный выигрыш — 9.
Следует отметить, что ситуации, требующие применения такого критерия, в экономике в общем нередки, и пользуются им не только безоглядные оптимисты, но и игроки, поставленные в безвыходное положение, когда они вынуждены руководствоваться принципом «или пан, или пропал».
Выбор решения по критерию Вальда (максиминный критерий). Спозиций данного критерия природа рассматривается как агрессивно настроенный и сознательно действующий противник. Выбирается решение, для которого достигается значение максимального критерия (W):
Для платежной матрицы А нетрудно рассчитать, что:
для первой стратегии (i = 1 ) .
для второй стратегии (i = 2) .
для третьей стратегии (/ =3) .
Тогда
что соответствует второй стратегии А2 игрока 1 .
В соответствии с критерием Вальда из всех самых неудачных результатов выбирается лучший (W = 3). Это перестраховочная позиция крайнего пессимизма, рассчитанная на худший случай. Такая стратегия приемлема, например, в случаях, когда игрок не столь заинтересован в крупной удаче, но хочет себя застраховать от неожиданных проигрышей. Выбор такой стратегии определяется отношением игрока к риску.
Выбор решения по критерию Сэвиджа (минимаксный критерий).Выбор стратегии аналогичен выбору стратегии по принципу Вальда с тем отличием, что игрок руководствуется не матрицей выигрышей/4, а матрицей рисков R:
Для матрицы R нетрудно рассчитать, что:
для первой стратегии (i = 1 ) .
для второй стратегии (i = 2 ) .
для третьей стратегии (i = 3) .
Минимально возможный из самых крупных рисков, равный 4, достигается при использовании первой стратегии А1.
Выбор решения по критерию Гурвица (критерий пессимизма-оптимизма).Этот критерий при выборе решения рекомендует руководствоваться некоторым средним результатом, характеризующим состояние между крайним пессимизмом и безудержным оптимизмом. Согласно этому критерию стратегия в матрице А выбирается в соответствии со значением:
где НА — критерий пессимизма-оптимизма применительно к матрице А;
р — коэффициент пессимизма (0 < p < 1).
При p = 0 критерий Гурвица совпадает c максимаксным критерием, а при р = 1 — с критерием Вальда. Покажем процедуру применения данного критерия для матрицы А при p = 0,5:
для первой стратегии (i = 1) = 0,5(1+9) = 5;
для второй стратегии (i = 2) = 0,5(3+8) = 5,5;
для третьей стратегии (i = 3) = 0,5(2+6) = 4;
Тогда:
т.е. оптимальна вторая стратегия А2.
Применительно к матрице рисков R критерий пессимизма-оптимизма Гурвица имеет вид:
где HR — критерий пессимизма-оптимизма применительно к матрице А.
При p = 0 выбор стратегии игрока 1 осуществляется по условию наи-
меньшего из всех возможных рисков ; при p = 1 — по критерию
минимаксного риска Сэвиджа.
В случае, когда по принятому критерию рекомендуется к использованию несколько стратегий, выбор между ними может делаться по дополнительному критерию. Например, в расчет могут приниматься средние квадратичные отклонения от средних выигрышей при каждой стратегии. Еще раз подчеркнем, что стандартного подхода здесь нет. Выбор может зависеть даже от склонности к риску ЛПР[16].
Таким образом, в случае отсутствия информации о вероятностях состояний среды теория не дает однозначных и математически строгих рекомендаций по выбору критериев принятия решений. Это объясняется в большей мере не слабостью теории, а неопределенностью самой ситуации. Единственный разумный выход в подобных случаях — попытаться получить дополнительную информацию, например, путем проведения исследований или экспериментов.
В отсутствие дополнительной информации принимаемые решения теоретически недостаточно обоснованы и в значительной мере субъективны. Хотя применение математических методов в играх с природой не дает абсолютно достоверного результата и последний в определенной степени субъективен (вследствие произвольности выбора критерия принятия решения), оно, тем не менее, создает некоторое упорядочение имеющихся в распоряжении руководителя данных: задаются множество состояний природы, определяются альтернативные решения, выигрыши и потери при различных сочетаниях состояния «среда — решение». Такое упорядочение представлений о проблеме само по себе способствует повышению качества принимаемых решений [16, 52].