О. Критерий ХоджаЛемана.
Этот критерий опирается одновременно на ММ-критерий и критерий Баеса-Лапласа. С помощью параметра n выражается степень доверия к используемому распределений вероятностей. Если доверие велико, то доминирует критерий Баеса-Лапласа, в противном случае ММ-критерий, т.е. мы ищем
eir = {n + (1-n) eir}, 0 £ n £ 1.
Правило выбора, соответствующее критерию Ходжа-Лемана формируется следующим образом:
матрица решений дополняется столбцом, составленным из средних взвешенных (с весом n º const) математическое ожиданиями и наименьшего результата каждой строки (*). Отбираются те варианты решений в строках которого стоит набольшее значение этого столбца.
При n = 1 критерий Ходжа-Лемана переходит в критерий Байеса-Лапласа, а при n = 0 становится минимаксным.
Выбор n субъективен т. к. Степень достоверности какой-либо функции распределения дело тёмное.
Для применения критерия Ходжа-Лемана желательно, чтобы ситуация в которой принимается решение, удовлетворяла свойствам:
1) вероятности появления состояния Fj неизвестны, но некоторые предположения о распределении вероятностей возможны;
2) принятое решение теоретически допускает бесконечно много реализаций;
3) при малых числах реализации допускается некоторый риск.
О. Критерий Гермейера.
Этот критерий ориентирован на величину потерь, т.е. на отрицательные значения всех eij. При этом
eir = eij qj.
Т.к. в хозяйственных задачах преимущественно имеют дело с ценами и затратами, условие eij<0 обычно выполняется. В случае же, когда среди величин eij встречаются и положительные значения, можно перейти к строго отрицательным значениям с помощью преобразования eij - a при подходящем образом подобранном a > 0. При этом оптимальный вариант решения зависит от а.
Правило выбора согласно критерию Гермейера формулируется следующим образом :
матрица решений дополняется ещё одним столбцом содержащим в каждой строке наименьшее произведение имеющегося в ней результата на вероятность соответствующего состояния Fj. Выбираются те варианты в строках которых находится наибольшее значение eij этого столбца.
В каком-то смысле критерий Гермейера обобщает ММ-критерий: в случае равномерного распределения qj = , j = , они становятся идентичными.
Условия его применимости таковы :
1) вероятности появления состояния Fj неизвестны;
2) с появлением тех или иных состояний, отдельно или в комплексе, необходимо считаться;
3) допускается некоторый риск;
4) решение может реализоваться один или несколько раз.
Если функция распределения известна не очень надёжно, а числа реализации малы, то, следуя критерию Гермейера, получают, вообще говоря, неоправданно большой риск.
О. BL (MM) - критерий.
Стремление получить критерии, которые бы лучше приспосабливались к имеющейся ситуации, чем все до сих пор рассмотренные, привело к построению так называемых составных критериев. В качестве примера рассмотрим критерий, полученный путем объединения критериев Байеса-Лапласа и минимакса.
Правило выбора для этого критерия формулируется следующим образом:
матрица решений дополняется еще тремя столбцами. В первом из них записываются математические ожидания каждой из строк, во втором - разность между опорным значением
и наименьшим значением
соответствующей строки. В третьем столбце помещаются разности между наибольшим значением
каждой строки и наибольшим значением той строки, в которой находится значение . Выбираются те варианты, строки которых (при соблюдении приводимых ниже соотношений между элементами второго и третьего столбцов) дают наибольшее математическое ожидание. А именно, соответствующее значение
из второго столбца должно быть или равно некоторому заранее заданному уровню риска . Значение же из третьего столбца должно быть больше значения из второго столбца.
Применение этого критерия обусловлено следующими признаками ситуации, в которой принимается решение:
1) вероятности появления состояний Fj неизвестны, однако имеется некоторая априорная информация в пользу какого-либо определенного распределения;
2) необходимо считаться с появлением различных состояний как по отдельности, так и в комплексе;
3) допускается ограниченный риск;
4) принятое решение реализуется один раз или многократно.
BL(MM)-критерий хорошо приспособлен для построения практических решений прежде всего в области техники и может считаться достаточно надежным. Однако заданные границы риска и, соответственно, оценок риска не учитывает ни число применения решения, ни иную подобную информацию. Влияние субъективного фактора хотя и ослаблено, но не исключено полностью.
Условие
существенно в тех случаях, когда решение реализуется только один или малое число раз. В этих условиях недостаточно ориентироваться на риск, связанный только с невыгодными внешними состояниями и средними значениями. Из-за этого, правда, можно понести некоторые потери в удачных внешних состояниях. При большом числе реализаций это условие перестает быть таким уж важным. Оно даже допускает разумные альтернативы. При этом не известно, однако, четких количественных указаний, в каких случаях это условие следовало бы опускать.
О. Критерий произведений.
eir: = eij
Правило выбора в этом случае формулируется так :
Матрица решений дополняется новым столбцом, содержащим произведения всех результатов каждой строки. Выбираются те варианты, в строках которых находятся наибольшие значения этого столбца.
Применение этого критерия обусловлено следующими обстоятельствами :
1) вероятности появления состояния Fj неизвестны;
2) с появлением каждого из состояний Fj по отдельности необходимо считаться;
3) критерий применим и при малом числе реализаций решения;
4) некоторый риск допускается.
Критерий произведений приспособлен в первую очередь для случаев, когда все eij положительны. Если условие положительности нарушается, то следует выполнять некоторый сдвиг eij + а с некоторой константой а ï eijï. Результат при этом будет, естественно зависеть от а. На практике чаще всего
а := ï eijï+1.
Если же никакая константа не может быть признана имеющей смысл, то критерий произведений не применим.
5о. Пример.
Рассмотрим тот же пример (табл. 1).
Построение оптимального решения для матрицы решений о проверках по критерию Гурвица имеет вид (при С =0.5, в 103):
С eij | (1-С) eij | eir | eir | |||
-20.0 | -22.0 | -25.0 | -12.5 | -10.0 | -22.5 | |
-14.0 | -23.0 | -31.0 | -15.5 | -7.0 | -22.5 | |
-24.0 | -40.0 | -20.0 | -20.0 | -20.0 |
В данном примере у решения имеется поворотная точка относительно весового множителя С : до С = 0.57 в качестве оптимального выбирается Е3, а при больших значениях Е1.
Применение критерия Ходжа-Лемана (q = 0.33, n = 0.5, в 103) :
eij | n | (1-n) eij | eir | eir | |
-22.33 | -25.0 | -11.17 | -12.5 | -23.67 | -23.67 |
-22.67 | -31.0 | -11.34 | -15.5 | -26.84 | |
-21.33 | -40.0 | -10.67 | -20.0 | -30.76 |
Критерий Ходжа-Лемана рекомендует вариант Е1 (полная проверка) так же как и ММ-критерий. Смена рекомендуемого варианта происходит только при n = 0.94. Поэтому равномерное распределение состояний рассматриваемой машины должно распознаваться с очень высокой вероятностью, чтобы его можно было выбрать по большему математическому ожиданию. При этом число реализаций решения всегда остаётся произвольным.
Критерий Гермейера при qj = 0.33 даёт следующий результат (в ):
eir = eijqj | eir | ||||||
-20.0 | -22.0 | -25.0 | -6.67 | -7.33 | -8.33 | -8.33 | -8.33 |
-14.0 | -23.0 | -31.0 | -4.67 | -7.67 | -10.33 | -10.33 | |
-24.0 | -40.0 | -8.0 | -13.33 | -13.33 |
В качестве оптимального выбирается вариант Е1. Сравнение вариантов с помощью величин eir показывает, что способ действия критерия Гермейера является даже более гибким, чем у ММ-критерия.
В таблице, приведенной ниже, решение выбирается в соответствии с BL(MM)-критерием при q1=q2=q3=1/2 (данные в 103).
-20.0 | -22.0 | -25.0 | -23.33 | -20.0 | ||
-14.0 | -23.0 | -31.0 | -22.67 | +6.0 | -14.0 | +6.0 |
-24.0 | -40.0 | -21.33 | +15.0 | +20.0 |
Вариант Е3 (отказ от проверки) принимается этим критерием только тогда, когда риск приближается к . В противном случае оптимальным оказывается Е1. Во многих технических и хозяйственных задачах допустимый риск бывает намного ниже, составляя обычно только незначительный процент от общих затрат. В подобных случаях бывает особенно ценно, если неточное значение распределения вероятностей сказывается не очень сильно. Если при этом оказывается невозможным установить допустимый риск заранее, не зависимо от принимаемого решения, то помочь может вычисление ожидаемого риска . Тогда становится возможным подумать, оправдан ли подобный риск. Такое исследование обычно дается легче.
Результаты применения критерия произведения при а = 41×103 и а = 200×103 имеют вид :
eir = eij | eir | ||||
+21 | +19 | +16 | |||
а=41 | +27 | +18 | +10 | ||
+41 | +17 | +1 | |||
+180 | +178 | +175 | |||
а=200 | +186 | +177 | +169 | ||
+200 | +176 | +160 |
Условие eij > 0 для данной матрицы не выполнимо. Поэтому к элементам матрицы добавляется (по внешнему произволу) сначала а = 41×103, а затем а = 200×103.
Для а = 41×103 оптимальным оказывается вариант Е1, а для а = 200×103 вариант Е3, так что зависимость оптимального варианта от а очевидна.
Часть 2. Теория игр.
КЛАССИФИКАЦИЯ ИГР.
Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, состоянию информации и т.д.
В зависимости от количества игроков различают игры двух и n игроков. Первые из них наиболее изучены. Игры трёх и более игроков менее исследованы из-за возникающих принципиальных трудностей и технических возможностей получения решения. Чем больше игроков - тем больше проблем.
По количеству стратегий игры делятся на конечные и бесконечные. Если в игре все игроки имеют конечное число возможных стратегий, то она называется конечной. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий игра называется бесконечной.
По характеру взаимодействия игры делятся на:
1) бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции;
2) коалиционные (кооперативные) могут вступать в коалиции.
В кооперативных играх коалиции наперёд определены.
По характеру выигрышей игры делятся на: игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю) и игры с ненулевой суммой.
По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, типа дуэлей и др.
Матричная игра это конечная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).
Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.
Биматричная игра это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице выигрыш игрока 2.)
Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.
Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. Доказано, что игры этого класса имеют решения, однако не разработано практически приемлемых методов их нахождения.
Если функция выигрышей является выпуклой, то такая игра называется выпуклой. Для них разработаны приемлемые методы решения, состоящие в отыскании чистой оптимальной стратегии (определённого числа) для одного игрока и вероятностей применения чистых оптимальных стратегий другого игрока. Такая задача решается сравнительно легко.
ГЛАВА 1. МАТРИЧНЫЕ ИГРЫ.