Матричная игра двух лиц с ненулевой постоянной суммой
Конечная игра, в которой сумма выигрышей обоих игроков не равна нулю и постоянна для всех сочетаний их чистых стратегий, называется матричной игрой двух лиц с ненулевой постоянной суммой. Пусть — матрица выигрышей игрока 1 и — матрица выигрышей игрока 2. Причем для всех .
Такого рода игра сводится к игре двух лиц с нулевой суммой следующим образом:
1) каждому игроку выплачивается сумма с/2;
2) решается игра с нулевой суммой с матрицей выигрышей игрока 1, где
Действительно, в игре с преобразованной таким способом матрицей выигрышей игрок 2 получает сумму с/2 – аij для всех i = 1, ..., т; j = 1, ..., п, т.е. новая игра является игрой с нулевой суммой. При этом каждый игрок ничего не теряет от того, что каждый из них в игре получает на с/2 меньше, поскольку по с/2 они получили перед игрой.
Примеры
Пример 1. Выбор стратегии. Матрица некоторой игры имеет вид
Найдите оптимальные стратегии игроков.
Решение. В этой игре игрок 1 имеет три возможные стратегии: а1, а2, а3 из, а игрок 2 — четыре возможные стратегии: b1, b2, b3, b4.
Рассмотрим процесс принятия игроками решения (предполагается, что они действуют рационально). Взглянув на таблицу, можно заметить, что если игрок 1 не знает, как поступит его противник, то, действуя наиболее целесообразно и считая, что противник будет действовать подобным же образом, он выберет стратегию а2, которая гарантирует ему наибольший из трех возможных наименьших выигрышей: 9, 13, 8. Другими словами, игрок 1 руководствуется принципом максиминного выигрыша. Этот выигрыш a = аij есть нижняя цена игры. Для нашего примера a = 13.
Игрок 2 рассуждает аналогично: если он выберет стратегию b1, ,то потеряет самое большее 23, если стратегию b2, то — 40, и т.д. В результате он выберет стратегию b3, которая гарантирует ему наименьший из четырех возможных проигрышей: 23, 40, 13, 25. Принято говорить, что игрок 2 руководствуется принципом минимаксного проигрыша. Этот проигрыш b = аij есть верхняя цена игры. Для нашей матрицы b = 13.
Ситуация (a2, b3) есть седловая точка, и a = b = 13 есть цена игры.
При наличии седловой точки ни одному из участников игры невыгодно отклоняться от своей минимаксной стратегии: он будет наказан противником тем, что получит меньший выигрыш.
Пример 2. Где строить?
Две конкурирующие крупные торговые фирмы Ф1 и Ф2 планируют построить в одном из четырех небольших городов Г1, Г2, Г3 и Г4, лежащих вдоль автомагистрали, по одному универсаму. Взаимное расположение городов, расстояние между ними и численность населения показаны на рис. 1.
Рис. 1
Прибыль каждой фирмы зависит от численности населения городов и степени удаленности универсамов от места жительства потенциальных покупателей. Специально проведенное исследование показало, что прибыль в универсамах будет распределяться между фирмами следующим образом:
Например, если универсам фирмы Ф1 расположен к городу Г1ближе универсама фирмы Ф 2, то прибыль от покупок, сделанных жителями данного города, распределится следующим образом: 75% получит Ф1, остальное — Ф 2.
Представьте описанную ситуацию как игру двух лиц.
В каких городах фирмам целесообразно построить свои универсамы?
Решение. Составим платежную матрицу игры, в которой игроком 1 будет фирма Ф 1, а игроком 2 — фирма Ф2. Стратегии обоих игроков: строить свой универсам в городе Г1, в городе Г2 и т.д. Элементы матрицы — прибыль фирмы Ф1 (в тыс. руб.), которая, как предполагается, пропорциональна (причем с одним и тем же коэффициентом) числу покупателей. Величина указанного коэффициента пропорциональности для выбора оптимального места размещения универсамов значения не имеет, поэтому примем его равным единице.
Платежная матрица имеет вид
Рассмотрим примеры расчета значений элементов (Г1, Г2) и (Г3, Г4) матрицы.
Ситуация (Г1, Г2) означает, что фирма Ф1, строит универсам в городе Г1, а фирма Ф2 — в городе Г2. Число покупателей фирмы Ф1 складывается из покупателей четырех городов. Для ситуации (Г1, Г2) число покупателей из Г1: 0,75×30, из Г2: 0,45×50, из Г30,45×40, из Г4: 0,45×30, т.е. в сумме 76,5 тыс. руб. Для ситуации (Г3, Г4) число покупателей из Г1: 0,75×30, из Г2: 0,75×50, из Г3: 0,75×40, из Г4: 0,45×30, т.е. в сумме 103,5 тыс. руб. Элементы матрицы выигрышей фирмы Ф2 — дополнения до числа 150 (общее число жителей в четырех городах). Таким образом, имеет место игра двух лиц с ненулевой постоянной суммой, оптимальные стратегии которой те же, что и для соответствующей игры с нулевой суммой.
Полученная платежная матрица имеет седловую точку (Г2, Г2). Соответствующий элемент матрицы равен 90.
Таким образом, обеим фирмам следует строить свои универсамы в одном и том же городе Г2, при этом прибыль фирмы Ф1составит 90 тыс., а фирмы Ф2 — 60 тыс. руб.
Пример 3. Двухпальцевая «игра морра».
Каждый игрок показывает один или два пальца и называет число пальцев, которое, по его мнению, показал его противник (ни один из игроков не видит, какое число пальцев на самом деле показывает его противник). Если один из игроков угадывает правильно, он выигрывает сумму, равную сумме числа пальцев, показанных им и его противником. В противном случае (если никто не угадывает) — ничья. Если оба угадали, то игроки платят друг другу одинаковую сумму, в результате также ничья.
Вопросы:
1. Существует ли в данной игре седловая точка в чистых стратегиях?
2. Кто из игроков в среднем выигрывает и сколько?
3. Как часто игрок 1 должен говорить, что его противник показал два пальца?
4. Как часто игрок 2 должен показывать один палец?
Решение. Прежде всего определим стратегии игроков и построим платежную матрицу.
Стратегиями игрока 1 (строки таблицы) являются четыре пары чисел. Первое число каждой пары — это число пальцев, показанное им, второе — число пальцев, которое, как он предполагает, показал его противник. Такие же стратегии имеет игрок 2.
Платежная матрица размером 4 х 4 и другая информация представлены в следующей таблице:
Нижняя цена игры a = –2, верхняя цена игры b = 2.
Как видим, a ¹ b, поэтому седловой точки не существует и решение в чистых стратегиях отсутствует. Для решения данной игры построим соответствующую задачу линейного программирования. Для этого сначала преобразуем платежную матрицу таким образом, чтобы все ее элементы были положительными. Максимальное по абсолютной величине значение неположительного элемента платежной матрицы равно 4, поэтому к матрице достаточно прибавить число 5:
Оптимальная стратегия игрока 1 находится решением следующей задачи линейного программирования [см. (1)]:
Используя пакет POMWIN, исходную информацию для решения этой задачи можно представить в виде следующей таблицы:
Получаем следующий результат:
Решение (в нижней строке):
Оптимальное значение целевой функции равно 0,2.
В последнем столбце — двойственные оценки. Переходя к переменным исходной задачи и учитывая, что v = 1/(x1 + х2 + х3 + х4) = 5 и pi = хi v, получаем:
p1 = 0, р2 = 0,5715, p3 = 0, p4 = 0,4285.
Это означает, что при многократном повторении игры первая стратегия (1, 1) и третья стратегия (2,1) игроком 1 не должны использоваться; вторая стратегия (1,2) должна использоваться с частотой 0,5715, четвертая стратегия (2, 2) — с частотой 0,4285.
Аналогично определяем оптимальную стратегию игрока 2:
т.е. игрок 2 должен использовать лишь свою вторую стратегию (1,2) с частотой 0,5715 и третью стратегию (2, 1) с частотой 0,4285.
Так как исходная матрица была увеличена на 5, получаем, что цена первоначальной игры равна 0 (5 — 5). Таким образом, исход игры — ничья.
Ответы: 1. Нет, не существует. 2. Ничья. 3. Всегда. 4. 0,572.
Пример 4. Доминирование стратегий.
Платежная матрица для двух игроков имеет вид
Преобразуйте игру, исключив доминируемые стратегии.
Решение. Для игрока 1: вторая стратегия (строка 2 матрицы) доминирует четвертую и шестую стратегии, поэтому четвертую и шестую строки можно вычеркнуть. Для игрока 2: третья стратегия (столбец 3) доминирует четвертую, поэтому четвертый столбец можно вычеркнуть, и т.д.
Результирующая матрица имеет вид
Пример 5. Как завоевать рынок?
Два конкурирующих друг с другом предприятия, выпускающие стиральные машины, имеют следующие доли общего сбыта своей продукции на местном рынке: 53% — предприятие 1 и 47% — предприятие 2.
Оба предприятия пытаются увеличить объем своих продаж. Для этого у них есть следующие альтернативы: a1 (b1) — расширить сеть сбыта; a2 (b2) — рекламировать свою продукцию; a3(b3) — увеличить ассортимент (число моделей стиральных машин); a4 (b4) — ничего не предпринимать.
Анализ показал, что при осуществлении обоими предприятиями указанных мероприятий доля (в %) предприятия 1 на рынке стиральных машин изменится следующим образом:
Сформулируйте данную ситуацию в виде игры.
Вопросы:
1. Какое из мероприятий предприятия 1 наиболее эффективно?
2. Какую долю на рынке будет иметь предприятие 1?
3. Какое из мероприятий предприятия 2 наиболее эффективно?
4. С какой частотой следует предприятию 2 использовать стратегию «реклама»?
Решение. Приведенную выше таблицу можно рассматривать как платежную матрицу игры двух лиц с нулевой суммой. Альтернативы, имеющиеся в распоряжении предприятий, — стратегии игроков. Прежде всего следует исключить доминируемые стратегии игроков: 04 игрока 1 и 64 игрока 2. В результате получим
Увеличив все элементы матрицы на 6, решим следующую задачу линейного программирования:
Используя пакет POMWIN, получаем следующий результат:
Переходя к переменным исходной задачи и учитывая, что v = 1/(x1 + x2 + х3) = 3,85 и pi = xiv, получаем: р1 = 0,4, р2 = 0,6, p3 = 0, p4 = 0. Цена игры, соответствующая первоначальной матрице, равна –2,15 (3,85 – 6). Таким образом, предприятие 1 при многократном повторении игры должно использовать с частотой 0,4 стратегию а1 (расширить сеть сбыта), с частотой 0,6 — стратегию a2 (рекламировать свою продукцию), а стратегии a3 (увеличить ассортимент) и a4 (ничего не предпринимать) не использовать вовсе. При этом доля сбыта предприятия на рынке уменьшится на 2,15%. Оптимальная смешанная стратегия предприятия 2: с частотой 0,4 использовать стратегию b1 (расширить сеть сбыта) и с частотой 0,6 — стратегию b3 (увеличить ассортимент). Стратегии a2 (рекламировать свою продукцию) и a4 (ничего не делать) не применять вовсе. Доля предприятия 2 на рынке увеличится на 2,15%. Казалось бы, поскольку в результате осуществления своих мероприятий предприятие 1 «теряет рынок», ему не следует ничего предпринимать, однако в этом случае оно потеряет еще больше (в соответствии со стратегией a4) из-за действий предприятия 2, которому они выгодны.
Ответы: 1. Реклама. 2. 50,85%. 3. Увеличение ассортимента. 4. С нулевой частотой, т.е. стратегия «реклама» предприятием 2 вообще не должна применяться.
Вопросы
Вопрос 1. Нижняя цена матричной игры {aij}m,n определяется следующей формулой:
Вопрос 2. Верхняя цена матричной игры {aij}m,n определяется следующей формулой:
Вопрос 3. Какова верхняя цена следующей игры?
Варианты ответов:
1) 1; 2) 3; 3) 4; 4) 5; 5) 6.
Вопрос 4. Какова нижняя и верхняя цена игры для нижеприведенной матрицы?
Варианты ответов:
1) (-4, 10); 2) (0, 5); 3) (2, 4); 4) (3, 5); 5) (2, 8).
Вопрос 5. Чему равно значение элемента матрицы игры в седловой точке?
Варианты ответов:
1) 6; 2) 8; 3) 15; 4) 25; 5) седловая точка отсутствует.
Вопрос 6. Используя свойство доминирования стратегий игроков, максимально редуцируйте следующую матрицу игры:
Какова размерность результирующей матрицы?
Варианты ответов:
1)1х2; 2)2х1; 3)2х2; 4)3х2; 5)3х3.
Вопрос 7. Найдите цену следующей игры (без использования пакета POMWIN):
Варианты ответов:
1) 1; 2) 1,5; 3) 2; 4) 2,5; 5) 3.
Вопрос 8. Два игрока одновременно и независимо показывают О, 1, 2 или 3 пальца. Игрок, показавший большее число пальцев, платит другому игроку сумму, равную разности чисел пальцев, показанных им и его соперником. Какова цена такой игры?
Варианты ответов:
1) 3; 2) 2; 3) 1; 4) 0; 5) –1.
Вопрос 9. Два игрока одновременно и независимо показывают 1, 2 или 3 пальца. Пусть s — сумма чисел пальцев, показанных обоими противниками. Если s — нечетное, то игрок 1 платит другому игроку сумму s, если же s — четное, эту сумму выплачивает игрок 2. Чему равна цена такой игры?
Варианты ответов:
1) –1; 2) 0; 3) 1; 4) 1,3; 5) 1,7.
Вопрос 10. Постройте платежную матрицу следующей игры.
Игрок 2 прячет в одном из п мест предмет стоимостью сj (j = 1,.... n). Игрок 1 ищет этот предмет в одном из п мест, и если находит, то получает сj, в противном случае получает 0. Пусть п = 4 и вектор стоимости предметов с = (5, 7, 3, 12). Чему равна цена игры?
Варианты ответов:
1) 1,75; 2) 1,57; 3) 1,32; 4) 1,23; 5) 1,12.
Задачи
Задача 1. По требованию рабочих некоторой компании профсоюз ведет с ее руководством переговоры об организации горячих обедов за счет компании. Профсоюз, представляющий интересы рабочих, добивается того, чтобы обед был как можно более качественным и, следовательно, более дорогим. Руководство компании имеет противоположные интересы. В конце концов стороны договорились о следующем. Профсоюз выбирает одну из шести фирм (Ф1 ¸ Ф6), поставляющих горячее питание, а руководство компании — набор блюд из семи возможных вариантов (B1¸ B7). После подписания соглашения профсоюз формирует следующую платежную матрицу, элементы которой представляют стоимость набора блюд:
Определите оптимальные стратегии игроков и цену игры.
Вопросы:
1. Чему равна цена игры?
2. Какая фирма наиболее предпочтительна для профсоюза?
3. Какой набор руководство компании считает наиболее «выгодным»?
4. Чему равна нижняя цена игры?
Задача 2. Известный актер обдумывает, где бы ему провести в текущем году отпуск. Он рассматривает шесть возможных вариантов: Монте-Карло (МК), Гавайские острова (Г), Багамские острова (Б), Канарские острова (К), Сочи (С), озеро Байкал (ОБ). Единственный критерий для выбора места отдыха — это стремление избежать встречи с журналистами, которые могут испортить ему отпуск. Если они «выследят» актера, отдых будет испорчен (полезность равна 0). В противном случае все будет, как запланировано (полезность равна 1). Журналисты могут обнаружить актера с такой вероятностью: в Монте-Карло — 0,34; на Гавайских островах — 0,12; на Багамских островах — 0,16; на Канарских островах — 0,4; в Сочи — 0,5; на озере Байкал — 0,2.
Опишите данную ситуацию как игру двух лиц с нулевой суммой (актер — игрок 1). Вычислите цену игры и определите минимаксные стратегии обоих игроков.
Вопросы:
1. Чему равна максимальная ожидаемая полезность отпуска актера?
2. С какой вероятностью актер поедет в отпуск на Байкал?
3. Чему равна верхняя цена игры?
4. В каком из мест наиболее вероятно будет отдыхать актер?
Задача 3. На «Диком Западе» имела место следующая ситуация. Группа из пяти индейцев взяла в осаду лагерь, охраняемый четырьмя белыми. У лагеря два входа: E1 и Е2. Разведчик белых установил, что перед входом Е1 находится как минимум один индеец, а перед входом Е2 — как минимум два индейца. Остальное распределение неизвестно. Командир осажденных может себя и остальных трех человек распределить по E1 и Е2, причем у каждого входа должен быть как минимум один человек. Предполагается, что численно превосходящая (у каждого входа) группа берет в плен всю группу противника без собственных потерь, в то время как при равенстве сил перед каким-либо входом потерь нет с обеих сторон. В качестве платежа (выигрыша) выступает разность числа пленных.
Определите все чистые стратегии обоих противников. Постройте платежную матрицу, считая игроком 1 обороняющуюся сторону. Редуцируйте матрицу, насколько это возможно, и найдите оптимальные стратегии сторон.
Вопросы:
1. С какой частотой белым следует использовать стратегию: расположить по два человека у каждого входа?
2. Кто больше в среднем захватит пленных — белые или индейцы?
3. Какова абсолютная величина разности числа захваченных обеими сторонами пленных?
4. С какой частотой белым следует использовать стратегию:
расположить у первого входа одного, а у второго — трех человек?
5. С какой частотой индейцам следует использовать стратегию:
расположить у первого входа трех, а у второго — двух воинов?
Задача 4. Имеются два предприятия, которые в дополнение к основной продукции могут выпускать побочную продукцию одного и того же назначения — пластмассовые игрушки. Известно, что они могут продавать ее в одном и том же городе. Игрушки немного отличаются по конструкции, оформлению, удобству и т.д. Первое предприятие может выпускать игрушки типа А1, А2,..., Аm; второе — типа B1, В2,..., Bn. Себестоимость и цена игрушек у всех предприятий одинаковы. Всего в течение года продается N игрушек. Если первое предприятие выпускает игрушки типа Аi, а второе — типа Вj, то первое предприятие продаст rijN игрушек, а второе — (N – rijN). Каждое предприятие стремится получить максимальный доход от продажи игрушек.
Пусть т = 4, п = 5, N= 300 000, цена (равновесная) одной игрушки составляет 20 руб., элементы матрицы {rij}4,5 представлены в таблице:
Сформулируйте игру двух лиц, считая игроком 1 первое предприятие. Определите выигрыш (доход от продажи) каждого предприятия.
Вопросы:
1. Каков общий средний доход первого предприятия?
2. Каков общий средний доход второго предприятия?
3. Какое изделие следует выпускать первому предприятию с наибольшей вероятностью?
4. Какое изделие следует выпускать второму предприятию с наибольшей вероятностью?
5. Какова частота применения стратегии «Выпускать изделие B2»?
Задача 5. Сторона В посылает подводную лодку в один из п регионов. Сторона А, располагая т противолодочными кораблями, стремится обнаружить лодку противника. Сторона B стремится этого избежать. Вероятность обнаружения подводной лодки в j-м регионе одним противолодочным кораблем равна рj (j = 1,..., n).
Предполагается, что обнаружение лодки каждым кораблем является независимым событием. Сторона А может посылать в различные регионы разное количество кораблей (распределение т кораблей по регионам и есть ее стратегия).
Пусть т = 3, п = 2, р1 = 0,4, р2 = 0,6.
Считая сторону А игроком 1, построите игру и найдите оптимальное распределение противолодочных кораблей по регионам.
Вопросы:
1. Каков средний выигрыш стороны А?
2. С какой частотой стороне А следует посылать в регион 2 три противолодочных корабля?
3. С какой частотой стороне А следует посылать в регион 1 один противолодочный корабль?
4. С какой частотой стороне В следует посылать подводную лодку в регион 2?
Ответы и решения
Ответы на вопросы: 1—4, 2 — 5, 3—2, 4 — 4, 5—2, 6—3, 7 — 3, 8—4, 9—2, 10—2.
Задача 1. Решение.
Модель линейного программирования и решение представлены в следующей таблице:
Цена игры v = 1/(0,196 + 0,131) = 3,06.
Вероятности выбора фирм Р = (0,6; 0,4; 0; 0; 0; 0).
Вероятности выбора наборов Q = (0,24; 0; 0,76; 0; 0; 0; 0).
Ответы: 1. 3,06. 2. Ф1. 3. B3 4. 2,3.
Задача 2. Решение.
Матрица игры и решение задачи линейного программирования представлены в следующей таблице:
Цена игры равна 0,96. Частоты использования игроком 1 своих стратегий Р = (0,11; 0,32; 0,24; 0,096; 0,077; 0,19).
Ответы: 1. 0,96. 2. 0,19. 3. 1. 4. На Гавайских островах.
Задача 3. Решение.
Матрица игры имеет вид
После исключения доминируемых стратегий матрица примет вид
После приведения данной матрицы к положительно определенной, решив задачу, получаем: цена исходной игры равна 0, т.е. белые, даже применяя оптимальную стратегию, теряют на одного человека больше (здесь имеет смысл округлить цену игры до ближайшего целого). Другими словами, индейцы берут в плен на одного человека больше.
Оптимальная смешанная стратегия белых: с частотой 0,2 применять стратегию (1, 3) и с частотой 0,8 — стратегию (3, 1). Оптимальная смешанная стратегия индейцев: с частотой 0,4 применять стратегию (1, 4) и с частотой 0,6 — стратегию (3, 2).
Ответы: 1.0. 2. Индейцы. 3.1. 4.0,2. 5.0,6.
Задача 4. Решение.
Данная игра — это игра двух лиц с ненулевой постоянной суммой. Сумма выигрышей обоих игроков при любых сочетаниях стратегий предприятий равна 6 (все числа в матрице выигрышей даны в миллионах). Сведем ее к игре двух лиц с нулевой суммой. Для этого до игры каждому предприятию выплачивается половина постоянной суммы, т.е. 3, а из выигрыша каждого предприятия (из элементов матрицы) вычитается 3. Полученная матрица соответствует игре с нулевой суммой, поэтому достаточно указать в ней только выигрыши одного (первого) предприятия. После необходимых расчетов матрица игры имеет вид
Прибавим к матрице число 3, чтобы все ее элементы были положительными. Матрица задачи и решение показаны в следующей таблице:
Цена преобразованной игры равна 1/0,34 = 2,94.
Оптимальная смешанная стратегия игрока 1 (частоты использования игроком 1 своих стратегий) Р = (0,23; 0,36; 0,41; 0).
Для игрока 2 оптимальная смешанная стратегия Q = (0,43; 0; 0,1; 0,47; 0). Цена исходной игры с нулевой суммой равна —0,06. Поскольку оба игрока получили по 3 млн руб., общий доход первого предприятия составляет 2,94 млн руб., доход второго предприятия равен 3,06 млн руб.
Ответы: 1. 2,94 млн руб. 2. 3,06 млн руб. 3. Изделие А3 4. Изделие B4 5. Частота применения стратегии «Выпускать изделие B2» равна нулю.
Задача 5. Решение.
Стратегии игрока 2: I — послать подводную лодку в регион 1; II — послать подводную лодку в регион 2. Множество стратегий игрока 1: {(0, 3), (1, 2), (2,1), (3, 0)}. Числа в скобках — это количество противолодочных кораблей, посылаемых в каждый из двух регионов.
Вероятность обнаружить подводную лодку в регионе j с помощью k противолодочных кораблей равна (1 – (1 – рj)k). Предположим, что выигрыш игрока 1 равен единице в случае обнаружения подводной лодки и нулю — в противном случае. Тогда матрица игры имеет вид
Элементы матрицы — средние выигрыши игрока 1 в соответствующих ситуациях.
Модель линейного программирования и решение (элементы матрицы увеличены на 1):
Цена игры равна 1/0,62 = 1,61. Цена первоначальной игры равна 1,61 – 1 = =0,61.
Частоты применения стороной А своих стратегий Р = (0; 0,92; 0,08; 0). Сторона В посылает подводную лодку в оба региона с равной вероятностью (0,31×1,61 = 0,5).
Ответы: 1. 0,61, т.е. средний выигрыш равен цене игры.
2. Стороне А не следует посылать в регион 2 три противолодочных корабля.
3. С частотой 0,92.
4. С частотой 0,5.
Глава 11. Нелинейное программирование
Цели
В данной главе описываются оптимизационные задачи нелинейного программирования (НЛП), математические модели которых содержат нелинейные зависимости от переменных. Источники нелинейности относятся в основном к одной из двух категорий:
1) реально существующие и эмпирически наблюдаемые нелинейные соотношения, например: непропорциональные зависимости между объемом производства и затратами; между количеством используемого в производстве компонента и некоторыми показателями качества готовой продукции; между затратами сырья и физическими параметрами (давление, температура и т.п.) соответствующего производственного процесса; между выручкой и объемом реализации и др.;
2) установленные (постулируемые) руководством правила поведения или задаваемые зависимости, например: формулы или правила расчета с потребителями энергии или других видов услуг; эвристические правила определения страховых уровней запаса продукции; гипотезы о характере вероятностного распределения рассматриваемых в модели случайных величин; различного рода договорные условия взаимодействия между партнерами по бизнесу и др.
Решать линейные задачи значительно проще, чем нелинейные, и если линейная модель обеспечивает адекватность реальным ситуациям, то ее и следует использовать. В практике экономического управления модели линейного программирования успешно применялись даже в условиях нелинейности. В одних случаях нелинейность была несущественной и ею можно было пренебречь, в других — производилась линеаризация нелинейных соотношений или применялись специальные приемы, например строились так называемые линейные аппроксимационные модели, благодаря чему достигалась требуемая адекватность. Тем не менее имеется большое число ситуаций, где нелинейность является существенной и ее нужно учитывать в явном виде.
Далее приводятся общая модель задачи нелинейного программирования и классы задач НЛП, а также описываются условия оптимальности решения.
После того как вы выполните задания, предлагаемые в этой главе, вы будете уметь определять и использовать для экономического анализа:
• целевую функцию;
• ограничения;
• допустимый план;
• множество допустимых планов;
• модель нелинейного программирования;
• оптимальный план.
Вы сможете также:
• определять, является ли функция выпуклой;
• строить функцию Лагранжа задачиНЛП;
• проверять оптимальность полученных решений.
Модели
В общем виде задача НЛП описывается с помощью следующей моделинелинейного программирования:
где х = (x1, х2, ..., хn) — вектор переменных задачи.
Задача (1)—(3) называется задачей нелинейного программирования в стандартной форме на максимум.
Может быть сформулирована также задача НЛП на минимум.
Вектор х = (x1, х2, ..., хn), компоненты хj которого удовлетворяют ограничениям (2) и (3), называется допустимым решением или допустимым планом задачиНЛП.
Совокупность всех допустимых планов называется множеством допустимых планов.
Допустимое решение задачи НЛП, на котором целевая функция (1) достигает максимального значения, называется оптимальным решением задачи НЛП.
Возможное местонахождение максимального значения функции F(x) при наличии ограничений (2) и (3) определяется следующим общим принципом. Максимальное значение F(x), если оно существует, может достигаться в одной или более точках, которые могут принадлежать следующим множествам:
— внутренняя точка множества допустимых планов, в которой все первые частные производные
— точка границы множества допустимых планов};
— точка множества допустимых планов, в которой функция F(x) недифференцируема}.
В отличие от задач линейного программирования, любая из которых может быть решена симплекс-методом, не существует одного или нескольких алгоритмов, эффективных для решения любых нелинейных задач. Какой-то алгоритм может оказаться чрезвычайно эффективным для решения задач одного типа и неудачным для задач другого типа.
Эффективность алгоритма может даже существенно зависеть от постановки задачи, например от изменения масштабов измерения тех или иных переменных. Поэтому алгоритмы разрабатываются для каждого класса (типа) задач. Программы, ориентированные на решение определенного класса задач, как правило, не гарантируют правильность решения любых задач данного класса, и оптимальность решения рекомендуется проверять в каждом конкретном случае.
В экономических приложениях рассматриваются следующие классы задач НЛП.
1. Оптимизация нелинейной функции с ограничениями на неотрицательность значений переменных:
F(х) ® mах,
x ³ 0,
где х = (х1, х2,..., хn) — вектор переменных задачи.
Пусть F(x) — дифференцируемая функция.
Необходимые условия того, что в точке х0 достигается максимум функции F(x):
Это означает, что:
и
Если F(x) вогнутая функция (для задачи минимизации — выпуклая), то эти условия являются также достаточными.
Функция F(x) с числовыми значениями, определенная на выпуклом множестве точек К, называется вогнутой, если для любой пары точек х1, х2 и для всех чисел l, 0 £ l £ 1, выполняется неравенство
Если то функция F(x) называется выпуклой. Если имеют место строгие неравенства, то говорят, что функция строго вогнута или строго выпукла.
Данное определение вогнутости (выпуклости) годится для любого типа функции. Практически, однако, применять его трудно.
Для дважды дифференцируемой функции F(x) имеет место следующий критерий. Дифференцируемая функция F(x) строго вогнута в некоторой окрестности точки если выполняются следующие условия:
т.е. если знаки этих определителей чередуются указанным образом.
Здесь — частная производная второго порядка, вычисленная в точке х0.
Матрица размера п ´ п, составленная из элементов , называется матрицей Хессе (Hesse). По значениям ее главных миноров можно судить о выпуклости или вогнутости функции. Функция F(x) строго выпукла в малой окрестности точки х0, если все главные миноры ее матрицы Хессе строго положительны. Если имеют место нестрогие неравенства (³), то функция в окрестности точки х0 выпукла. Если при этом главные миноры матрицы Хессе от х не зависят, то функция всюду (строго) выпукла.
Весьма распространены относящиеся к данному типу модели квадратичного программирования, в которых целевая функция F(x)является квадратичной функцией переменных х1, х2, ..., хn. Существует большое число алгоритмов решения такого типа задач, в которых функция F(x) вогнутая (для задач минимизации — выпуклая).
2. Модели выпуклого программирования. К такого рода моделям относятся задачи НЛП (1)—(3), в которых F(x) — вогнутая (выпуклая) функция, a gi(x) — выпуклые функции. При данных условиях локальный максимум (минимум) является и глобальным.
Пусть F(x) и gi(x), i= 1,..., т, — дифференцируемые функции.
Необходимые и достаточные условия оптимальности решения — выполнение условий Куна — Таккера.
Рассмотрим задачу НЛП (1)—(3) и функцию Лагранжа L (х, l) =
Условия Куна — Таккера оптимальности решения х0 для задачи максимизации F(x) имеют вид
где — частная производная функции Лагранжа по переменной хj при х = х0 и l = l0. Пусть максимальное значение F(x) равно F(x0) = F0. Числа связаны с F0 следующими соотношениями:
Из этих соотношений видно, что числа характеризуют реакцию значения F0 на изменение значения соответствующего bi. Например, если < 0, то при уменьшении bi (в пределах устойчивости