Метод множителей Лагранжа

Рассмотрим частный случай общей задачи НЛП.

Предполагая, что сумма ограничений Метод множителей Лагранжа - student2.ru содержит только уравнения, отсутствуют условия неотрицательности переменных и функции Метод множителей Лагранжа - student2.ru , а так же Метод множителей Лагранжа - student2.ru функции непрерывные вместе со своими частными производными (это классическая задача оптимизации):

Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru

Что бы найти решение этой задачи водят набор переменных Метод множителей Лагранжа - student2.ru называются множителями Лагранжа, тогда функция Лагранжа:

Метод множителей Лагранжа - student2.ru

Далее находят все частные производные функции Лагранжа

Метод множителей Лагранжа - student2.ru и Метод множителей Лагранжа - student2.ru

Затем рассматриваем систему Метод множителей Лагранжа - student2.ru уравнений с Метод множителей Лагранжа - student2.ru неизвестными

Метод множителей Лагранжа - student2.ru

Решив систему уравнений получают все точки, в которых функция Метод множителей Лагранжа - student2.ru может иметь экстремальные значения. Дальнейшее исследование найденных точек производят так же, как и в случае безусловного экстремума.

Пример. Найти точки экстремума функции

Метод множителей Лагранжа - student2.ru при условиях

Метод множителей Лагранжа - student2.ru

Метод множителей Лагранжа - student2.ru

Метод множителей Лагранжа - student2.ru

З переменных:

Метод множителей Лагранжа - student2.ru

Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru

Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru

Таким образом, в точке Метод множителей Лагранжа - student2.ru данная функция может иметь условный экстремум

Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru

Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru

Используя вторые частные производные можно показать, что в этой точке функция имеет условный минимум и Метод множителей Лагранжа - student2.ru

Метод множителей Лагранжа можно применять и когда условие связи представляет собой неравенство. Если нужно найти экстремум функции Метод множителей Лагранжа - student2.ru при Метод множителей Лагранжа - student2.ru , то следует сначала найти точки безусловного экстремума функций из уравнений производных Метод множителей Лагранжа - student2.ru .

Затем, среди этих точек отобрать те, координаты которых удовлетворяют условию связи Метод множителей Лагранжа - student2.ru , а так же определить точки, удовл. системе уравнений

Метод множителей Лагранжа - student2.ru Метод множителей Лагранжа - student2.ru

Точки, найденные в результате решения системы вместе с точками определенными на І этапе, а также удовлетворяя условиям Метод множителей Лагранжа - student2.ru подлежат дальнейшему исследованию как и при нахождение безусловного экстремума. Особым классом задач ИО являются задачи выпуклого программирования для которых разработано много эффективных решений.

Задача является задачей выпуклого программирования, если целевая функция будет либо выпуклой, либо вогнутой.

К методам решения задач ВП относят:

· метод Франка - Вульфа;

· метод штрафных функций;

· метод Эрроу – Гурвица;

Эти методы являются градиентными методами и методы использования сепарабельные функции:

· функция Метод множителей Лагранжа - student2.ru

Функция сепарабельная, если она может быть представлена в виде суммы функции, каждая из которых является функцией одной переменной

Метод множителей Лагранжа - student2.ru

Если целевая функция и функции в системе ограничений – сеперабельное то приблизительно решение такой задачи можно найти используя кусочно – линейную аппроксимацию.

Пример: Джек студент – первокурсник, он пришел к выводу, что одна только учеба без ежедневной игры в баскетбол плохо влияет на его умственное, моральное и физическое развитие, поэтому он решил распределить своё время примерно 10 часов для учебы и игры в баскетбол. Привлекательность игрового времени он оценивает в два раза больше чем привлекательность времени затраченного на учебу. Но имея совесть и чувство долга Джек решил что время для игры не превышает времени на учебу, кроме того он заметил что если выполнять все учебные задания, на игру останется не более 4 часов в день. Распределить время так что бы Джек получал максимальное удовольствие от игры и от работы.

х1 – время на игру

х2 – время на учебу

х1 + х2 ≤ 10

х1 ≤ х2

х1 ≤ 4

х1 + х2 + S1 = 10

х1 - х2 + S1 = 0

х1 + S1 = 4

z = 2х1 + х2

Базис z х2 х2 S1 S2 S3 Реш.
z   -1
S1   10 10
S2   -1 0 0
S3   4 4
z -3
S1 -1 10 5
x1 -1 0 -0
S3 -1 4 4
z -1
S1 -2 2 2
x1 4 ∞
x2 -1 4 -4
Базис z х1 х2 S1 S2 S3 Реш.
z
S2 -2
x1
x2 -1

x1 = 4

x2 = 6

z = 14

Задачи ЛП и НЛП решаются за 1 шаг. Такие задачи называются одношаговыми (однотипные). Задачи Дин. Пр. называются многошаговыми – на каждом шаге определяется решение некой частей задачи обусловленной исходной задачей.

Общая постановка задачи ДП. Пусть некоторая физическая система S находится в некотором начальном состоянии S0 Є Sнач. и является управляемой. Благодаря некоторому упр. U данная система переходит из начального состояния S0 в конечное состояние Sкон., Sкон Є Sк.

При этом качестве каждого из управлений U характеризуется соответствующим значением функции W(U).

Задача состоит в том чтобы из множества управлений найти такое, при котором функция W(U) принимает экстремальное значение.

Метод множителей Лагранжа - student2.ru

Решение задач ДП осуществляется по схеме:

Будем считать, что состояние рассматриваемой системы S на каком то k-m шаге, причем k = 1…n определяется совокупностью чисел Х(k) = (x1(k), x2(k), … xn(k)), которые получены в результате реализации управления Uk, обеспечивающего переход системы Sиз состояния Х(k-1) в состояние Х(k).

При этом считается что состояние Х(k) зависит от состояния Х(k-1) и выбранного управления Uk, но не зависит от того каким образом система S перешла в это состояние.

Врез. реализации К-го шага был получен выигрыш состояния зависящий от пред. состояния (Х(k-1)) и уравнения Uk.

Общий вклад при этом будет составлять:

n

F = ∑ Wk (Х(k-1), Uk)

k=1

Решения задач ДП по подобной схеме осуществляется в рамках принципа оптимальности Беллмона.

Формулировка: каково бы не было состояние системы перед очередным шагом надо на следующем шаге выбирать управление так, чтобы выигрыш на данном шаге плюс оптимальный выигрыш на всех последующих шагах был максимален.

Наши рекомендации