Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца

Задача управления в классическом вариацион­ном исчислении состоит в следующем: среди множества функций времени — фазовых траекторий,— соединяющих две фиксированные точки, соответствующие начальному и конечному моментам времени, требуется выбрать функ­цию, максимизирующую некоторый интеграл от заданной функции, которая зависит от фазовой координаты, скоро­сти изменения фазовой координаты и времени.

При строгой формулировке задачи управления используются следующие понятия: время (момент времени), фазовые координаты, управляющие параметры, уравнения движения, определение конечного момента, целевой функционал.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, u, t)dt + F (x1, t1)

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru= f (x, u, t) – скорость изменения каждой фазовой корд-ты (это ур-я движения)

x (t0) = x0, x (t1) = x1, {u (t)} Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru .

T-время; x(t) – вектор фазовых координат; u(t) –вектор управляющих.параметров; U- допустимое мн-во упр.парам-ров. x (t0) = x0, x (t1) = x1, - нач.и кон.состояния системы. I (…), F (..) и f (…) – заданные непрерывно дифференцируемые функции; t0, x0 – фиксированные параметры; t1 или x1 – фиксированные параметры (либо с помощью уравнения T (x, t) = 0 определяется конечная поверхность).

фазовая траектория {x (t)} = {x (t) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru }

Управление («траектория управления») {u (t)} = {u (t) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru }.

Управлением («траекторией управления») называется функция

{u (t)} = {u (t) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru }. (11.1.7)

U(t)- кусочно-непрерывная функция времени. u (t) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru .

Ω - выпуклое и компактное, инвариантное относительно времени.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru

При решении задач методом Лагранжа вводят множители Лагранжа для каждого ограничения, затем строят Лагранжиан и ищется максимум по исходным переменным и минимум по новым переменным. Принцип максимума - распространение метода множителей Лагранжа на задачи динамической оптимизации (задачи управления). При решении задачи с помощью принципа максимума сначала вводятся n сопряженных переменных y – это динамич.аналоги множителя Лагранжа.

L = J + Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru [f (x, u, t) – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru]dt = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru {I (x, u, t) + y[f (x, u, t) – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru]} + F (x1, t1).

Определяется ф-я Гамильтона H (x, u, y, t) = I (x, u, t) + yf (x, y, t).

Затем отыскиваются функции {u (t)}, {у (t)} и {x (t)}, удовлетворяющие следующим условиям:

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, u, y, t) при всех t, Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru ,

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , x (t0) = x0 (14.1.29)

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru .

Эти условия необходимы для существования локального максимума. Форма искомого решения, т.е. оптимального управления, очень часто может быть найдена непосредственно в результате максимизации гамильтониана.

ДАЛЕЕ ДОКАЗАТЕЛЬНАЯ ЧУШЬ, КОТОРАЯ НЕВНЯТНАЯ И ВРЯД ЛИ НУЖНАЯ

Пример: фиксирован конечный момент времени, а на управляющие параметры не накладываются никакие ограничения. Это задача максимизации при наличии ограничений. Максимизируемое выражение представляет собой целевой функционал

J = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, u, t)dt + F (x1, t1), (1)

Огр-я: f (x, u, t) – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru(t) = 0, Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (2)

Введем вектор-строку новых переменных – по одной переменной для каждого из n ограничений

y (t) = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (3)

Эти сопряженные переменные - динамические эквиваленты множителей Лагранжа. Определим функцию Лагранжа = ф-л плюс скалярное произведение вектора множителей Лагранжа и вектора ограничений. Поскольку ограничения и y(t) определены на всем временном промежутке, то произведение следует определить с помощью знака интеграла.

L = J + Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru [f (x, u, t) – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru]dt = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru {I (x, u, t) + y[f (x, u, t) – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru]} + F (x1, t1). (4)

Седловая точка лагранжиана определяет решение. Точка ({u*(t)}, {y*(t)}) представляет собой седловую точку, если L ({u(t)}, {y*(t)}) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru L ({u*(t)}, {y*(t)}) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru L ({u*(t)}, {y(t)}). (5)

Тогда траектория управления {u*(t)} является решением задачи управления.

Необходимые условия существования седловой точки. Из (4) следует, что переход от сопряженных переменных у (t) к {y (t) + Δy (t)}, где Δy (t) – произвольная непрерывная функция времени, изменит функцию Лагранжа на

ΔL = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru y[f (x, u, t) – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru]dt. (10)

Так как необходимое условие первого порядка для существования минимума L относительно {у (t)} требует, чтобы ΔL = 0, то, согласно основной лемме вариационного исчисления, должны выполняться уравнения движения, т.е.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru =f (x, u, t). (11)

Выведем теперь остальные необходимые условия.

Если в (14.1.4) проинтегрировать по частям выражение у (t) Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (t), то L преобразуется к виду

L = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, y, t) + yf (x, u, t) + Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ruх}dt + F (x1, t1) – [у (t1) x (t1) – у (t0) x (t0)]. (12)

Первые два слагаемых, стоящих под знаком интеграла, являются по определению функцией Гамильтона:

H (x, u, y, t) = I (x, u, t) + yf (x, y, t). (13)

L = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, u, y, t) + Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ruх}dt + F (x1, t1) – [у (t1) x (t1) – у (t0) x (t0)]. (14)

Исследуем результат перехода от ТУ {u (t)} к {u (t) + Δu (t)} и соответствующего перехода с фазовой траектории {x (t)} на фазовую траекторию {x (t) + Δx (t)}. При этом

ΔL = Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (15)

где

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (16)

Так как для существования максимума необходимо, чтобы приращение лагранжиана ΔL обращалось в ноль, и поскольку (15) должно выполняться при любых {Δu (t)}, то

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (17); Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (18); Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (19)

Необходимые условия (17) показывают, что в каждой точке оптимальной траектории функция Гамильтона достигает максимума относительно управляющих параметров. При этом r условий (17) являются условиями существования внутреннего максимума, так как в рассматриваемой задаче не наложено никаких ограничений на значения управляющих параметров. В общем случае, если на значения управляющих параметров наложены некоторые ограничения, условия (17) принимают вид

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, u, y, t) при всех t, Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (14.1.20)

т.е. в точках оптимальной траектории в каждый момент времени функция Гамильтона достигает максимума относительно управляющих параметров. Следовательно, в любой момент времени t из указанного промежутка достигается либо внутренний максимум, при котором, как и в классических задачах математического программирования,

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (21)

либо максимум достигается на границе. В последнем случае, как в нелинейном программировании,

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , (14.1.22)

где n – вектор нормали к границе области Ω.

Необходимые условия (14.1.18) и (14.1.19) представляют собой соответственно ДУ и граничные условия для сопряженных переменных. ДУ показывают, что скорость изменения каждой из сопряженных переменных равняется частной производной функции Гамильтона по соответствующей фазовой координате, взятой со знаком минус. Граничные условия показывают, что конечное значение каждой из сопряженных переменных равно частной производной функции F (x, t) по соответствующей фазовой координате.

Используя функцию Гамильтона, можно представить дифференциальные уравнения для фазовых координат, т.е. уравнения движения, в виде

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (23)

Данные дифференциальные уравнения для фазовых координат и дифференциальные уравнения для сопряженных переменных плюс все граничные условия образуют систему уравнений, называемых каноническими уравнениями

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , x (t0) = x0

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (14.1.24)

Эта система состоит из 2n дифференциальных уравнений, на одну половину которых наложены граничные условия, заданные в начальный момент, а для оставшихся n уравнений граничные условия заданы в конечный момент.

Рассмотрим теперь, как функция Гамильтона изменяется во времени. Так как H = H (x, u, y, t), то

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (14.1.25)

Преобразуем это выражение, используя уравнения движения

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (14.1.26)

Первый член этого выражения равен нулю в точках оптимальной траектории, в силу дифференциального уравнения для сопряженных переменных. Второй член обращается в нуль потому, что либо частная производная равна нулю, если максимум внутренний, либо Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru обращается в нуль, если максимум достигается на границе. Следовательно, в точках оптимальной траектории

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (14.1.27)

В частности, если задача является автономной, т.е. если I (…) и f (…) не зависят явно от времени, то и гамильтониан не зависит явно от времени и, следовательно, функция Гамильтона постоянна во времени в точках оптимальных траекторий, так как dH/dt = 0.

Итак, при решении задачи с помощью принципа максимума сначала вводятся n сопряженных переменных y (t) и определяется функция Гамильтона

H (x, u, y, t) = I (x, u, t) + yf (x, y, t). (14.1.28)

Затем отыскиваются функции {u (t)}, {у (t)} и {x (t)}, удовлетворяющие следующим условиям:

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru (x, u, y, t) при всех t, Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru ,

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , x (t0) = x0 (14.1.29)

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru .

Эти условия необходимы для существования локального максимума. Форма искомого решения, т.е. оптимального управления, очень часто может быть найдена непосредственно в результате максимизации гамильтониана. При этом оптимальные управляющие параметры обычно определяются не как функции времени, а как функции сопряженных переменных. Для того чтобы записать управляющие параметры в виде функций времени, требуется предварительно определить, как зависят от времени сопряженные переменные. Это в свою очередь приводит к необходимости решать двухточечную граничную задачу, представленную каноническими уравнениями с граничными условиями. В этой системе, состоящей из 2n дифференциальных уравнений, для n уравнений заданы конечные граничные условия (относительно сопряженных переменных).

Вопрос 27: основные понятия теории линейного программирования. Теоретические основы симплекс-метода.

Задача ЛП – однокритериальная задача условной (с ограничениями) оптимизации с линейным функционалом и линеными ограничениями. Пример - задачи о фанерном цехе, о составлении рациона, классическая транспортная задача, динамическая задача планирования производства.

Три формы записи задач:

Станд Канонич Общ
(c,x)=>max(x) Ax<=b x>=0 (c,x)=>max(x) Ax=b x>=0 (c,x)=>max(x) Aixi<=bi; Ajxj=bj x>=0

Графический метод решения задач.

Полезные выводы, которые надо сделать на основе графического решения:

1. решение задачи ЛП находится на границе допустимого множества;

2. множеством решений может быть: ø, точка, отрезок, луч, прямая.

3. Если решение достигается, то это присходит в одной крайних точек.

4. В силу конечности крайних точек, задача сводится к их перебору.

5. Хотелось бы от общего перебора перейти к направленному, например, с постоянным улучшением функционала.

Можно предложить геометрические наброски для организации подобного: рассматривать углы между Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru и ребрами. Если нет острого, то крайняя точка – решение.

Во всех случаях задача ЛП сводится к канон по форме записи:

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru ,(1…m)

Все взаимосвязи носят линейный характер. m – количество огр-й, n – количество перем-х, n > m.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , xb – базисные, xs – свободные.

Ab = (a1….am)– базисные столбцы. As = (am+1….an)– свободные столбцы.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru

Если xs = 0, Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru –базисное реш-е. Оно может оказаться недопустимым, если есть отриц.эл-ты.

Т. Если множество допус-х значений задачи ЛП не пусто, то в нем $ хотя бы одно базисное решение.

Т. Множество допустимых базисных решений задачи ЛП совпадает с множеством крайних точек допустимого множества решений этой задачи.

Т. Если задача ЛП имеет решение, то оно достигается хотя бы в одной из крайних точек.

Симплекс метод.

Предполагается, что есть допустимое базисное решение – xb xs (базисные и свободные компоненты).

Abxb+Asxs=b => Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru b. Функционал тоже можно разделить на cb и cs.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru =cx0 + dxs

Dj=(cs- cbAb-1As ) – симплекс разности. f(x)=f(x0) + ∑djxj, т.е..насколько можно увел.ф-л, добавив в базис своб.перем.

Важные выводы:

1. если все симплекс разности £ 0, то значение целевой функции улучшить нельзя, то есть перед нами опт.решение задачи;

2. не базисный столбец aj имеет смысл вводить в базис, если симплекс разность > 0;

3. можно выбирать наибольшую из положительных симплекс разностей dj.

Пусть ar – столбец, который было решено ввести в базис.

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru остальные из свободных переменных останутся свободными (нулевыми). Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru . (все базисные уменьшаются)

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru ® l- одна выкидывается

l – это одна из базисных переменных, индекс той переменной, которая выводится из базиса. То есть берем максимальное xr, только чтобы базисные переменные не стали отрицательными. Соотв-нно одна из них обнулится, ее и убираем.

Значение xl = 0 для этого нового базиса. Сам симплекс метод сводится к следующему:

1. Имеем базисное решение. Для него формируем Ab, As, Cb, Cs, Xb, Xs.

2. Вычисляем симплекс разности. Если все они £ 0, получено решение, конец процедуры. Если нет, вводим в базис столбец ar.

3. Если Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru , то функционал можно увести в +¥, а если нет – Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru .

4. Вычисление нового базисного решения

Вопрос 26. Формулировка задачи Больца. Принцип максимума как распространение метода множителей Лагранжа на решение задачи Больца - student2.ru

5. Переход к 1.

Наши рекомендации