Со свободным правым концом
Рассмотрим задачу со свободным правым концом (рис. 3.2).
Пусть процесс описывается системой уравнений
, , (3.4)
где – n-мерный вектор состояния – r-мерный вектор управляющих воздействий. Заданы начальные условия . Правый конец траектории свободен.
Рис. 3.2. Графическая иллюстрация задачи со свободным правым концом
Управление u определено в допустимой области, .
Необходимоопределить вектор управления , обеспечивающий минимум функционала
, (3.5)
где .
Решение задачи можно построить просто, если найти некоторую функцию, тесно связанную с функционалом Jи динамикой процесса. Условия минимума функционала Jследуют из условия максимума функции Гамильтона Н, характеризующей сумму кинетической и потенциальной энергии и выражающейся в виде скалярного произведения вектора количества движения на вектор координат системы
, (3.6)
где – вектор количества движения.
Вектор количества движения определяется как решение дифференциального уравнения.
, (3.7)
при конечном условии
,
где – постоянные, входящие в функционал J.
Дифференцирование гамильтониана H по дает
,
а по
. (3.8)
Из уравнений (3.4), (3.7), (3.8)можно получить уравнения в канонической форме Гамильтона
, (3.9)
, , (3.10)
которые должны интегрироваться при условиях:
, .
Принцип максимума: если управление доставляет минимум функционалу J, то необходимо существование такой ненулевой непрерывной вектор-функции , что управление удовлетворяет условию
.
Таким образом, 2n уравнений (3.4) и (3.10) с 2n неизвестными и и условие дают решение задачи.
Для решения задачи о минимуме функционала (3.5) при дифференциальных связях (3.4) необходимо:
1. Составить функцию .
2. Определить сопряженную систему уравнений с конечными условиями .
3. Проинтегрировать исходную (3.4) и сопряженную (3.10) системы уравнений.
4. Составить условие максимума функции Н, из которого определить оптимальное управление
Заметим, что для исходной системы уравнений (3.4) заданы начальные условия при ,, а для сопряженной системы (3.10) заданы конечные условия в конце интервала , . Поэтому процесс вычисления оптимального управления можно вести от начала интервала к концу или же, наоборот, от конца к началу. В первом случае, зная переменные состояния в начале интервала, задаются произвольно значениями переменных при .
При вычислении от конца интервала к началу, где известны задаются значения переменных . Если при расчете значения переменных (в первом случае) не совпадут с заданными в конце интервала , то процесс вычисления повторяют уже при других значениях до тех пор, пока расчетные значения в конце интервала не совпадут с заданными с требуемой точностью вычислений. Аналогично поступает при расчете управления от конца к началу.
Решение задачи оптимального управления с использованиемпринципа максимума проводится численно с помощью ЭВМ.