Принцип максимума л.с.понтрягина
Допустимые управления
От значительной части недостатков классического вариационного исчисления, возникающих при решении задач с ограниченными управлениями и ограниченными фазовыми координатами, свободен метод, разработанный академиком Л.С.Понтрягиным в 1956-1961 гг. и называемый принципом максимума. Принцип максимума до настоящего времени остается основным инструментом для определения оптимального управления и оптимальных траекторий.
Теоремы принципа максимума относятся к системам, поведение которых можно описать дифференциальными уравнениями:
(9.75) (9.59)
или векторным уравнением
где х = (х1, х2,…,хn) – координаты объекта управления (фазовые координаты) и f = (f1, f2,…,fn) – n-мерные векторы, а u = (u1, u2,…, um) – управления (управляющие воздействия), причем производные от управлений в уравнения (9.75) не входят, t – время.
Будем считать, что вектор управления может принимать свои значения из некоторого множества U. U может быть любым множеством m-мерного евклидового пространства, например оно может состоять из совокупности изолированных точек.
Будем предполагать, что в уравнениях (9.75) функции fi (i = 1:n) непрерывны по всем своим переменным и непрерывно дифференцируемы по переменным хj (j = 1:n).
Каждое из управлений u1,…, um непрерывно для всех рассматриваемых t, за исключением конечного числа моментов, где они могут претерпевать разрывы первого рода (рис. 9.24). Такие управления называются кусочно-непрерывными и они удовлетворяют условию u(t) U.
Рис. 9.24. Форма допустимых управляющих воздействий
Управляющие воздействия могут иметь различный физический характер (напряжение, расход топлива, положение «руля» и т.п.) и реализоваться различными техническими средствами.
Векторное пространство с декартовыми координатами х1, х2,…,хn будем называть фазовым пространством системы (9.75) и обозначать Х. Каждому вектору х в фазовом пространстве соответствует некоторая точка (фазовая точка). Если задан вектор u(t) и начальное условие x(t0) = x0 = ( ), то систему уравнений (9.75) можно решить. Разным вектор-функциям u(t) будут соответствовать различные решения x(t) уравнений (9.75), т.е. выбором вектора u(t) можно управлять движением системы. Решению x(t), t0 ≤ t ≤ t1, в фазовом пространстве Х соответствует некоторая линия, которая называется фазовой траекторией системы.
Предполагается, что на участках непрерывности и в точках разрыва управления могут принимать лишь конечные значения, причем на каждое из управлений могут накладываться дополнительные ограничения вида
(9.76)
или в более общем случае
(9.77)
Ограничения вида (9.76) и (9.77) образуют в пространстве управлений некоторую область допустимых значений управляющих воздействий. В этой области управление u может изменяться монотонно или скачком переходить из одной точки в другую конечное число раз. Управления с бесконечно большим числом переключений считаются недопустимыми (нереализуемыми). Тем не менее, при использовании принципа максимума можно получить оптимальные траектории, для точной реализации которых потребуется бесконечно большая частота переключения управляющего воздействия. В таких случаях ее реализуют приближенно при конечной частоте переключения управляющего воздействия. Движение вдоль таких траекторий, как указано выше, называют скользящим режимом.
Управляющие воздействия в излагаемой формулировке принципа максимума должны быть свободными (независимыми) в том смысле, что нельзя задаваться фиксированным числом разрывов (переключений) или жестко привязывать какие-либо из них к времени и фазовым координатам системы. Таким образом, требование кусочной непрерывности определяет лишь класс допустимых управлений, а не конкретную их форму.
Необходимо отметить, что в отличие от обычных задач вариационного исчисления, где все искомые функции были равноправны, в принципе максимума разделяются фазовые координаты xi и управления. Это разделение удобно в тех случаях, когда ограничения накладываются только на управления, а не на фазовые координаты, т.к. не любые точки фазового пространства являются достижимыми. Бессмысленно, например, требовать, чтобы при напряжении возбуждения двигателя, ограниченного условием , ток возбуждения двигателя за ограниченное время поднялся до единичного значения. Тем более бессмысленно требовать, чтобы ток возбуждения достигал когда-либо значения, большего единицы. В общем случае каждой начальной точке фазового пространства соответствует некоторая область достижимых значений и, наоборот, область, из которой можно попасть в данную точку. Это следует учитывать при постановке задач и не требовать перевода изображающей точки в недостижимую область.