Учет изопериметрических ограничений
Рассмотрим задачу синтеза оптимального управления системой
из условия обращения в минимум критерия
при дополнительных изопериметрических ограничениях
Как и в дискретном случае, для учета изопериметрических ограничений применим метод множителей Лагранжа, сводя исходную задачу к задаче минимизации обобщенного критерия
где —множители Лагранжа ( ) удовлетворяющие при оптимальном управлении системе уравнений
В соответствии с этим для выявления структуры оптимального управления следует воспользоваться уравнением Беллмана, соответствующим обобщенному критерию:
с граничным условием, принимающим в данном случае вид
Фактически уравнение (5.91) дает возможность определить закон оптимального управления при различных значениях множителей Лагранжа . Для отыскания окончательного решения следует решить систему уравнений (5.90) относительно . При этом сначала необходимо раскрыть зависимости характеристик при оптимальном управлении от множителей . Это можно сделать вообще различными способами. Один из них предполагает отыскание в общем случае плотности распределения вектора состояния в конечный момент времени с помощью уравнения Колмогорова и последующего раскрытия в соответствующей операции математического ожидания. Другой способ заключается в получении уравнения и последующем решении его непосредственно для анализируемой характеристики . С этой целью обратимся к рекуррентному соотношению (5.29). Буквально повторяя рассуждения, используемые при выводе уравнения Беллмана, нетрудно установить, что при осуществлении предельного перехода при из (5.29) получим следующее уравнение в частных производных:
относительно функции
с очевидным граничным условием
Параметры a*(х,t), b*(х,t) представляют собой вектор сноса и матрицы коэффициентов диффузии случайного процесса (5.88) при оптимальном законе управления u(х,t). Функция Rj(х,t) представляет собой фактически величину , вычисленную при условии, что движение системы (5.88) начинается с момента t из состояния х и происходит при действии оптимального управления u(х,t). Поэтому
Так как закон управления u(х,t), определяемый с помощью уравнения (5.91), параметрически зависит от набора , то как Rj, так и будут также зависеть от .
Таким образом, решение задачи синтеза при наличии изопериметрических ограничений сводится к решению уравнения Беллмана (5.91) с целью выявления структуры оптимального управления, решению уравнения (5.92) с использованием уже найденного управления для установления зависимостей от а и последующему решению системы (5.90) относительно .
Задача в общем случае является достаточно сложной. Основная трудность состоит в необходимости совместного решения уравнений (5.91), (5.92). Она легко преодолевается для линейных систем при отсутствии ограничений на вектор управления, когда функции f0, являются квадратичными по своим аргументам. В этом случае задача формулируется следующим образом.
Пусть динамическая система описывается линейным стохастическим уравнением
где — по-прежнему белый шум с нулевым математическим ожиданием и матрицей интенсивностей D. Требуется найти оптимальный закон управления системой из условия обращения в минимум критерия
при дополнительных ограничениях
Предполагается, что матрицы положительно определенные. В соответствии с этим уравнение Беллмана для данной задачи имеет вид
с граничным условием
Решение этого уравнения может быть записано в форме
где Λ(t), c(t) определяются с помощью системы обыкновенных дифференциальных уравнений
при граничных условиях
Структура оптимального управления при этом получается линейной
где матрица L определяется через матрицу Λ:
Как видно из приведенных соотношений, параметры, формирующие оптимальное уравнение, зависят от набора . Поэтому для окончательного решения необходимо определить этот набор. Для этого обратимся к системе (5.90):
Установим зависимости . С этой целью раскроем сначала выражение для параметров a*, b*. Получим
Подставим a*, b* в уравнение (5.92):
Нетрудно установить, что решение этого уравнения с граничным условием имеет также вид квадратичной формы
где Λ(t), c(t) зависят лишь от времени. Действительно, подставляя в (5.94), получаем
Это уравнение выполняется тождественно при любых х, если c j и Λ j удовлетворяют системе
с граничными условиями
Представленные соотношения позволяют определить и тем самым установить искомую зависимость . Остается решить систему уравнений (5.93) относительно .
Таким образом, в задаче управления линейной системой с аддитивным белым шумом при наличии изопериметрических ограничений структура оптимального управления по-прежнему остается линейной. Однако коэффициенты обратной связи теперь уже зависят от статистических свойств возмущения. Эта зависимость проявляется через множители Лагранжа , которые являются корнями системы (5.93).