Учет изопериметрических ограничений

Рассмотрим задачу синтеза оптимального управления системой

учет изопериметрических ограничений - student2.ru

из условия обращения в минимум критерия

учет изопериметрических ограничений - student2.ru

при дополнительных изопериметрических ограничениях

учет изопериметрических ограничений - student2.ru

Как и в дискретном случае, для учета изопериметрических ограни­чений применим метод множителей Лагранжа, сводя исходную за­дачу к задаче минимизации обобщенного критерия

учет изопериметрических ограничений - student2.ru

где учет изопериметрических ограничений - student2.ru —множители Лагранжа ( учет изопериметрических ограничений - student2.ru ) удовлетворяющие при оптимальном управлении системе уравнений

учет изопериметрических ограничений - student2.ru

В соответствии с этим для выявления структуры оптимального уп­равления следует воспользоваться уравнением Беллмана, соответст­вующим обобщенному критерию:

учет изопериметрических ограничений - student2.ru

с граничным условием, принимающим в данном случае вид

учет изопериметрических ограничений - student2.ru

Фактически уравнение (5.91) дает возможность определить за­кон оптимального управления при различных значениях множителей Лагранжа учет изопериметрических ограничений - student2.ru . Для отыскания окончательного решения следует ре­шить систему уравнений (5.90) относительно учет изопериметрических ограничений - student2.ru . При этом сначала необходимо раскрыть зависимости характеристик учет изопериметрических ограничений - student2.ru при оптималь­ном управлении от множителей учет изопериметрических ограничений - student2.ru . Это можно сделать вообще различными способами. Один из них предполагает отыска­ние в общем случае плотности распределения вектора состояния в конечный момент времени с помощью уравнения Колмогорова и по­следующего раскрытия в соответствующей операции математическо­го ожидания. Другой способ заключается в получении уравнения и последующем решении его непосредственно для анализируемой ха­рактеристики учет изопериметрических ограничений - student2.ru . С этой целью обратимся к рекуррентному соотно­шению (5.29). Буквально повторяя рассуждения, используемые при выводе уравнения Беллмана, нетрудно установить, что при осуществлении предельного перехода при учет изопериметрических ограничений - student2.ru из (5.29) получим следующее уравнение в частных производных:

учет изопериметрических ограничений - student2.ru

относительно функции

учет изопериметрических ограничений - student2.ru

с очевидным граничным условием

учет изопериметрических ограничений - student2.ru

Параметры a*(х,t), b*(х,t) представляют собой вектор сноса и матрицы коэффициентов диффузии случайного процесса (5.88) при оптимальном законе управления u(х,t). Функция Rj(х,t) пред­ставляет собой фактически величину учет изопериметрических ограничений - student2.ru , вычисленную при условии, что движение системы (5.88) начинается с момента t из состояния х и происходит при действии оптимального управления u(х,t). По­этому

учет изопериметрических ограничений - student2.ru

Так как закон управления u(х,t), определяемый с помощью урав­нения (5.91), параметрически зависит от набора учет изопериметрических ограничений - student2.ru , то как Rj, так и учет изопериметрических ограничений - student2.ru будут также зависеть от учет изопериметрических ограничений - student2.ru .

Таким образом, решение задачи синтеза при наличии изопери­метрических ограничений сводится к решению уравнения Беллмана (5.91) с целью выявления структуры оптимального управления, решению уравнения (5.92) с использованием уже найденного управле­ния для установления зависимостей учет изопериметрических ограничений - student2.ru от а и последующему реше­нию системы (5.90) относительно учет изопериметрических ограничений - student2.ru .

Задача в общем случае является достаточно сложной. Основная трудность состоит в необходимости совместного решения уравнений (5.91), (5.92). Она легко преодолевается для линейных систем при отсутствии ограничений на вектор управления, когда функции f0, учет изопериметрических ограничений - student2.ru являются квадратичными по своим аргументам. В этом случае задача формулируется следующим образом.

Пусть динамическая система описывается линейным стохастиче­ским уравнением

учет изопериметрических ограничений - student2.ru

где учет изопериметрических ограничений - student2.ru — по-прежнему белый шум с нулевым математическим ожида­нием и матрицей интенсивностей D. Требуется найти оптимальный закон управления системой из условия обращения в минимум кри­терия

учет изопериметрических ограничений - student2.ru

при дополнительных ограничениях

учет изопериметрических ограничений - student2.ru

Предполагается, что матрицы учет изопериметрических ограничений - student2.ru положительно определенные. В соответствии с этим уравнение Беллмана для данной задачи учет изопериметрических ограничений - student2.ru имеет вид

учет изопериметрических ограничений - student2.ru

с граничным условием

учет изопериметрических ограничений - student2.ru

Решение этого уравнения может быть записано в форме

учет изопериметрических ограничений - student2.ru

где Λ(t), c(t) определяются с помощью системы обыкновенных дифференциальных уравнений

учет изопериметрических ограничений - student2.ru

при граничных условиях

учет изопериметрических ограничений - student2.ru

Структура оптимального управления при этом получается ли­нейной

учет изопериметрических ограничений - student2.ru

где матрица L определяется через матрицу Λ:

учет изопериметрических ограничений - student2.ru

Как видно из приведенных соотношений, параметры, формиру­ющие оптимальное уравнение, зависят от набора учет изопериметрических ограничений - student2.ru . Поэтому для окончательного решения необходимо определить этот набор. Для этого обратимся к системе (5.90):

учет изопериметрических ограничений - student2.ru

Установим зависимости учет изопериметрических ограничений - student2.ru . С этой целью раскроем сначала вы­ражение для параметров a*, b*. Получим

учет изопериметрических ограничений - student2.ru

Подставим a*, b* в уравнение (5.92):

учет изопериметрических ограничений - student2.ru

Нетрудно установить, что решение этого уравнения с граничным условием учет изопериметрических ограничений - student2.ru имеет также вид квадратичной формы

учет изопериметрических ограничений - student2.ru

где Λ(t), c(t) зависят лишь от времени. Действительно, подставляя учет изопериметрических ограничений - student2.ru в (5.94), получаем

учет изопериметрических ограничений - student2.ru

Это уравнение выполняется тождественно при любых х, если c j и Λ j удовлетворяют системе

учет изопериметрических ограничений - student2.ru

с граничными условиями

учет изопериметрических ограничений - student2.ru

Представленные соотношения позволяют определить учет изопериметрических ограничений - student2.ru и тем самым установить искомую зависимость учет изопериметрических ограничений - student2.ru . Остается решить систему уравнений (5.93) относительно учет изопериметрических ограничений - student2.ru .

Таким образом, в задаче управления линейной системой с адди­тивным белым шумом при наличии изопериметрических ограничений структура оптимального управления по-прежнему остается ли­нейной. Однако коэффициенты обратной связи теперь уже зависят от статистических свойств возмущения. Эта зависимость проявля­ется через множители Лагранжа учет изопериметрических ограничений - student2.ru , которые являются корнями системы (5.93).

Наши рекомендации