Дифференцирование функционалов
Основным инструментом теоретического анализа задач оптимального управления и разработки методов их приближенного решения является способ вычисления производных от входящих в постановку задачи функционалов по управлению
.
На информации о значениях функциональных производных основан переход к улучшенному управлению при выполнении каждой итерации метода последовательной линеаризации.
Существует процедура дифференцирования функционалов, определенных на траекториях управляемой системы, вида:
, (6.9)
, (6.10)
где - заданная достаточно гладкая функция своих аргументов;
- заданная точка на
.
Функционалы вида (6.9), (6.10) называются дифференцируемыми в смысле Фреше.
Часто встречающиеся в задачах управления движением функционалы вида:
, (6.11)
, (6.12)
не имеют производных Фреше. Они дифференцируемы в некотором специальном смысле - по направлениям в функциональном прострастве (по Гато).
При численном решении задач функционалы, дифференцируемые по Гато, заменяются одним или аппроксимируются с помощью специальных процедур несколькими функционалами, дифференцируемыми по Фреше.
Способ дифференцирования функционалов вида (6.9), (6.10) сводится к расчету по следующим соотношениям.
Элементы матрицы частных производных
функционалов Фреше по
управляющим воздействиям размерности
вычисляются по формуле:
, (6.13)
где - сопряженная матрица размерности
частных производных правых частей уравнений (6.1) по управляющим воздействиям;
- матрица размерности
частных производных функций
, входящих в выражения для функционалов, по управляющим воздействиям
.
Элементы матрицы сопряженных переменных размерности
являются решением сопряженной системы дифференциальных уравнений:
, (6.14)
где - сопряженная матрица размерности
частных производных правых частей уравнений (6.1) по фазовым координатам;
- матрица размерности
.
Для функционалов вида (6.9) , где
- сопряженная матрица размерности
частных производных функций
по фазовым координатам
. Система уравнений (6.14) интегрируется справа налево с граничным условием
.
Для функционалов вида (6.10) ,
, а система (6.14) интегрируется справа налево с граничным условием
, причем
при
.
Для функционалов вида
, (6.15)
с помощью которых задаются ограничения на фазовые координаты и режимы движения в любой точке, элементы матрицы функциональных производных и сопряженных переменных вычисляются в соответствии с (6.13) и (6.14), причем .
Система (6.14) интегрируется справа налево с граничным условием , причем
при
.
Таким образом, для дифференцирования функционалов вида (6.9), (6.10) и (6.15) необходимо проинтегрировать слева направо систему уравнений (6.1) и справа налево сопряженную систему уравнений (6.14), а также провести сложение, вычитание и перемножение матриц в соответствии с приведенными соотношениями.