Дифференцирование функционалов
Основным инструментом теоретического анализа задач оптимального управления и разработки методов их приближенного решения является способ вычисления производных от входящих в постановку задачи функционалов по управлению
.
На информации о значениях функциональных производных основан переход к улучшенному управлению при выполнении каждой итерации метода последовательной линеаризации.
Существует процедура дифференцирования функционалов, определенных на траекториях управляемой системы, вида:
, (6.9)
, (6.10)
где - заданная достаточно гладкая функция своих аргументов; - заданная точка на .
Функционалы вида (6.9), (6.10) называются дифференцируемыми в смысле Фреше.
Часто встречающиеся в задачах управления движением функционалы вида:
, (6.11)
, (6.12)
не имеют производных Фреше. Они дифференцируемы в некотором специальном смысле - по направлениям в функциональном прострастве (по Гато).
При численном решении задач функционалы, дифференцируемые по Гато, заменяются одним или аппроксимируются с помощью специальных процедур несколькими функционалами, дифференцируемыми по Фреше.
Способ дифференцирования функционалов вида (6.9), (6.10) сводится к расчету по следующим соотношениям.
Элементы матрицы частных производных функционалов Фреше по управляющим воздействиям размерности вычисляются по формуле:
, (6.13)
где - сопряженная матрица размерности частных производных правых частей уравнений (6.1) по управляющим воздействиям; - матрица размерности частных производных функций , входящих в выражения для функционалов, по управляющим воздействиям .
Элементы матрицы сопряженных переменных размерности являются решением сопряженной системы дифференциальных уравнений:
, (6.14)
где - сопряженная матрица размерности частных производных правых частей уравнений (6.1) по фазовым координатам; - матрица размерности .
Для функционалов вида (6.9) , где - сопряженная матрица размерности частных производных функций по фазовым координатам . Система уравнений (6.14) интегрируется справа налево с граничным условием .
Для функционалов вида (6.10) , , а система (6.14) интегрируется справа налево с граничным условием , причем при .
Для функционалов вида
, (6.15)
с помощью которых задаются ограничения на фазовые координаты и режимы движения в любой точке, элементы матрицы функциональных производных и сопряженных переменных вычисляются в соответствии с (6.13) и (6.14), причем .
Система (6.14) интегрируется справа налево с граничным условием , причем при .
Таким образом, для дифференцирования функционалов вида (6.9), (6.10) и (6.15) необходимо проинтегрировать слева направо систему уравнений (6.1) и справа налево сопряженную систему уравнений (6.14), а также провести сложение, вычитание и перемножение матриц в соответствии с приведенными соотношениями.