Задача оптимизации управляемых процессов
Всюду, где имеется возможность выбора из нескольких альтернатив, возникает проблема нахождения наилучшей в определённом смысле или, как ещё говорят, оптимальной альтернативы. Задача нахождения оптимального управления возникает в системах, характеристики которых меняются во времени. Мы хотим сформулировать математическую постановку соответствующей задачи.
Будем рассматривать системы, состояние которых в любой момент времени однозначно определяется вектором арифметического n-мерного пространства (все компоненты такого вектора являются вещественными числами). Поведение системы во времени описывается функцией , называемой ещё траекторией системы. Независимая переменная t, играющая роль времени, называется аргументом процесса. Если аргумент процесса изменяется на отрезке вещественных (соответственно целых) чисел, то система называется непрерывной (соответственно дискретной или многошаговой).
Предполагается, что управление в системе в каждый момент времени представляет собой вектор арифметического r-мерного пространства . Управляющее воздействие или программа управления моделируется функцией времени .
Обычно постановка задачи содержит ограничения на возможные значения состояния и управления системы в каждый данный момент времени. Для описания таких ограничений введём множество V троек (элементов пространства ), а сами такого рода прямые ограничения запишем в виде
,
или, используя сечение множества V по t, в виде
.
Пара функций , состоящая из траектории системы и соответствующей программы управления, называется процессом. Составляющие процесса не могут быть произвольными функциями времени, а только такими, которые удовлетворяют так называемым уравнениям процесса.
В случае непрерывной системы уравнениями процесса является система дифференциальных уравнений вида
,
или в векторной форме
. (1)
Обычно система (1) рассматривается на промежутке времени
, а условие
, (2)
приравнивающее начальную точку траектории заданному вектору (начальному состоянию), называется начальным условием.
Выбрав управление на промежутке , мы можем подставить его в (1) и получим
, (3)
т.е. систему дифференциальных уравнений относительно вектор-функции , которая вместе с условием (2) образует задачу Коши. Предполагается, что правая часть (3) такова, что эта задача Коши имеет единственное решение (выполнены условия теоремы существования и единственности решения задачи Коши).
В дискретном варианте система уравнений имеет вид
(4)
или в векторной форме
.
Здесь t принимает значения 0,1,…,T–1. Задание программы управления в моменты позволяет, при известных начальных условиях (2), однозначно определить соответствующую траекторию системы. При этом не требуется, как в непрерывном случае, наложения каких-либо ограничений на правые части уравнений (4).
Процесс с кусочно-непрерывной функцией , удовлетворяющий прямым ограничениям для всех t из промежутка [0,T] (в дискретном варианте ), уравнениям процесса (1) ((4) в дискретном варианте), начальным условиям (2) называется допустимым. Множество всех допустимых процессов обозначим через М.
На множестве М задан функционал качества J. Значение этого функционала на данном процессе характеризует качество этого процесса, позволяет сравнивать процессы между собой и выбирать из них наилучший, т.е. оптимальный.
В задачах оптимального управления для непрерывных систем будем рассматривать функционалы качества следующего вида
, (5)
где – заданные функции переменных соответственно. Первое слагаемое (5) оценивает качество процесса на всём промежутке времени, а второе слагаемое–качество конечного состояния. В некоторых задачах оптимального управления конечное состояние должно принимать известное значение (в ограничениях задачи присутствует граничное условие ). В таких задачах функционал качества принимает вид
.
В дискретном варианте функционал качества имеет вид
. (6)
Задача оптимального управления ставится следующим образом. Среди допустимых процессов найти такой, на котором достигает минимума функционал качества.
Такая задача либо имеет точное решение – оптимальный процесс , т.е. такой, что ,
либо она имеет только приближённое решение в виде минимизирующей последовательности допустимых процессов , т.е. такой, что
.
Разумеется, приближенное решение имеет практическое значение при условии, если функционал качества ограничен снизу на множестве допустимых процессов. Условие ограниченности функционала обычно выполняется. Например, функции обычно неотрицательны. В этом случае и функционалы (6) и (7) оба неотрицательны, т.е. ограничены снизу.