Задача оптимизации управляемых процессов

Всюду, где имеется возможность выбора из нескольких альтернатив, возникает проблема нахождения наилучшей в определённом смысле или, как ещё говорят, оптимальной альтернативы. Задача нахождения оптимального управления возникает в системах, характеристики которых меняются во времени. Мы хотим сформулировать математическую постановку соответствующей задачи.

Будем рассматривать системы, состояние которых в любой момент времени однозначно определяется вектором Задача оптимизации управляемых процессов - student2.ru арифметического n-мерного пространства Задача оптимизации управляемых процессов - student2.ru (все компоненты такого вектора являются вещественными числами). Поведение системы во времени описывается функцией Задача оптимизации управляемых процессов - student2.ru , называемой ещё траекторией системы. Независимая переменная t, играющая роль времени, называется аргументом процесса. Если аргумент процесса изменяется на отрезке вещественных (соответственно целых) чисел, то система называется непрерывной (соответственно дискретной или многошаговой).

Предполагается, что управление в системе в каждый момент времени представляет собой вектор Задача оптимизации управляемых процессов - student2.ru арифметического r-мерного пространства Задача оптимизации управляемых процессов - student2.ru . Управляющее воздействие или программа управления моделируется функцией времени Задача оптимизации управляемых процессов - student2.ru .

Обычно постановка задачи содержит ограничения на возможные значения состояния и управления системы в каждый данный момент времени. Для описания таких ограничений введём множество V троек Задача оптимизации управляемых процессов - student2.ru (элементов пространства Задача оптимизации управляемых процессов - student2.ru ), а сами такого рода прямые ограничения запишем в виде

Задача оптимизации управляемых процессов - student2.ru ,

или, используя сечение множества V по t, в виде

Задача оптимизации управляемых процессов - student2.ru .

Пара функций Задача оптимизации управляемых процессов - student2.ru , состоящая из траектории системы и соответствующей программы управления, называется процессом. Составляющие процесса не могут быть произвольными функциями времени, а только такими, которые удовлетворяют так называемым уравнениям процесса.

В случае непрерывной системы уравнениями процесса является система дифференциальных уравнений вида

Задача оптимизации управляемых процессов - student2.ru ,

или в векторной форме

Задача оптимизации управляемых процессов - student2.ru . (1)

Обычно система (1) рассматривается на промежутке времени

Задача оптимизации управляемых процессов - student2.ru , а условие

Задача оптимизации управляемых процессов - student2.ru , (2)

приравнивающее начальную точку траектории заданному вектору (начальному состоянию), называется начальным условием.

Выбрав управление Задача оптимизации управляемых процессов - student2.ru на промежутке Задача оптимизации управляемых процессов - student2.ru , мы можем подставить его в (1) и получим

Задача оптимизации управляемых процессов - student2.ru , (3)

т.е. систему дифференциальных уравнений относительно вектор-функции Задача оптимизации управляемых процессов - student2.ru , которая вместе с условием (2) образует задачу Коши. Предполагается, что правая часть (3) такова, что эта задача Коши имеет единственное решение (выполнены условия теоремы существования и единственности решения задачи Коши).

В дискретном варианте система уравнений имеет вид

Задача оптимизации управляемых процессов - student2.ru (4)

или в векторной форме

Задача оптимизации управляемых процессов - student2.ru .

Здесь t принимает значения 0,1,…,T–1. Задание программы управления Задача оптимизации управляемых процессов - student2.ru в моменты Задача оптимизации управляемых процессов - student2.ru позволяет, при известных начальных условиях (2), однозначно определить соответствующую траекторию системы. При этом не требуется, как в непрерывном случае, наложения каких-либо ограничений на правые части уравнений (4).

Процесс Задача оптимизации управляемых процессов - student2.ru с кусочно-непрерывной функцией Задача оптимизации управляемых процессов - student2.ru , удовлетворяющий прямым ограничениям Задача оптимизации управляемых процессов - student2.ru для всех t из промежутка [0,T] (в дискретном варианте Задача оптимизации управляемых процессов - student2.ru ), уравнениям процесса (1) ((4) в дискретном варианте), начальным условиям (2) называется допустимым. Множество всех допустимых процессов обозначим через М.

На множестве М задан функционал качества J. Значение этого функционала Задача оптимизации управляемых процессов - student2.ru на данном процессе характеризует качество этого процесса, позволяет сравнивать процессы между собой и выбирать из них наилучший, т.е. оптимальный.

В задачах оптимального управления для непрерывных систем будем рассматривать функционалы качества следующего вида

Задача оптимизации управляемых процессов - student2.ru , (5)

где Задача оптимизации управляемых процессов - student2.ru – заданные функции Задача оптимизации управляемых процессов - student2.ru переменных соответственно. Первое слагаемое (5) оценивает качество процесса на всём промежутке времени, а второе слагаемое–качество конечного состояния. В некоторых задачах оптимального управления конечное состояние Задача оптимизации управляемых процессов - student2.ru должно принимать известное значение (в ограничениях задачи присутствует граничное условие Задача оптимизации управляемых процессов - student2.ru ). В таких задачах функционал качества принимает вид

Задача оптимизации управляемых процессов - student2.ru .

В дискретном варианте функционал качества имеет вид

Задача оптимизации управляемых процессов - student2.ru . (6)

Задача оптимального управления ставится следующим образом. Среди допустимых процессов найти такой, на котором достигает минимума функционал качества.

Такая задача либо имеет точное решение – оптимальный процесс Задача оптимизации управляемых процессов - student2.ru , т.е. такой, что Задача оптимизации управляемых процессов - student2.ru ,

либо она имеет только приближённое решение в виде минимизирующей последовательности допустимых процессов Задача оптимизации управляемых процессов - student2.ru , Задача оптимизации управляемых процессов - student2.ru т.е. такой, что

Задача оптимизации управляемых процессов - student2.ru .

Разумеется, приближенное решение имеет практическое значение при условии, если функционал качества ограничен снизу на множестве допустимых процессов. Условие ограниченности функционала обычно выполняется. Например, функции Задача оптимизации управляемых процессов - student2.ru обычно неотрицательны. В этом случае и функционалы (6) и (7) оба неотрицательны, т.е. ограничены снизу.

Наши рекомендации