Необходимые условия оптимальности

Получим условия оптимальности, которым должна удов­летворять искомая управляющая последовательность. С этой це­лью интерпретируем сформулированную выше задачу как задачу математического программирования.

Представим критерий (4.2) как некоторую функцию искомого управления

необходимые условия оптимальности - student2.ru

Здесь под и и £ понимаются последовательности необходимые условия оптимальности - student2.ru , необходимые условия оптимальности - student2.ru , записанные для определенности в виде расширенных век­торов необходимые условия оптимальности - student2.ru с размерностями (N+l)m и (N+l)r соответственно. Зависимость функции конеч­ного состояния J от и и необходимые условия оптимальности - student2.ru неявная и проявляется через уравнение (4.1). Формально, задача оптимизации состоит в отыскании среди допустимых такого вектора и, который обращает в минимум кри­терий необходимые условия оптимальности - student2.ru . А это — обычная задача математического программиро­вания. Необходимое условие оптимальности в такой задаче [28] сводится к выполнению условия неотрицательности производной необходимые условия оптимальности - student2.ru в искомой точке и по любому допустимому направлению необходимые условия оптимальности - student2.ru , т. е.

необходимые условия оптимальности - student2.ru

Здесь и в дальнейшем запись необходимые условия оптимальности - student2.ru используется для обозначения градиента скалярной функции J(и) по векторному аргумен­ту и, вычисленного в точке и = а. Под градиентом необходимые условия оптимальности - student2.ru , как из­вестно, понимается вектор (столбец), составленный из первых частных производных функции / по всем аргументам вектора и. В данном случае необходимые условия оптимальности - student2.ru можно представить следующим образом:

необходимые условия оптимальности - student2.ru

где через необходимые условия оптимальности - student2.ru в свою очередь обозначен градиент функции J по отдельному вектору необходимые условия оптимальности - student2.ru .

Поясним теперь термин допустимое направление. Под допусти­мым направлением необходимые условия оптимальности - student2.ru понимается такой вектор, который, будучи добавленным к вектору и, не приведет к нарушению исходных ог­раничений по управлению ни при какой сколь угодно малой вели­чине модуля самого вектора бы. Другими словами, необходимые условия оптимальности - student2.ru считается допустимым, если выполняется условие необходимые условия оптимальности - student2.ru , где под U по­жимается совокупность всех допустимых множеств необходимые условия оптимальности - student2.ru , а необходимые условия оптимальности - student2.ru является достаточно малым неотрицательным числом. Отметим также, что выписывая те или иные частные производные, будем, естественно, полагать, не оговаривая специально, что они существуют.

С представленным здесь условием оптимальности работать трудно в виду того, что в нем используется расширенный вектор управления и, как правило, имеющий очень большую размерность. Преобразуем это условие к более простому виду. С этой целью среди множества допустимых векторов необходимые условия оптимальности - student2.ru рассмотрим лишь те, ко­торые имеют ненулевые компоненты только в один единственный i-й момент. Другими словами, потребуем необходимые условия оптимальности - student2.ru для всех необходимые условия оптимальности - student2.ru , а при необходимые условия оптимальности - student2.ru необходимые условия оптимальности - student2.ru . Тогда условие оптимальности принимает более простой вид, а именно,

необходимые условия оптимальности - student2.ru

для всех допустимых необходимые условия оптимальности - student2.ru т. е. удовлетворяющих условию

необходимые условия оптимальности - student2.ru

Так как соотношение (4.4) справедливо для любого момента необходимые условия оптимальности - student2.ru , товместо одного условия оптимальности получаем це­лую совокупность условий оптимальности вида (4.4). Преимуще­ства этих условий заключаются в том, что в каждом из них участ­вует лишь один вектор управления необходимые условия оптимальности - student2.ru размерности т.

Физический смысл каждого из условий (4.4) заключается в том, что вариация терминального критерия (4.2) за счет вариации уп­равления в i-й момент, вычисленная относительно оптимального управления, есть величина неотрицательная.

Условия оптимальности (4.4) в явном виде пока не связаны с исходной математической моделью. Установим эту связь. С этой целью раскроем производные необходимые условия оптимальности - student2.ru , связав последние с уравнением (4.1). Сначала покажем, каким образом может быть вы­числена производная необходимые условия оптимальности - student2.ru при любом управлении и и любом воз­мущении необходимые условия оптимальности - student2.ru . Для этого продифференцируем функцию J = F(xN+l) по вектору необходимые условия оптимальности - student2.ru с учетом связи (4.1). Можно записать следующую цепочку соотношений:

необходимые условия оптимальности - student2.ru

необходимые условия оптимальности - student2.ru

Здесь через необходимые условия оптимальности - student2.ru обозначены матрицы частных производных функции необходимые условия оптимальности - student2.ru по своим аргументам необходимые условия оптимальности - student2.ru и необходимые условия оптимальности - student2.ru соответст­венно. Причем эти матрицы сформированы по следующему прави­лу: каждый столбец матрицы представляет собой градиент соот­ветствующей компоненты вектор-функции по вектор-аргументу. Вводя формально обозначения

необходимые условия оптимальности - student2.ru

получаем более компактное выражение для производной

необходимые условия оптимальности - student2.ru

Введем теперь в рассмотрение также формально следующую скалярную функцию:

необходимые условия оптимальности - student2.ru

которая представляет собой по сути скалярное произведение век­тора необходимые условия оптимальности - student2.ru , определяемого в соответствии с рекуррентным соотноше­нием (4.5), и вектора необходимые условия оптимальности - student2.ru , являющегося правой частью исходного уравнения (4.1). Функция Нi определяемая согласно (4.7), назы­вается гамильтонианом. Подчеркнём, что в общем случае гамиль­тониан является случайной функцией, так как зависит от возму­щения необходимые условия оптимальности - student2.ru . Как увидим в дальнейшем, гамильтониан является удоб­ной конструкцией при формировании как условий оптимальности, так и реализации различных численных методов оптимизации. Начнем с условий оптимальности. Нетрудно установить, что част­ные производные гамильтониана по своим аргументам имеют сле­дующий вид:

необходимые условия оптимальности - student2.ru

С учетом этого исходные уравнения движения (4.1), а также соотношения (4.5), определяющие вектор необходимые условия оптимальности - student2.ru , могут быть приведе­ны к следующей канонической форме:

необходимые условия оптимальности - student2.ru

Уравнение для вектора необходимые условия оптимальности - student2.ru принято называть сопряженным по отношению к исходному уравнению для вектора необходимые условия оптимальности - student2.ru . Поэтому и сам вектор необходимые условия оптимальности - student2.ru , удовлетворяющий системе (4.8), будем называть сопря­женным вектором. Для его определения при известном управлении необходимо, как это следует из системы (4.8), определить сначала траекторию движения в прямом времени при заданном начальном условии. И только после этого в обратном времени найти сопря­женный вектор с учетом найденной траектории и граничного усло­вия, накладываемого на вектор необходимые условия оптимальности - student2.ru .Необходимо также иметь в виду, что в силу наличия случайного возмущения в правых частях уравнений системы (4.8) сопряженный вектор в общем случае также является случайным.

Если теперь вернуться к выражению (4.6), то с использовани­ем понятия гамильтониана его можно записать в виде

необходимые условия оптимальности - student2.ru

Учитывая, что, как правило, операции дифференцирования и ма­тематического ожидания перестановочны, а, следовательно, имеет место равенство

необходимые условия оптимальности - student2.ru

необходимые условия оптимальности (4.4) окончательно представить в виде следующей системы неравенств:

необходимые условия оптимальности - student2.ru

которые должны выполняться для всех допустимых необходимые условия оптимальности - student2.ru .

Таким образом, необходимые условия оптимальности в задаче программирования управления системой (4.1) с целью достижения минимума критерия (4.2) заключаются в выполнении системы не­равенств (4.10), которые должны быть раскрыты с учетом исход­ной системы уравнений (4.1) и сопряженной системы уравнений (4.5) или, что то же самое, системы (4.8).

В общем случае непосредственное использование этих условий для решения задачи программирования оптимального управления затруднительно. Это связано с неконструктивностью самих усло­вий (4.10), которая проявляется в том, что трудно вообще исполь­зовать систему неравенств для отыскания оптимального решения. Трудности усугубляются, с одной стороны, наличием в этих нера­венствах операции математического ожидания (статистического осреднения по всем случайным факторам) и, с другой стороны, не­обходимостью для каждой конкретной реализации решать крае­вую задачу для системы уравнений (4.1) и (4.5). Оптимальное уп­равление при этом должно в каждой реализации привести к вы­полнению как краевого условия «слева» в начальный момент для системы (4.1), так и краевого условия «справа» в конечный мо­мент для системы (4.5).

Следует еще раз подчеркнуть, что соотношение (4.6) справед­ливо для любого фиксированного (не обязательно оптимального) управления. Поэтому оно может быть успешно использовано при получении оптимального управления с помощью численных мето­дов оптимизации, так как позволяет при фиксированном управле­нии с помощью одного просчета сначала по уравнению (4.1), а за­тем по уравнению (4.6) определить сразу все компоненты необходимые условия оптимальности - student2.ru , необходимые условия оптимальности - student2.ru вектора градиента необходимые условия оптимальности - student2.ru в конкретной реализации. Использование соотношения (4.6) совместно с (4.1) и (4.5) для вычисления составляющих градиента в дальнейшем ради кратно­сти будем называть методом сопряженных систем.

Обсудим теперь наиболее распространенные частные случаи, когда необходимые условия оптимальности могут быть приведены к более конструктивной форме.

1. Ограничения на управление отсутствуют. В этом случае лю­бые векторы необходимые условия оптимальности - student2.ru определяют допустимые направления, в том числе и векторы с одинаковыми модулями, но имеющие противополож­ные знаки. А это значит, что условия (4.10) могут быть выполне­ны лишь в виде строгих равенств

необходимые условия оптимальности - student2.ru

Следует отметить, что к этому случаю приходим также, когда ог­раничения на управления хотя и существуют, но выполняются ав­томатически.

Решение задачи программирования при этом сводится к ис­пользованию условия (4.11) на каждом шаге управления с целью выявления структуры управления и последующего решения систе­мы (4.8) с найденной структурой.

2. Случайные возмущения отсутствуют, необходимые условия оптимальности - student2.ru , необходимые условия оптимальности - student2.ru . Этот случай соответствует управлению детерминальной системой. Формально операция математического ожидания всюду опускает­ся и необходимые условия оптимальности (4.40) принимают вид

необходимые условия оптимальности - student2.ru

где гамильтониан необходимые условия оптимальности - student2.ru и векторы необходимые условия оптимальности - student2.ru , необходимые условия оптимальности - student2.ru являются детерминирован­ными и определяются с помощью следующих соотношений:

необходимые условия оптимальности - student2.ru

Все трудности решения задачи с использованием условий опти­мальности, обсуждаемые раньше при рассмотрении стохастической системы, сохраняются и здесь. Упрощение состоит лишь в том, что, как уже указывалось, операция математического ожидания отсут­ствует ввиду отсутствия самих случайных факторов.

3. Множество допустимых управлений необходимые условия оптимальности - student2.ru выпукло и гамильто­ниан необходимые условия оптимальности - student2.ru является выпуклой по необходимые условия оптимальности - student2.ru функцией. Прежде всего отме­тим, что каждое из условий (4.10) в общем случае может быть ин­терпретировано как необходимое условие минимума математиче­ского ожидания гамильтониана необходимые условия оптимальности - student2.ru по вектору управления необходимые условия оптимальности - student2.ru . Далее можно показать, что в случае выпуклости гамильтониана необходимые условия оптимальности - student2.ru по необходимые условия оптимальности - student2.ru выпуклой будет и функция необходимые условия оптимальности - student2.ru . А известно [31], что в случае выпуклости минимизируемой функции на выпуклом множе­стве минимум является единственным и поэтому необходимые ус­ловия оптимальности будут одновременно и достаточными. Учиты­вая это, каждое условие системы (4.10) в рассматриваемом слу­чае оказывается эквивалентно условию достижения на оптималь­ном управлении математическим ожиданием гамильтониана необходимые условия оптимальности - student2.ru своего минимального по управлению значения. Иными сло­вами, вместо (4.10) можно записать

необходимые условия оптимальности - student2.ru

где через необходимые условия оптимальности - student2.ru , обозначено любое допустимое управление необходимые условия оптимальности - student2.ru , a через необходимые условия оптимальности - student2.ru — искомое оптимальное управление.

Естественно, возможны комбинации обсуждаемых частных слу­чаев и соответственно условий оптимальности. Так, например, в детерминированном случае, т. е. при отсутствии возмущений

( необходимые условия оптимальности - student2.ru ) , и при выпуклости гамильтониана необходимые условия оптимальности - student2.ru по необходимые условия оптимальности - student2.ru необходимые условия оптимальности принимают вид

необходимые условия оптимальности - student2.ru

Заметим, что если при введении обозначений (4.6) вектор необходимые условия оптимальности - student2.ru определить как производную терминальной функции необходимые условия оптимальности - student2.ru по необходимые условия оптимальности - student2.ru с обратным знаком, т. е. в виде

необходимые условия оптимальности - student2.ru

то в силу изменения знака у вектора необходимые условия оптимальности - student2.ru в условиях оптимально­сти (4.10) знак неравенства изменяется также на противополож­ный, и, как следствие, в условиях оптимальности (4.12), (4.13) операция минимума заменяется на операцию максимума. В де­терминированном случае вместо (4.13) будем иметь

необходимые условия оптимальности - student2.ru

Последнее условие оптимальности в литературе обычно именует­ся как принцип максимума i[31] для детерминированных дискрет­ных систем управления или кратко — как дискретный детермини­рованный принцип максимума. По аналогии условие (4.13) можно назвать дискретным детерминированным принципом минимума, а условие оптимальности (4.12)—дискретным стохастическим принципом минимума.

Согласно дискретному стохастическому принципу минимума (4.12) оптимальная программа управления дискретной системой (4.1) при условиях выпуклости необходимые условия оптимальности - student2.ru по необходимые условия оптимальности - student2.ru обеспечивает минимум ма­тематического ожидания гамильтониана на каждом шаге управ­ления. Б дальнейшем увидим, что принцип минимума (максиму­ма) для задач с непрерывным временем справедлив вне предполо­жений о выпуклости гамильтониана. Однако для дискретных задач эти предположения оказываются существенными.

Покажем теперь, что в задаче управления дискретной систе­мой (4.1) с целью минимизации интегротерминального критерия (4.3)

необходимые условия оптимальности - student2.ru

полученные условия оптимальности (4.10) или соответственно (4.11), (4.12) сохраняются. Однако вместо соотношений (4.7) и (4.5), определяющих гамильтониан необходимые условия оптимальности - student2.ru и сопряженный вектор необходимые условия оптимальности - student2.ru , теперь следует использовать следующие соотношения:

необходимые условия оптимальности - student2.ru

Чтобы убедиться в справедливости сказанного, введем, как уже упоминалось, дополнительную переменную необходимые условия оптимальности - student2.ru , определяемую согласно уравнению необходимые условия оптимальности - student2.ru , сводя тем

самым критерий (4.3) к виду (4.2) необходимые условия оптимальности - student2.ru .

Составим для полученной вновь задачи согласно (4.7) гамиль­тониан, обозначив его через необходимые условия оптимальности - student2.ru :

необходимые условия оптимальности - student2.ru

Условие оптимальности для этой задачи имеет вид (4.10) с учетом (4.8) при гамильтониане необходимые условия оптимальности - student2.ru . Согласно (4.8) компонента необходимые условия оптимальности - student2.ru и вектор необходимые условия оптимальности - student2.ru удовлетворяют следующим уравнениям:

необходимые условия оптимальности - student2.ru

необходимые условия оптимальности - student2.ru

Так как необходимые условия оптимальности - student2.ru для всех необходимые условия оптимальности - student2.ru , то гамильтониан необходимые условия оптимальности - student2.ru с точно­стью до составляющей необходимые условия оптимальности - student2.ru совпадает с гамильтонианом необходимые условия оптимальности - student2.ru в (4.14). Поэтому выражению для производной необходимые условия оптимальности - student2.ru , участвующей в условиях оптимальности, можно придать прежний вид (4.9):

необходимые условия оптимальности - student2.ru

несмотря на то, что гамильтониан необходимые условия оптимальности - student2.ru теперь определяется соглас­но (4.14) вместо (4.7). А это и означает, что условия оптимально­сти по форме останутся неизменными.

Наши рекомендации