Концепция возмущенно-невозмущенного движения
При решении задачи синтеза оптимального управления нелинейной динамической системой
, , ,
обеспечивающего минимум функционалу
,
часто оказывается возможным указать примерные (достаточно небольшие) области начальных и конечных условий , . В этом случае можно предложить следующий метод приближенного решения задачи. Выберем некоторые наиболее ожидаемые или желаемые точки и . Обозначим через оптимальную программу управления, обеспечивающую перевод из в . Траекторию , соответствующую этой программе, назовем невозмущенным, программным движением. Отклонения начального вектора от , а также неучтенные факторы приведут к отклонению траектории движения. Для математического описания возмущенного движения воспользуемся методом линеаризации. Представим , . Тогда получим уравнения движения в отклонениях
, ,
где , , т.е. матрицы и зависят от программного управления .
Желая приблизить действительное (возмущенное) движение к программному (невозмущенному), поставим задачу выбора такого закона управления , который позволял бы минимизировать некоторую меру возмущенного движения. В качестве такой меры можно принять, например, квадратичный критерий оптимальности
,
где матрицы и выбираются, исходя из анализа конкретных технических условий.
При наличии ограничений, накладываемых на вектор управления, задача может оказаться также очень сложной. Можно ее упростить, заменив критерий оптимальности
,
в котором подбирается так, чтобы удовлетворялось ограничение . Решение задачи для линейной системы с таким функционалом было получено ранее и имеет вид , причем, матрица зависит от . Таким образом, приближенное решение задачи синтеза для исходной системы может быть представлено в виде
.
Оптимальная программа управления и соответствующая траектория могут быть получены известными методами.
ДОСТАТОЧНЫЕ УСЛОВИЯ ОПТИМАЛЬНОСТИ
Теорема Кротова о достаточных условиях
Абсолютного минимума
В предыдущих разделах для решения задач оптимального управления использовались либо необходимые условия оптимальности в форме принципа максимума, либо метод динамического программирования. Рассмотрим достаточные условия оптимальности, знание и проверка которых дает возможность окончательно ответить на вопрос, является ли управление, найденное тем или иным способом, действительно оптимальным.
Пусть на некотором множестве задан функционал , . Введем в рассмотрение множество , включающее , определив на нем функционал , так, чтобы при .
Лемма. Если элемент удовлетворяет условию
,
то имеет место соотношение
.
Доказательство леммы проводится методом от противного. Предположим, что имеется некоторый элемент , что . Но тогда , так как при , что противоречит условию.
Рассмотрим задачу
, , , ,
.
Обозначим через множество пар векторов , , через - множество , удовлетворяющих рассматриваемой динамической системе. Задача заключается в отыскании таких , которые обеспечивают абсолютный минимум функционалу .
Введем в рассмотрение функцию , непрерывную при всех и и обладающую непрерывными частными производными и для всех , кроме конечного числа точек. Построим функции
,
.
Теорема. Для того, чтобы функционал достигал абсолютного минимума на , достаточно существования такой функции , чтобы:
1) почти всюду на ,
2) .
Для доказательства теоремы используем лемму, ывбрав в качестве множество . Под будем понимать множество , не связанных исходными уравнениями и допускающих разрывы функции в конечном числе точек. Определим на функционал:
.
Можно показать, что на множестве функционалы и совпадают. Действительно, при
.
Подставляя в выражение для и учитывая, что непрерывны, получаем
.
Так как на множестве допускаются разрывы функции , то слагаемые можно рассматривать независимо один от другого. Поэтому
.
Если теперь предположить, что и выполняются условия 1 и 2 теоремы, то согласно последнему выражению достигает абсолютного минимума на , а в силу леммы функционал при этом достигает абсолютного минимума на .