Оптимизация процесса коррекции космического аппарата
Проиллюстрируем применение необходимых условий оптимальности на примере решения задачи оптимизации процесса коррекции космического аппарата с целью минимизации конечной ошибки по какому-либо одному параметру траектории.
Обозначим через х величину конечной ошибки, называемую для краткости промахом; через — промах, прогнозируемый в момент, предшествующий проведению i-й коррекции; через — величину i-ro корректирующего воздействия; через — функцию влияния i-ro корректирующего воздействия на прогнозируемый промах, . Совершенно очевидно, что функция связанна с моментом проведения i-й коррекции и зависит от него. Тогда в качестве математической модели процесса коррекции в первом приближении можно принять скалярное дискретное уравнение
где — случайное возмущение, обусловленное ошибками траекторных измерений и ошибками реализации корректирующего воздействия ; N — число коррекций.
Полагаем, что статистические характеристики случайного возмущения заданы и имеют вид
Считается, что прогнозируемый априори (до совершения каких-либо коррекций) промах, равный по определению величине , известен.
Рассмотрим сначала задачу оптимизации программы проведения коррекций, в которой требуется найти последовательность корректирующих воздействий , обеспечивающую при заданных энергетических возможностях минимум конечного промаха. В качестве критерия оптимальности примем величину второго момента конечного промаха .
Энергетические возможности будем оценивать суммой квадратов всех корректирующих импульсов, считая, что должно иметь место условие
где — заданная величина.
Заметим, что в рассматриваемой задаче ограничения, накладываемые непосредственно на управления , отсутствуют. Учет ограничения на энергетические затраты осуществим с помощью обобщенного метода множителей Лагранжа [28]. Сущность этого метода базируется на известном свойстве, заключающемся в том, что необходимые условия оптимальности исходной задачи при наличии ограничений совпадают с необходимыми условия-ми оптимальности новой задачи, но уже без ограничений. Последняя отличается от исходной задачи лишь критерием оптимальности. В качестве нового (обобщенного) критерия оптимальности выступает функция Лагранжа. Применительно к рассматриваемому примеру таким обобщенным критерием оптимальности является интегротерминальный критерий
где — множитель Лагранжа, . Определение множителя а осуществляется после решения задачи минимизации критерия по при фиксированном из условия
Здесь через обозначено оптимальное решение при фиксированном значении . Для отыскания этого решения обратимся к необходимым условиям оптимальности. Составим согласно (4.14) гамильтониан, соответствующий обобщенному критерию оптимальности:
Так как условия выпуклости по в данном случае выполнены, то имеет место дискретный принцип минимума (4.12). Если бы на управляющие (корректирующие) воздействия накладывались дополнительные ограничения, то операцию минимума в (4.12)
следовало бы раскрывать с учетом этих ограничений. В данном же случае таких ограничений нет. Поэтому для достижения минимума в (4.12) необходимо и достаточно выполнения условия
где через обозначено математическое ожидание сопряженной переменной . Из этого условия получаем связь оптимального управления ,с неизвестным пока множителем Лагранжа а и сопряженной переменной :
Согласно (4.14) находим
откуда следует, что и поэтому , а оптимальное управление выражается через математическое ожидание конечного промаха
Из последнего выражения следует, что при а = 0 задача оказывается вырожденной. Это связано с тем, что = 0 соответствует случаю неограниченных энергетических возможностей. Естественно, что при этом и управление оказывается неограниченным. В этом случае нет необходимости в проведении нескольких коррекций, ибо сразу можно устранить любой ожидаемый промах. Поэтому в дальнейшем будем считать, что >0.
Учитывая полученную структуру управления, на основании исходного уравнения (4.15) с учетом (4.16) нетрудно установить связь ожидаемого промаха c неизвестным пока множителем :
откуда
С учетом последнего соотношения оптимальное управление принимает вид
Это выражение с точностью до константы (множителя ) и дает решение поставленной задачи по определению оптимальной программы проведения коррекций.
Следует отметить, что при заданных статистических свойствах возмущения (4.16) решение задачи оказалось инвариантным по отношению к этому возмущению. Другими словами оно полностью совпадает с решением соответствующей детерминированной задачи, когда считается .
Как уже указывалось, множитель должен быть определен из условия , которое с учетом найденного управления(4.17) легко сводится к квадратному относительно уравнению
Неотрицательный корень этого уравнения равен
причем >0 имеет место лишь при условии .
Учитывая комментарий, сделанный ранее относительно случая =0, последнее условие можно интерпретировать, как условие целесообразности проведения нескольких коррекций (во всяком случае, более одной).
Подставляя найденное значение в (4.17), окончательно получаем оптимальное управление
При решении данной задачи, предполагалось, что моменты проведения коррекций или, что то же самое, коэффициенты заданы. Получив решение при фиксированных и установив зависимость критерия оптимальности от этих коэффициентов, можно поставить задачу и об определении оптимальных моментов проведения коррекции. Эта задача является классической задачей математического программирования и может быть решена соответствующими методами [28].
При решении задачи оптимизации программы проведения корректирующих воздействий полагалось, что в процессе реализации этих воздействий никакая информация использована быть не может. Более типичным случаем является использование при проведении коррекции информации о траекторию измерениях. Оказывается, что в этом случае задачу оптимизации также можно сформулировать как задачу программирования оптимального управления (правда, это будет совсем другая задача), если заранее задаться структурой управления. В качестве примера рассмотрим типичный случай, когда корректирующее воздействие формируется пропорционально величине прогнозируемого промаха:
Знак минус в выражении (4.18) введен для того, чтобы подчеркнуть использование принципа обратной связи в процессе коррекции.
Задачу оптимизации сформулируем следующим образом: найти последовательность коэффициентов , которые с учетом закона коррекции (4.18) и в силу уравнения (4.15) обеспечат минимум терминальному критерию при условии .
Отметим, что последнее условие, как и ранее, учитывает ограничение на энергетику, но в отличие от рассмотренного случая содержит теперь операцию математического ожидания. Дело в том, что в задаче программирования, рассмотренной ранее, любое управление было неслучайно и поэтому ограничение на энергетику носило неслучайный характер. Теперь же управляющее воздействие согласно (4.18) носит случайный характер в силу случайности каждого . Поэтому и ограничения на энергетику также принимают случайный характер. Его учет может быть различным. Можно потребовать выполнения этого условия, например, по вероятности. А можно поступить более просто, заменив левую часть в ограничении соответствующим математическим ожиданием. Именно таким приемом мы и воспользовались. При этом, конечно, следует иметь в виду, что ограничение будет удовлетворяться лишь в среднем.
Для решения задачи перепишем модель процесса коррекции (4.15) с учетом (4.18):
Как и прежде, перейдем к обобщенному критерию оптимальности, который теперь принимает вид
где — также множитель Лагранжа, подлежащий в дальнейшем определению, .
Воспользуемся необходимыми условиями оптимальности. Составим для этого согласно (4.14) гамильтониан.
При оптимальных значениях сопряженная переменная в соответствии с (4.14) удовлетворяет следующему уравнению:
с граничным условием
Так как ограничения на коэффициенты отсутствуют, то согласно (4.11) необходимые условия оптимальности принимают вид
Здесь через обозначен второй момент промаха . В соответствии с уравнением (4.19) может быть определен с помощью уравнения
Так как считается, что априорный промах известен, то имеем следующее граничное (начальное) условие:
Отсюда видно, что зависит от значений коэффициентов лишь в предшествующие моменты j= 1,..., i—1 и не зависит от .
Основная трудность использования условия оптимальности (4.21) состоит в необходимости раскрытия математического ожидания , зависящего от искомого значения . Установим эту зависимость. Используя временно для краткости обозначение
перепишем уравнения (4.19) и (4.20) в виде
На основании этих уравнений можно записать следующее выражение для сопряженной переменной :
Образуем произведение , учитывая, что и произведем статистическое осреднение его:
Теперь учтем, что для любого имеет место соотношение
Получим
Если теперь ввести в рассмотрение параметр , определив его с помощью рекуррентного соотношения
или в развернутом виде
с граничным условием , то выражению (4.22) можно придать следующую компактную форму:
Подставляя его в условие оптимальности (4.21), получаем окончательно уравнение для определения оптимальных значений .
Здесь введено обозначение
Так как в общем случае , то оптимальное значение параметра должно быть равно
С учетом выражений (4.23), (4.24) рекуррентное соотношение для параметра , преобразуется к виду
Таким образом, задача определения оптимальных значений сведена к последовательному применению рекуррентного соотношения (4.25) с учетом (4.23), (4.24). Решение заканчивается определением множителя из условия