Оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности

Рассмотрим задачу синтеза оптимального управления при коррекции движения ЛА. Процесс коррекции опишем линей­ным дискретным стохастическим уравнением с аддитивным возму­щением

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

В отличие от случая управления при полной информации будем считать, что измерению доступен не сам вектор состояния оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru , а не­который вектор оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru , связанный с оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru соотношением

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

где через оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru обозначена случайная ошибка i-го измерения. В каче­стве критерия оптимальности по-прежнему принимаем критерий

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

где оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru — заданные матрицы.

Будем считать, что оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru , оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru — независимые гауссовские случайные векторы с характеристиками

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Определим сначала достаточные координаты в данной задаче. В главе 3 показано, что апостериорная плотность вероятностей вектора оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru по измерениям оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru имеет вид

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Там же показано, что вектор оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru и матрица оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru определяемые в соответствии с (3.42), (3.43), являются соответственно апостериор­ным математическим ожиданием и апостериорной корреляционной матрицей вектора оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru при заданных измерениях. Вектор оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru дает оптимальную в смысле байесовского риска оценку вектора оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru по всем прошлым и настоящим измерениям, матрица оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru характери­зует апостериорные среднеквадратичные отклонения ошибок этой оценки.

Из соотношений (3.42), (3.43) следует, что корреляционная матрица оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru не зависит от конкретных измерений и управлений. Она полностью определяется свойствами системы и канала наблю­дения (через матрицы оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru , оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru ), а также статистическими характе­ристиками оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru возмущений оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru и ошибок измерений оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru и может быть определена заранее. Имея это в виду, можно считать, что плотность вероятностей оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru в любой момент i полностью опре­деляется вектором оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru и может быть представлена в виде оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru . С другой стороны, знание оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru согласно (3.42), (3.43) достаточно и для определения собственной будущей эволюции. Иными словами, вектор оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru является вектором достаточных координат в данной за­даче.

Теперь можно перейти к определению алгоритма оптимального управления. С этой целью преобразуем соотношение для вектора оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru . Представим соотношение (3.43) в следующем виде:

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

и подставим его в уравнение для оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru . Учитывая также (3.42), по­лучим

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

где

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Последнее соотношение может быть приведено также к виду

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

где оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru .

Это соотношение позволяет определить статистические свойства век­тора gj-i. В частности, нетрудно установить, что

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Итак, эволюция вектора достаточных координат может быть опи­сана уравнением

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

причем

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Воспользуемся рекуррентным соотношением (5.7). Примени­тельно к данной задаче оно принимает вид

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Это соотношение с точностью до обозначений совпадает с анало­гичным соотношением для случая управления линейной системой при полной информации. Поэтому совершенно аналогично можно получить следующее выражение для функции будущих потерь:

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

где

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

и для закона оптимального управления

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Граничное условие для рекуррентных соотношений (6.13) полу­чим, рассмотрев последний шаг управления. Так как

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

то, принимая во внимание связь

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

где

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

из основного рекуррентного соотношения находим

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

причем здесь

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Сравнивая полученные соотношения с соотношениями (6.13), за­ключаем, что последние могут быть представлены более компакт­но в виде

оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru

Ранее в гл. 5 было показано, что при аддитивных возмущениях алгоритм оптимального (в смысле квадратичного критерия) управ­ления при полной информации о линейной системе совпадает с алгоритмом оптимального управления соответствующей детерми­нированной системой. Полученное теперь решение формально так­же совпадает с детерминированным. Разница заключается лишь в том, что в алгоритме управления (6.14) вместо вектора фазовых координат оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru выступает вектор достаточных координат оптимальное управление линейной дискретной системой при аддитивных возмущениях и квадратичном критерии оптимальности - student2.ru (век­тор оптимальной оценки), определяемый в свою очередь с помо­щью фильтра Калмана.

Таким образом, в линейных системах с квадратичным критери­ем оптимальности при аддитивных гауссовских возмущениях оптимальный стохастический регулятор представляет собой после­довательное соединение фильтра Калмана для получения вектора достаточных координат (оптимальной оценки) и устройства опти­мального детерминированного управления. Сформулированный результат, известный в литературе также под названием теоремы разделения, находит широкое применение при получении прибли­женного решения нелинейных задач, когда задачу синтеза опти­мального управления при неполной информации разбивают на две — задачу определения оптимальных оценок вектора фазовых координат и задачу определения оптимального управления по пол­ным данным, решаемые независимо друг от друга (по аналогии с линейным случаем). Основанием для этого служит тот факт, что при формировании блока оптимальной оценки добиваются хорошей сходимости оценки к истинному вектору фазовых координат.



Наши рекомендации