Оптимальное дискретное управление при неполной информации. достаточные координаты

Рассмотрим задачу синтеза оптимального управления системой

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

полагая, что измерению доступен некоторый вектор оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru связанный с оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru соотношением

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

Здесь по-прежнему оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru — вектор состояния; оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru — вектор управле­ния; в i-й момент оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru ; оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru — вектор измерения (наблюдения) в тот же момент; оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru — случайные векторы, характеризующие воз­мущения, действующие на систему, и ошибки измерения соответст­венно. Предполагается, что статистические свойства векторов оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru полностью известны.

В качестве критерия оптимальности примем

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

Основная особенность задачи синтеза оптимального управления при неполной статистической информации заключается в следую­щем. Так как вектор фазовых координат не измеряется, то синтези­руемое оптимальное управление в i-й момент времени оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru должно в общем случае зависеть от всех прошлых и настоящих измерений оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , обозначаемых сокращенно через оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru . Иными словами, оптимальная стратегия управления является некоторой последовательностью функции оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , ставящих в со­ответствие всем прошлым и текущим наблюдениям векторы управ­ления из условия минимума критерия (6.3). Эта оптимальная стратегия может быть найдена с помощью достаточных условий опти­мальности в форме метода динамического программирования. Ос­новное рекуррентное соотношение при этом принимает вид

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

Здесь через оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru обозначена функция будущих потерь, представ­ляющая собой минимальное значение критерия (6.3), которое может быть достигнуто при оптимальном управлении системой (6.1) начиная с момента времени i по наблюдениям (6.2), получен­ным в моменты оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru .

Граничным условием для функции оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , как и при управле­нии при полной информации, может служить равенство

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

Согласно рекуррентной процедуре синтез оптимальных управ­лений должен производиться в следующем порядке

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

Синтез сводится к вычислению на каждом шаге функции буду­щих потерь оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , раскрытию операции математического ожида­ния и оптимизации по оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru правой части основного рекуррентного соотношения. Для раскрытия операции математического ожидания необходимо в свою очередь вычисление условных плотностей оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru . В общем случае эти плотности вычислить очень трудно. Принципиальная трудность заключается в необходи­мости запоминания всех прошлых и настоящих измерений оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru .

Задача значительно облегчается, если предположить существо­вание некоторого вектора оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru , который обычно называется векто­ром достаточных координат (статистик), являющегося функцией от оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru и удовлетворяющего следующим условиям:

1) знание вектора оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru достаточно для определения оптимально­го управления оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru и функции будущих потерь оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru . Это означает, что плотности типа оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru могут быть представлены в виде оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru ;

2) знание вектора оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru в любой момент достаточно для опреде­ления собственной будущей эволюции, т. е. для моментов j>i. В этом случае основное рекуррентное соотношение может быть представлено в виде

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

с прежним граничным условием

оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru

Применение соотношения (6.4) упрощает решение задачи синтеза за счет того, что функция будущих потерь теперь зависит от векто­ра оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru вполне определенной размерности для всех моментов, в то время как размерность совокупности оптимальное дискретное управление при неполной информации. достаточные координаты - student2.ru увеличивается с возраста­нием номера i. С введением понятия достаточных координат исходная задача синтеза оптимального управления при неполной инфор­мации может быть условно разделена на две: определение доста­точных координат и определение оптимального управления как функции достаточных координат. Соответственно оптимальный, регулятор, получаемый в результате решения задачи, состоит и» двух блоков — блока обработки измерительной информации и бло­ка оптимального управления. Строго говоря, синтез обоих блоков необходимо осуществлять совместно. Однако в некоторых случаях, например, для линейной системы с аддитивным возмущением к квадратичным критерием оптимальности оказывается справедли­вой так называемая теорема разделения, согласно которой задача, определения достаточных координат отделяется от задачи синтеза собственно оптимального управления. Эта теорема с успехом мо­жет быть использована для приближенного решения задачи в об­щем случае.

Наши рекомендации