Фильтр Калмана алгоритм оценивания линейный байесовский
Рассмотрим постановку байесовской задачи оценивания для линейных моделей динамической системы и измерений. Пусть дискретная модель динамической системы имеет вид
где —я-мерный вектор состояния системы; и—m-мерный вектор управления;
-мерный вектор случайных возмущений;
— матрицы размерностей п×п и п×т соответственно с элементами, зависящими в общем случае от номера i.
В общем случае в число компонент вектора состояния системы (3.13) входят, помимо компонент, характеризующих ее положение и скорость (например, координаты и скорость летательного аппарата), составляющие возмущений. Эти возмущения в общем случае также подлежат оцениванию, например, в случае движения ЛА в атмосфере могут оцениваться скорости порывов ветра, отклонения плотности атмосферы от стандартной, систематические ошибки измерений и т. д. Вектор состояния , включающий, помимо составляющих положения и скорости, различные возмущения, принято называть расширенным или обобщенным.
Закон управления, т. е. способ формирования вектора управления на основе оценок, считается заданным. Таким образом, рассматривается управляемое движение системы с обратной связью. В общем случае вектор управления может реализоваться со случайной ошибкой.
Считаем, что векторы начальных условий х0 и возмущений независимы и подчиняются нормальному закону распределения:
где — априорная корреляционная матрица вектора
априорное математическое ожидание х0.
где — корреляционная матрица вектора
.
В силу линейности модели (3.13) и гауссовости векторов априорная плотность вероятностей p(
) оцениваемого вектора
также является гауссовой:
где — априорная корреляционная матрица вектора
- априорное математическое ожидание вектора
.
Измерения осуществляются дискретно в моменты , которые считаются известными. Уравнение измерений имеет вид
где -мерный вектор измерений;
— матрица l×п, элементы которой зависят от номера i;
-мерный вектор ошибок измерений— вектор независимых центрированных случайных величин, распределенных по нормальному закону:
Требуется найти рекуррентный байесовский алгоритм оценивания вектора состояния системы (3.13) по измерениям
, где
соответствует (3.17).
Введем квадратичную функцию потерь вида (3.1)
где — симметричная положительно определенная матрица, неособенная при всех i, и байесовский риск
В (3.19) и (3.20) подразумевается, что —искомый алгоритм оценивания.
Условие минимума no
имеет вид (правила векторного дифференцирования см. в приложении 4)
откуда с учетом неособенности матрицы получаем байесовскую оценку для
:
Таким образом, при квадратичной функции потерь байесовская оценка состояния системы (3.13) представляет собой математическое ожидание вектора
,соответствующее апостериорной плотности вероятностей
. Это математическое ожидание также будем называть апостериорным. Оно определяется при фиксированном векторе
, т. е.
, и не зависит от матрицы
, т. е, оценка
инвариантна по отношению к
.
Этот вывод и будет положен в основу получения соответствующего байесовского алгоритма оценивания.
Заметим, что в соответствии со свойствами матриц и квадратичных форм (3.20) можно переписать в виде
где
- корреляционная матрица, соответствующая апостериорной плотности вероятностей
. В дальнейшем
будем называть апостериорной корреляционной матрицей вектора
. Символ Sp означает •след матрицы.
Рассмотрим момент времени . Нам известен вектор
, а также вектор управления
, переводящий систему из состояния
в состояние
. Будем считать вначале, что вектор
реализуется без ошибок.
Запишем апостериорную плотность вероятностей вектора
для чего воспользуемся формулой Байеса (3.11). Доказано [4], что последовательность измерений
обладает марковскими свойствами при заданных значениях марковской последовательности
, i = 0, 1, 2, .... Формулу Байеса запишем в следующем виде:
В отличие от формулы Байеса в виде (1.9) или, что то же самое, (3.11), в правой части (3.24) фигурирует дополнительное условие фиксации ,т. е. последовательности векторов измерений
. Необходимость в этом условии состоит в следующем. Необходимо получить рекуррентный алгоритм, в котором векторы измерений обрабатывались бы поочередно. Это значит, что при поступлении вектора
вычисляем оценку, соответствующую всей совокупности имеющихся к данному моменту измерений
, как функцию оценки, полученную по результатам измерений
и измерения
. Эта оценка будет тождественная оценке, полученной в результате обработки всей совокупности измерений
, только в том случае, если последовательность
—марковская.
Заметим, что как следует из (3.22), математическое ожидание вектора соответствующее плотности вероятностей
, входящей в правую часть (3.24), есть байесовская оценка
по измерениям
при квадратичной функции потерь. Эту оценку назовем прогнозированной и обозначим
, а корреляционную матрицу, соответствующую плотности вероятностей
.
В силу линейности соотношения (3.13) с учетом независимости и центрированности и
имеем
где
— корреляционная матрица, соответствующая плотности вероятностей . Назовем ее апостериорной.
Плотность вероятностей с учетом обозначения (3.27) запишется в виде
В силу линейности моделей (3.13), (3.17) и гауссовости векторов ,
и
плотность вероятностей
также гауссовская:
Вследствие тех же причин плотность вероятностей , входящая в правую часть (3.24),— гауссовская с характеристиками
Следовательно,
Определим теперь характеристики плотности вероятностей . Как и другие плотности вероятностей, входящие в правую часть (3.24), она гауссовская. Согласно (3.15), (3.17), (3.25) можем записать
Из (3.33) и (3.34) следует
Подставив (3.29), (3.32) и (3.35) в правую часть (3.24), получим
Выражение (3.37) можно привести к квадратичной форме вида
где через и
обозначены характеристики плотности вероятностей
. Преобразование (3.37) к виду (3.38) осуществляется с помощью матричного тождества
в предположении, что матрицы Л и С, т. е. — невырожденные. Характеристики плотности вероятностей
с учетом (3.37) и (3.38) соответственно равны
Запишем окончательно выражения, позволяющие вычислить байесовскую оценку вектора
по измерениям
при известной байесовской оценке
вектора
по измерениям
. Эти соотношения определяют дискретный фильтр Калмана:
Из выражения (3.43), определяющего апостериорную корреляционную матрицу следует, что эта матрица, характеризующая точность получаемых оценок, может быть определена независимо от измерений
, т. е. рассчитана заранее.
«Начальными условиями» для соотношений (3.42) — (3.45) являются
Равенства (3.46) означают, что в момент t = 0, соответствующий началу процесса оценивания, в качестве прогнозированной оценки вектора следует принять его априорное математическое ожидание
, а в качестве априорной корреляционной матрицы—соответствующую характеристику априорной плотности вероятностей р(
). Пусть случайное возмущение
содержит, помимо аддитивной, мультипликативную составляющую, зависящую от величины управляющего воздействия, т. е.
где - — независимая центрированная случайная величина, подчиняющаяся гауссовскому распределению с дисперсией (
, a
— вектор независимых центрированных величин, подчиняющихся гауссовскому распределению с корреляционной матрицей
. В этом
случае корреляционная матрица вектора
при фиксированных
зависит от конкретного значения
:
Итак, если в модели движения динамической системы предполагается наличие обратной связи , то при мультипликативной ошибке реализации управляющего воздействия корреляционная матрица
и, следовательно, апостериорная корреляционная матрица
не могут быть рассчитаны независимо от процесса измерений.
В ряде случаев весьма полезными оказываются соотношения непрерывного фильтра Калмана, которые могут быть получены из соотношений (3.42) — (3.45) с помощью предельного перехода.
Непрерывный фильтр Калмана предполагает наличие соответствующей модели движения оцениваемой динамической системы
и непрерывного процесса измерений
Размерности и смысл векторов и матриц в моделях (3.49) и (3.50) те же, что и в моделях (3.13) и (3.17) соответственно.
Векторы случайных начальных условий , ошибок измерений
и возмущений
статистически независимы и подчиняются нормальным законам распределения с характеристиками
Таким образом, ошибки измерения и возмущения
представляют собой белые шумы.
Обратимся к приведенным выше дискретным аналогам (3.13), (3.17) моделей (3.49), (3.50). Предположим, что интервал времени между измерениями настолько мал, что в дискретных моделях можно принять
где I — единичная матрица.
Подставляя (3.52) в соотношения (3.42) — (3.45), определяющие дискретный фильтр Калмана, получаем
где символом о обозначены члены, зависящие от
,
Подставляя (3.54) в (3.55) с учетом малости членов о и полагая, что
, получаем дифференциальные уравнения для апостериорного математического ожидания и апостериорной корреляционной матрицы вектора х:
Соотношения (3.56) и (3.57) определяют непрерывный фильтр Калмана. Как и в дискретном случае, при отсутствии мультипликативных возмущений , матрица Р* может быть определена независимо от процесса измерения. Начальными условиями для уравнений (3.56), (3.57) служат равенства
Фильтр Калмана находит широкое применение в различных областях техники. В частности, он используется для оценивания параметров движения как при автономном управлении движением летательных аппаратов, так и при командном управлении.