Оценка переменных параметров

Рассмотрим теперь многошаговый процесс получения данных на­блюдения и принятия решений, к которому сводятся многие практические задачи, в частности, задачи фильтрации.

Пусть для любого n-го шага ( оценка переменных параметров - student2.ru ) совокупность данных наблюдения описывается вектором оценка переменных параметров - student2.ru , каждая компонен­та которого оценка переменных параметров - student2.ru зависит от параметра оценка переменных параметров - student2.ru . Значения оценка переменных параметров - student2.ru меняются от шага к шагу, а их совокупность для n-го шага описывается вектором оценка переменных параметров - student2.ru увеличивающейся размерности. Задача статистического решения заключается в том, чтобы на каждом n-м шаге ( оценка переменных параметров - student2.ru ) с помощью оценка переменных параметров - student2.ru оценить значение оценка переменных параметров - student2.ru . Последовательность этих оценок для каждого фиксированного значения п дает оценку вектора оценка переменных параметров - student2.ru в целом, причем каждая его компонента оценка переменных параметров - student2.ru ( оценка переменных параметров - student2.ru ) оценивается с соблю­дением принципа физической реализуемости, то есть зависит только от тех данных наблюдения, которые получены до оценка переменных параметров - student2.ru -ro шага включительно. При этом, как всегда, оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru , вообще говоря, являются векторами той или иной (одинаковой или разной) размерности.

В практических приложениях индекс оценка переменных параметров - student2.ru чаще всего соответствует дискретному времени, a оценка переменных параметров - student2.ru - значению некоторой функции оценка переменных параметров - student2.ru в момент времени оценка переменных параметров - student2.ru . При этом полученная оценка является оценкой функции оценка переменных параметров - student2.ru в дискретных точках. При переходе к непрерывному времени век­тор оценка переменных параметров - student2.ru переходит в отрезок реализации наблюдаемого процесса оценка переменных параметров - student2.ru на интервале времени от оценка переменных параметров - student2.ru до оценка переменных параметров - student2.ru , вектор оценка переменных параметров - student2.ru - в отрезок реализации процесса оценка переменных параметров - student2.ru на том же интервале, а задача статистического решения заключается в том, чтобы на основании наблюдения оценка переменных параметров - student2.ru на интервале оценка переменных параметров - student2.ru оценить значение оценка переменных параметров - student2.ru для каждого момента времени t, большего оценка переменных параметров - student2.ru и меньшего некоторого оценка переменных параметров - student2.ru , соответствующего прекращению про­цесса оценивания.

Пусть последовательность оценка переменных параметров - student2.ru обладает марковским свойством, то есть для любого п

оценка переменных параметров - student2.ru (10.4.1)

где оценка переменных параметров - student2.ru - переходная плотность вероятности, зависящая от совокупности неизвестных параметров оценка переменных параметров - student2.ru , описывающих априорную неопределенность статистических свойств последовательности оценка переменных параметров - student2.ru Выбором соответствующей размерности вектора оценка переменных параметров - student2.ru и подхо­дящей совокупности параметров оценка переменных параметров - student2.ru практически всегда можно добиться того, что соотношение (10.4.1) выполняется. Будем считать также, что условное математическое ожидание

оценка переменных параметров - student2.ru (10.4.2)

и условная корреляционная матрица

оценка переменных параметров - student2.ru (10.4.3)

существуют, причем функция оценка переменных параметров - student2.ru дифференцируема по оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru . Важным частным случаем, для которого выполняются условия (10.4.1) – (10.4.3), являются процессы, описываемые рекуррентным соот­ношением

оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru (10.4.4)

где оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru ,… - последовательность независимых векторных случайных величин с корреляционной матрицей

оценка переменных параметров - student2.ru , (10.4.5)




Отметим, что последняя может быть вырожденной и может содержать нулевые диагональные элементы, что соответствует несобственному условному распределению вероятности вектора оценка переменных параметров - student2.ru , целиком сосредото­ченному на некоторых гиперповерхностях пространства, в котором задан этот вектор. Наряду с (10.4.4) часто также используется соотношение

оценка переменных параметров - student2.ru . (10.4.6)

где оценка переменных параметров - student2.ru - случайный вектор, размерность которого не обязательно сов­падает с размерностью оценка переменных параметров - student2.ru , имеющий корреляционную матрицу оценка переменных параметров - student2.ru , не зависящую от оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru , а оценка переменных параметров - student2.ru - прямоугольная матрица соот­ветствующих размеров. В этом случае

оценка переменных параметров - student2.ru . (10.4.7)

При переходе к непрерывному времени аналогом рекуррентного соотношения (10.4.4) является стохастическое дифференциальное урав­нение

оценка переменных параметров - student2.ru , (10.4.8)

где оценка переменных параметров - student2.ru - дельта-коррелированный процесс («белый» шум) с корре­ляционной функцией

оценка переменных параметров - student2.ru . (10.4.9)

При дискретизации этого уравнения мы, очевидно, возвращаемся к рекуррентному соотношению (10.4.4), в котором при достаточно малых оценка переменных параметров - student2.ru

оценка переменных параметров - student2.ru

оценка переменных параметров - student2.ru , (10.4.10)

а условная плотность вероятности (10.4.1) является гауссовой.

Будем считать также, что наряду с неопределенностью статистиче­ского описания переменного параметра оценка переменных параметров - student2.ru , подлежащего оценке, существует априорная неопределенность в отношении данных наблю­дения, которая приводит к заданию распределения вероятности величин оценка переменных параметров - student2.ru с точностью до совокупности неизвестных параметров оценка переменных параметров - student2.ru , то есть для любого оценка переменных параметров - student2.ru

оценка переменных параметров - student2.ru . (10.4.11)

Набор плотностей вероятности (10.4.1) и (10.4.11) для оценка переменных параметров - student2.ru дает параметрически неопределенное статистическое описание задачи. В соответствии с общими результатами гл. 6 адаптивное байесово правило решения интересующей нас задачи заключается в формирова­нии совместной оценки величин оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru . Для того чтобы добиться единообразия в формулировке этой задачи совместной оценки, припи­шем параметрам оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru также индекс «n», формально рассматривая их как меняющиеся от шага к шагу. Чтобы при этом не исказить существа дела, связанного с их фактической неизменностью, необходимо считать, что их последовательные значения оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru связаны между собой соотношениями

оценка переменных параметров - student2.ru . (10.4.12)

С учетом (10.4.12) мы, очевидно, имеем право записать

оценка переменных параметров - student2.ru (10.4.13)

и

оценка переменных параметров - student2.ru , (10.4.14)

поскольку в силу (10.4.12) безразлично, какой индекс приписать оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru . Очевидно, также, что выражения (10.4.12) являются частным слу­чаем рекуррентного соотношения (10.4.4) и им можно поставить в соот­ветствие переходные плотности вероятности

оценка переменных параметров - student2.ru ;

оценка переменных параметров - student2.ru . (10.4.15)

Объединим теперь параметры оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru в единую совокупность, введя вектор

оценка переменных параметров - student2.ru . (10.4.16)

суммарной размерности. Последовательность оценка переменных параметров - student2.ru , очевидно, удовлетворяет марковскому свойству и имеет переходную плотность вероятности

оценка переменных параметров - student2.ru (10.4.17)

причем, условное математическое ожидание и условная корреляционная матрица оценка переменных параметров - student2.ru , соответственно равны

оценка переменных параметров - student2.ru , (10.4.18)

оценка переменных параметров - student2.ru . (10.4.19)

Аналогично плотность распределения вероятности для наблюдаемо­го значения оценка переменных параметров - student2.ru (10.4.13) можно записать:

оценка переменных параметров - student2.ru , (10.4.20)

имея в виду, что она зависит от части из совокупности параметров оценка переменных параметров - student2.ru

С помощью этих нехитрых операций так же, как в случае задачи оценки постоянных параметров, мы добились полного устранения фор­мальных различий между интересующими нас полезными параметрами оценка переменных параметров - student2.ru и «мешающими» параметрами оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru , описывающими априорную неопределенность. По форме задача свелась к байесовой оценке век­тора оценка переменных параметров - student2.ru с переходной плотностью вероятности (10.4.17) по совокупности наблюдаемых данных оценка переменных параметров - student2.ru , каждое из которых имеет распределе­ние вероятности с плотностью (10.4.20). Решение этой задачи хорошо известно и в асимптотическом гауссовом приближении для апостериорной плотности вероятности оценка переменных параметров - student2.ru задается следующей системой рекуррентных соотношений, обеспечивающих последовательное вычисле­ние оценочных значений оценка переменных параметров - student2.ru параметра оценка переменных параметров - student2.ru и апостериорной корреляци­онной матрицы оценка переменных параметров - student2.ru , характеризующей ошибки оценивания:

оценка переменных параметров - student2.ru , (10.4.21)

оценка переменных параметров - student2.ru , (10.4.22)

где

оценка переменных параметров - student2.ru ; (10.4.23)

оценка переменных параметров - student2.ru ; (10.4.24)

оценка переменных параметров - student2.ru (10.4.25)

оценка переменных параметров - student2.ru (10.4.26)

а функции оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru определяются выражениями (10.4.18) - (10.4.20) соответственно.

Рекуррентные соотношения (10.4.21), (10.4.22) являются обобще­нием рекуррентных соотношений гл. 7 для оценок максимального правдоподобия постоянных параметров. Как и в гл. 7, при вычислении весовой матрицы

оценка переменных параметров - student2.ru (10.4.27)

практически без ухудшения точности оценки параметра оценка переменных параметров - student2.ru можно заменить в соотношении (10.4.22) матрицу оценка переменных параметров - student2.ru матрицей

оценка переменных параметров - student2.ru , (10.4.28)

получающуюся подстановкой значения оценка переменных параметров - student2.ru или оценка переменных параметров - student2.ru в мат­рицу оценка переменных параметров - student2.ru , определенную выражением

оценка переменных параметров - student2.ru . (10.4.29)

Выбор начальных условий для рекуррентных соотношений (10.4.21), (10.4.22) осуществляется так же, как для рекуррентных соотношений гл. 7 с учетом ограниченных сведений об априорном разбросе значений оценка переменных параметров - student2.ru при оценка переменных параметров - student2.ru , если последние имеются, и нулевыми для оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru при оценка переменных параметров - student2.ru , если всякая информация о начальных значениях отсутствует. Как и в случае постоянных параметров, если только начиная с некото­рого п матрица оценка переменных параметров - student2.ru становится невырожденной и существует обратная ей матрица оценка переменных параметров - student2.ru , то есть действительно имеется возможность изме­рения всех компонент параметра оценка переменных параметров - student2.ru , то начальные условия быстро забы­ваются и очень слабо влияют на значения оценок оценка переменных параметров - student2.ru и характеристики их точности. В связи с этим при полном отсутствии априорных сведений для начальных значений можно задавать матрицу оценка переменных параметров - student2.ru любым подходящим способом, обеспечивающим обращение матриц в (10.4.22) на начальных шагах, с соблюдением единственного условия, чтобы собственные числа матрицы оценка переменных параметров - student2.ru , которые характеризуют априорный разброс начальных значений оценка переменных параметров - student2.ru , были достаточно большими.

Для улучшения скорости сходимости рекуррентной процедуры и уменьшения влияния произвола в выборе начальных условий полезно более точно вычислить апостериорную плотность вероятности на на­чальных шагах для некоторого оценка переменных параметров - student2.ru , не прибегая к гауссовой аппро­ксимации, и затем найти то значение оценка переменных параметров - student2.ru , которое обращает её в максимум.

Это максимизирующее значение оценка переменных параметров - student2.ru вместе с матрицей вторых про­изводных логарифма апостериорной плотности вероятности в точке оценка переменных параметров - student2.ru и являются наилучшими начальными значениями для рекуррент­ной процедуры, которая начинается с оценка переменных параметров - student2.ru . Как правило, указанная максимизация требует решения трансцендентных уравнений, поэтому число начальных шагов следует выбирать исходя из компромисса меж­ду сложностью этих уравнений и желанием получить наиболее точное начальное приближение. Практически целесообразно выбирать оценка переменных параметров - student2.ru равным тому минимальному значению, для которого все компоненты максимизирующего значения оценка переменных параметров - student2.ru являются нетривиальными оценками вектора оценка переменных параметров - student2.ru , то есть действительно зависят от полученных за оценка переменных параметров - student2.ru шагов данных наблюдения.

Если далее в процессе выполнения рекуррентной процедуры матрица оценка переменных параметров - student2.ru не становится особенной, то заданная система полезных пара­метров оценка переменных параметров - student2.ru и параметров оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru , выбранных для описания априорной неопределенности, является допустимой в том смысле, что все эти параметры действительно могут быть оценены по имеющимся данным наблюдения. Если же матрица оценка переменных параметров - student2.ru вырождается, то необходимо либо исключить часть этих параметров из числа оцениваемых, приписав им те или иные выбираемые на основе априорных предположений фиксированные значения (результат оценки остальных параметров будет за­висеть оттого, сколь точно эти значения соответствуют действительным), либо расширить объем данных наблюдения, так, чтобы обеспечить воз­можность оценки всех имеющихся параметров.

С точки зрения практического использования, благодаря широкому распространению ЭВМ, наибольшую ценность имеют именно рекуррент­ные соотношения (10.4.21), (10.4.22), которые позволяют решить гро­мадное количество самых разнообразных прикладных задач. Однако для аналитического исследования более удобны дифференциальные уравнения, которые получаются из рекуррентных соотношений (10.4.21), (10.4.22) соответствующим предельным переходом либо могут быть найдены непосредственно при рассмотрении процессов с непрерывным временем. При этом соответствующие стохастические дифференциаль­ные уравнения для оценок, как и исходные уравнения для оцениваемых параметров, могут пониматься либо в смысле Ито, либо в смысле Стратоновича с теми особенностями в построении схем устройств, моделиру­ющих эти уравнения, которые следуют из различия в этом понимании. Дополняя уравнение (10.4.8) дифференциальными уравнениями для параметров оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru

оценка переменных параметров - student2.ru , оценка переменных параметров - student2.ru , (10.4.30)

получаем дифференциальное уравнение для составного вектора оценка переменных параметров - student2.ru

оценка переменных параметров - student2.ru ; (10.4.31)

оценка переменных параметров - student2.ru (104.33)

- дельта-коррелированный случайный процесс с корреляционной мат­рицей

оценка переменных параметров - student2.ru (10.4.34)

Соответствующие дифференциальные уравнения для оценки оценка переменных параметров - student2.ru и апостериорной корреляционной матрицы оценка переменных параметров - student2.ru имеют вид

оценка переменных параметров - student2.ru (10.4.35)

оценка переменных параметров - student2.ru (10.4.36)

где оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru определяются так же, как в гл. 7 формулами (7.5.43) и (7.5.47) с возможной заменой оценка переменных параметров - student2.ru на оценка переменных параметров - student2.ru из (7.5.49), а матрица оценка переменных параметров - student2.ru определяется соотношением

оценка переменных параметров - student2.ru .

Дифференциальное уравнение для матрицы

оценка переменных параметров - student2.ru (10.4.37)

имеет вид

оценка переменных параметров - student2.ru (10.4.38)

Матрица оценка переменных параметров - student2.ru , определяемая соотношением (10.4.22), и соответствен­но оценка переменных параметров - student2.ru ,определяемая дифференциальным уравнением (10.4.36), пред­ставляют собой апостериорные корреляционные матрицы оцениваемой совокупности параметров. Корреляционная матрица ошибок оценивания этих параметров

оценка переменных параметров - student2.ru (10.4.39)

и соответственно

оценка переменных параметров - student2.ru (10.4.40)

асимптотически (при достаточно большом объеме данных наблюдения или при достаточно высокой точности единичных измерений параметров оценка переменных параметров - student2.ru по одному наблюдению оценка переменных параметров - student2.ru ) определяются теми же рекуррентными соотношениями и дифференциальными уравнениями, что оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru , если в них всюду заменить оценочные значения параметров оценка переменных параметров - student2.ru их истинными значениями, а матрицы оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru их математически­ми ожиданиями оценка переменных параметров - student2.ru и оценка переменных параметров - student2.ru соответственно. Этот факт достаточно хорошо известен для неадаптивного случая, а в силу того, что при наличии априорной неопределенности задача оценки сводится к обычной байесовой задаче относительно расширенной совокупности параметров, полностью переносится и на адаптивный случай. Указанное совпадение полностью аналогично асимптотической сходимости корре­ляционной матрицы ошибок оценивания постоянных параметров к ма­трице, обратной информационной матрице Фишера. Таким образом, при­веденные выше рекуррентное соотношение (10.4.22) и дифференциальное уравнение (10.4.36) дают возможность простой подстановкой в них истинных значений оцениваемых параметров найти точность оценки этих параметров.

Так же, как в §10.2, дискретный (10.4.21), (10.4.22) и непрерывный (10.4.35), (10.4.36) алгоритмы формирования оценок автоматически учи­тывают наличие данных обучения, описание которых производится со­ответствующим заданием функций правдоподобия оценка переменных параметров - student2.ru (и соот­ветственно оценка переменных параметров - student2.ru или оценка переменных параметров - student2.ru ), где под оценка переменных параметров - student2.ru понимается вся совокупность наблюдаемых на n-м шаге данных, возможно (при наблюдении на интервале обучения «чистых» реализаций значений измеряемого пара­метра) включающих в себя и значения оценка переменных параметров - student2.ru .

Наши рекомендации