Идентификация, функционалы качества и алгоритмы отыскания их оптимальных значений
Процессы, протекающие в объектах и системах, могут быть математически описаны некоторым оператором Wo (a, x, t) (В дальнейшем иногда используем сокращенное обозначение оператора, без указания параметров), где а (a1,..., ai ..., an) — вектор параметров оператора; ai — i-й параметр; x — входной сигнал; t — время.
Например, процесс y на выходе объекта (рис. 13) может быть описан дифференциальным, интегральным или разностным уравнениями, передаточной, весовой или переходной функциями, частотными характеристиками и др. В конкретных случаях формальный вид оператора Wo выбирается из соответствующего математического языка с учетом адекватности последнего, а также конструктивности и удобства.
Если объект линейный, то оператор Wo не зависит от входного сигнала х и имеет вид Wo (а, t). Если структура и параметры объекта стационарны, то оператор не зависит от времени, т. е. Wo (а, х). Если объект линеен и стационарен, то оператор Wo определяется только вектором параметров а(a1,..., ai ..., an).
Математическая модель Ŵo (â, х, t), описывающая процессы на выходе объекта при известных х и t и полученная в результате решения сформулированной ниже задачи идентификации, является оценкой оператора Wo аналогично â i, — оценкой i-го параметра объекта.
При техническом решении задачи идентификации необходимо учесть имеющиеся ограничения, обусловленные условиями работы объекта, общей целью идентификации и качеством решения задачи. Так, например, если известно, что на объект поступают воздействия х(t), принадлежащие некоторому множеству воздействий, то модель Ŵo (â, х, t) должна с требуемой точностью описывать процессы на выходе объекта, когда на его вход поступают воздействия, принадлежащие множеству Ω x.
Рис. 13. Структурная схема объекта идентификации.
Если объект идентифицируют с целью построения системы оптимального управления, то важно получать возможно более точные оценки тех параметров, от которых наиболее существенно зависит величина меры оптимальности управления, и, очевидно, нет необходимости в точном определении оценки тех параметров, от которых мера оптимальности управления слабо или совсем не зависит. Таким образом, идентификация в задачах измерения и оптимального управления несколько различна.
Точные математические модели объекта обычно достаточно сложны. На практике нет необходимости в определении точных моделей. Поэтому обычно оценку Ŵo ищут в определенном классе операторов.
Информация о структуре и параметрах объекта содержится обычно в его выходном сигнале у (t). Проводником этой информации являются входные сигналы. Однако не все входные сигналы позволяют выявить природу исследуемого объекта. Например, сигнал в виде постоянного напряжения не может выявить величину постоянных времени объектов, обладающих инерционными свойствами. Поэтому для исследования определенных свойств объекта на его вход необходимо подавать соответствующие сигналы. Те входные сигналы, которые позволяют выявить интересующее нас свойство объекта, будем называть информативными.
Наиболее информативным сигналом для определения общих свойств объектов является сигнал типа «белый шум», так как содержит всю гамму частотного спектра, т. е, класс сигналов «белый шум» является наиболее общим классом входных сигналов при идентификации. Однако, с практической точки зрения, входной сигнал, на основе которого производится идентификация, должен быть не менее информативным, чем сигналы, принадлежащие множеству Ω x возможных входных сигналов объекта.
Таким образом, задача идентификации состоит в следующем.
Имеется некоторый объект, описываемый оператором Wo (a, x, t) и принадлежащий некоторому классу операторов ΩWo. На его вход поступают сигналы х, принадлежащие некоторому множеству сигналов Ωx. Необходимо выбрать некоторый оператор Ŵo (а, х, t) из множества операторов ΩŴo, который для того же класса входных сигналов Ωx будет достаточно близким к оператору Wo (а, x, t), т. е. будет описывать процессы на выходе объекта с требуемой точностью.
Класс операторов Ŵo обычно задается и, как правило, является более узким, чем ΩWo. Для исследования, например, некоторых свойств нелинейных систем иногда применяют линейные модели или при исследовании сложных систем высокого порядка применяют модели более низкого порядка.
Таким образом, задача идентификации объектов есть не что иное, как задача аппроксимации неизвестного оператора ‚ Wo Є ΩWo оператором Ŵo, выбранным обычно из известного класса операторов Ω Ŵo, для определенного класса входных воздействий x Є Ω x. Мера близости операторов Wo и Ŵo конструируется с учетом требований к оценке Ŵo.Оператор Ŵo (а, x, t) является решением задачи идентификации.
Во многих случаях идентификации не все входные сигналы объекта являются полезными для определения его математической модели Ŵo. Те из них, которые не поддаются измерению и от которых мы хотим избавиться, представляют собой помехи и могут иметь как детерминированный, так и стохастический характер. Наличие случайных помех приводит к случайному характеру полученной оценки Ŵo,и тогда предъявляют некоторые требования к ее статистическим характеристикам. Такие требования состоят в несмещенности , эффективности, состоятельности и достаточности оценок Ŵo. В этом случае в постановке задачи идентификации также учитывают требования к статистическим характеристикам оценки Ŵo.
Оценки, удовлетворяющие необходимым требованиям, ищутся обычно на основе определенных, специальным образом выбранных функционалов качества I (ε, x, Т), где Т - интервал времени идентификации. К сожалению, нет общего правила выбора функционалов качества, и эта задача имеет неоднозначное решение. Известно только общее требование к таким функционалам, состоящее в их адекватности для решения задачи идентификации. Под этим будем понимать следующее: некоторое значение I* (например, экстремальное значение I) должно говорить о том, что найденная оценка Ŵo оператора Wo удовлетворяет предъявленным к ней требованиям. Значение I обычно зависит от значения параметра ȃ, полезного входного сигнала и помехи. Однако не все выражения, зависящие от указанных аргументов, могут быть использованы при решении задачи идентификации. Будем называть I «правильно построенным» функционалом, если для него может быть указан метод определения оценки Ŵo (например, нахождение I*), при этом он должен исключить влияние помех на результат идентификации.
На практике преимущественно используют такие функционалы I, которые позволяют относительно просто получить интересующие оценки (например, функционал I в виде среднего квадрата отклонения).
Если функционал качества I является детерминированным выражением, то оценки εi найденные на его основе, удовлетворяют вышеуказанным требованиям. Если в качестве функционала выбрать другой функционал I ', связанный с I преобразованием I ' = LI, где L - некоторый оператор, допускающий обратное преобразование I =L ˉ I ', то ясно, что и на основе I ' можно найти Ŵo, удовлетворяющее упомянутым требованиям. Вообще существует целый класс функционалов качества, на основе которых можно получить идентичные оценки оператора Wo.
При наличии помех в функционале качества I необходимо предусмотреть соответствующие операции, уменьшающие случайный характер самого функционала, т. е. превращающие его в инвариантный по отношению к помехам. Обычно в качестве таких операций применяют усреднение по времени или по ансамблю. В случае линейных объектов можно наметить один путь формирования инвариантных по отношению к помехам функционалов качества. Функционал I может быть сформирован, например, следующим образом:
I=E f [Ŵo,x,n] (14.1)
где Е - оператор усреднения; f - некоторая выпуклая функция.
С учетом линейности оператора Е выражение (1) запишем следующим образом:
I= E f 1 [Ŵo , x] + E f 2 [Ŵo , x , n] + E f 3 [Ŵo , n] (14.2)
Рис. 14 Общая схема системы идентификации с моделью обьекта. Wm-оператор модели; АИ – алгоритм идентификации.
Оператор усреднения Е снимает неопределенность, вносимую функциями f 2 и f 3, в функционале I. В некоторых случаях (например, в задачах у идентификации линейных объектов при некоррелированных х и n) удается выбрать такую функцию, что второй и третий члены в выражении (2) становятся равными нулю.
Различным функциям f в функционале I соответствует различное соотношение между полезным сигналом (первый член выражения (2)) и помехой (остальные члены выражения (2)). Поэтому выбор f необходимо производить так, чтобы отношение сигнал/помеха в функционале I было удовлетворительным. От вида функционала при замкнутых алгоритмах идентификации (при компенсационных методах идентификации) также зависит сходимость и качество процесса идентификации.
В случае применения разомкнутых алгоритмов идентификации (при не компенсационных аналитических методах идентификации), помимо указанного пути формирования I , возможно применение критериев качества, построенных на известных стратегиях Байеса, максимума апостериорной вероятности, максимума функции правдоподобия, минимаксной стратегии и др. Но для применения указанных стратегий необходимо знать статистические характеристики помех. В этом заключается основной недостаток указанных стратегий. Функционал вида (l) содержит идею исследования характеристик помехи в процессе идентификации.
Широко применяют системы идентификации с моделью объекта (рис.14). Некоторое значение W*m оператора модели Wm принимают согласно критерию оптимальности в качестве оценки оператора объекта Wo , т.е. W*m=Ŵo
При отсутствии помех функционал качества идентификации может быть сформулирован на основе разности ε выходных сигналов объекта уо, и модели уm. При наличии помех о совпадении операторов модели и объекта можно судить по разности части сигнала объекта, зависящей от полезного входного сигнала, и сигнала модели. Отсюда вытекает задача подавления помехи в результате идентификации.
Рис. 15. Дифференциальная схема формирования функционала качества.
В случае стационарных линейных объектов и стационарных некоррелированных х и n для формирования инвариантных функционалов качества могут быть применены идеи многоконтурных инвариантных систем. В частности, функционал I может быть образован в виде двух дифференциальных операторов по схеме рис. 15.
I= β1E f1 W1ε — β2 E f2 W2 ε (14.3)
где W 1 , W 2— некоторые операторы; f1 и f2 — некоторые выпуклые преобразования; β1 и β2 — коэффициенты.
Подставляя ε = уо — уm = (уоx + уom) — уm, получаем
I =β1E f1W1 ( уо-уm ) - β2 E f2 W2 ( уоx-уom )+β1 E f1 W1 уоn+β2 E f2 W2 уоn (14.4)
Учитывая, что уоx = Wox, уоn= Wnon, уm =Wm , где Wo — оператор объекта, преобразующий помеху n, из соотношении (4) получаем:
I= β1E f1W1 ΔWx - β2Ef2W2 ΔWx + β1E f1W1 Wnon - β2Ef2W2 Wnon ;
ΔW =Wo - Wm (14.5)
Выбирая в выражении (5) коэффициенты β1, и β2, удовлетворяющие следующему условию: β1 / β1 = (E f2W2 Wnon) /( Ef1W1 Wnon) (14.6)
получаем функционал качества, не зависящий от помехи n: . (14.7)
Таким образом, на выходе схемы, изображенной на рис. 15, получаем информацию, зависящую только от полезного сигнала x и от рассогласования операторов объекта и модели.
На практике часто принимают f1 = f2 = f3 (обычно квадраторы). Тогда из выражения (7) получаем
(14.8)
Для информативности функционала I операторы W1, и W2 должны удовлетворять некоторым требованиям.
Из выражения (5) видно, что если W1 = W2 = 0, то при любых значениях β1 и β2 функционал I не зависит от помехи. Однако в таком случае I = 0 и является неинформативным.
Пусть W1 = W2 (в предположении, что f1 = f2 = f). Тогда на основе выражения (6) получаем β1 = β2 = β. Но при этом, как видно из соотношения (8), опять I = 0.
Пусть W1 = bW2; b = const. Тогда из выражения (6) (β1 = b β2) и при этом также I = 0.
Пусть в областях существования х и n (например, в частотных спектрах х и n) E f W1x= E f W2x. Нетрудно заметить, что и в этом случае I=0. Таким образом, область неинформативных операторов состоит из W1, и W2, для которых справедливы следующее соотношения:
(14.9)
E f W1= b E f W2 ; b = const. по отношению к n и x.
При выборе W1, и W2 из областей, близких к (9), получаем плохие по чувствительности функционалы качества.
С точки зрения максимальной чувствительности функционала I, как видно, например, из выражения (8) желательно, чтобы E f W2(Wo — Wm)х=0 (или E f W1(Wo — Wm)х= 0), т. е. чтобы W2 представлял некоторый фильтр-пробку для полезных выходных сигналов уоx и уom.
По физической природе операторы W1 и W2 могут быть самые различные: нелинейные звенья, модуляторы и др. Наиболее известны и удобны для реализации W1 и W2 виде двух частотных фильтров с различными по форме частотными характеристиками, достаточно хорошо описанными, например, в работе.
Применение функционалов I с использованием дифференциальных операторов позволяет исключить из результата идентификации даже ту часть спектра помехи, которая совладает со спектром полезного сигнала. Для нестационарных помех необходима адаптация какого-нибудь из коэффициентов β1 или β2 с целью обеспечения условия (6). Для достижения такой пели можно применить алгоритм, построенный также на идее дифференциальных операторов. При этом дифференциальная схема должна подавить полезный сигнал и дать информацию о характеристиках помехи, на основе которой можно будет перестраивать β1 и β2.
Во многих случаях для получения инвариантных по отношению к помехам функционалов качества можно применять алгоритмы, основанные на корреляционных методах. Особо эффективно это в случае некоррелированных полезного сигнала и помехи.
Функционалы качества должны быть адекватными для решения задачи идентификации. Существенным моментом является организация движения в системе идентификации к оптимальному (экстремальному) значению функционала качества. В случае унимодальных функционалов качества поиск их экстремальных значений может быть осуществлен методами градиента, наискорейшего спуска, Гаусса - Зейделя, стохастической аппроксимации и случайным поиском [52, 115, 154]. Техническая реализация указанных алгоритмов приводит к различным системам идентификации.