Адаптивная оптимальная САУ на базе самоорганизующегося оптимального регулятора с экстраполяцией
Функциональная схема такой САУ (рис. 50) содержит следующие элементы:
1. блок памяти;
2. блок оценивания;
3,7. исполнительные блоки;
4. экстраполятор нулевого порядка (ЦАП);
5. обобщенный объект регулирования (ОР);
6. блок автоматического поиска порядка математической модели (ММ) объекта.
По принципу функционирования эта САУ относится к системам с дискретным временем циклического типа. Входной величиной самоорганизующегося оптимального регулятора с экстраполяцией служит сигнал рассогласования х(t) между задающим воздействием g(t) и выходной
Рис.50
величиной y(t) объекта. Этот сигнал измеряется на каждом шаге, т. е. при t=iT, i= 0, 1, 2,….
В оперативной памяти 1 в табличном виде хранятся параметры, определенные на стадии проектирования: значения элементов матриц наблюдателей объекта с полиномиальной математической моделью различного порядка, оптимальные значения априорного времени экстраполяции и др.
В блоке оценивания 2 реализованы параллельно работающие рекуррентные циклические наблюдатели всех выбранных порядков n = 2, 3, .., nm. Полиномиальная математическая модель обобщенного регулируемого объекта эквивалентна цепочке последовательно соединенных интегрирующих звеньев, и блок 2 вырабатывает оценки векторов состояния этих цепочек для всех значений n. Соответственно каждый рекуррентный циклический наблюдатель строится по каскадной схеме, т. е. состоит из цепочки последовательно соединенных наблюдателей Нi (i = 1, ..,, п) производных (рис. 51, а), причем последние реализованы на базе фильтра Калмана-Бьюси второго порядка (рис. 51, б), у которого
Рис. 51
Помеха типа «белый шум» подавляется благодаря инерционности фильтра Калмана-Бьюси: первые оценки производных содержат «шум», а их вторые оценки - сглаженные, практически без «шума». Оценивание каждой последующей производной начинается после того, как завершится оценивание предыдущей (рекуррентный алгоритм). Так, например, после того, как и соответственно начинается оценивание и завершается при , в результате чего получается и т.д.
Для каждого фильтра Калмана-Бьюси коэффициенты k1 и k2 меняются во
Рис.52
времени в соответствии с передаточной функцией так, чтобы на начальном
этапе происходило оценивание наблюдаемой (входной) величины, а затем -
оценивание ее первой производной по времени (рис. 52).
В блок 6 (рис. 50) посылаются оценки для всех n, измеренные практически в один и тот же момент времени t благодаря малой затрате времени на оценивание (на порядок меньше периода наиболее высокочастотной составляющей движения объекта регулирования) и значительной инерционности объекта. По векторам оценок в этом блоке выполняется экстраполяция (т. е. предсказание, прогнозирование изменения) сигнала рассогласования на скользящий интервал для всех значений n, где Тэ – время экстраполяции.
Кроме того, в этот же блок поступают значения рассогласования и запоминаются на том же скользящем интервале. Далее осуществляется целочисленный поиск по п минимума усредненной нормы (например, квадрата) разности между фактическим и априорно предсказанным значением сигнала рассогласования. Это значение п считается оптимальным и по цепи местной ОС посылается в блок 2, а затем из этого блока в исполнительный блок 3. Кроме того, при этом происходит апостериорная оптимизация времени экстраполяции.
В исполнительном блоке 3 рассчитывается оптимальное управление u1 объектом на основе минимизации функционала обобщенной работы. В блоке 7 определяется дополнительное управление u2, компенсирующее неопределенности объекта. Управляющее воздействие u = u1 + u2 после экстраполятора нулевого порядка имеет вид кусочно-постоянной функции на интервалах , определяемой через рассогласование и оценки его производных. При этом могут быть реализованы астатизмы высокого порядка (v > 8), которые считались недостижимыми в эпоху аналоговой техники. Обобщенный объект 5 кроме ОР включает в себя усилители, приводы, измерительные преобразователи. На рис. 53 дана иллюстрация работы САУ и самоорганизующегося оптимального регулятора с экстраполяцией для ОР второго порядка.
Рис.53
Итак, данная САУ впервые позволяет реализовать адаптивное управление при неизвестной априори структуре ОР благодаря высокому уровню структурной и параметрической адаптации, которая обеспечивается прежде всего за счет применения наблюдателей в виде фильтра Калмана-Бьюси, устройств экстраполяции и поиска порядка математической модели.
Как было указано, в этой САУ для оптимизации используется функционал обобщенной работы - неклассический функционал с аддитивными затратами как на синтезируемое управление u, так и управление u0 в оптимальной системе:
.
ОУ задан уравнениями с линейно входящими управлениями:
При аналитическом конструировании необходим синтез алгоритма оптимального управления u° = u°(х,t) на стадии проектирования, что наталкивается на существенные трудности. Более прост поиск u0(t) САУ с прогнозирующей моделью в процессе работы системы.
Уравнение Беллмана для данной задачи имеет вид:
. (66)
Минимизация по u, т. е. дифференцирование по u и приравнивание производной к 0, приводит к решению в неявном виде:
. (67)
Подставляем (66) в (67) и учитываем дополнительное условие, налагаемое на функции U и U*:
.
Данное условие означает, что левая часть этого неравенства должна быть положительно-определенной функцией относительно и, принимающей минимальное значение, равное 0 при u=u0.
В результате получим уравнение в частных производных, на-
зываемое уравнением Ляпунова:
. (68)
Привлекая для решения этого уравнения метод характеристик, можно показать, что искомое решение строится на интегральных кривых, удовлетворяющих обыкновенным дифференциальным уравнениям свободного движения объекта ( ):
(69)
где - вектор частных производных функций Беллмана S по компонентам вектора состояния.
Уравнение (69) может быть также получено из (68) непосредственным дифференцированием по x и изменением порядка дифференцирования.
Кроме того, при вычислении функции S(x,t) на свободной траектории (u=0) из (68) вытекает уравнение
. (70)
Уравнения (69), и (70) составляют основу алгоритмов оптимизации с прогнозирующей моделью. Суть этих алгоритмов сводится к тому, что на основе интегрирования этих уравнений строится решение уравнения (68) и тем самым решается оптимизационная задача. Упрощение состоит в том, что не требуется поиска структуры функции S(x,t) во всей области ее определения, а требуется лишь вычисление ее значений в некоторой окрестности текущего состояния, достаточной для вычисления градиента , который затем используется в (67) для вычисления u0(t).
Лекция 11.