Модельно-упреждающее управление
Модельно-упреждающее управление основывается на решении в реальном времени на каждом шаге управления задач идентификации и собственно управления при заданном интервале упреждения. При этом в качестве управляющего воздействия на реальный объект принимается управление, соответствующее первому шагу расчетной траектории управления от текущего момента времени.
Для более глубокого понимания модельно-упреждающего управления рассмотрим сначала упрощенные частные постановки задач, которые для наглядности будем формулировать в непрерывном и дискретном вариантах. На их основе будет сформулирована общая постановка задачи модельно-упреждающего управления.
Рассмотрим задачу идентификации линейного непрерывного одномерного объекта. Для данного случая динамика объекта управления может быть представлена во временной области интегральным соотношением
, (1)
где ‑ входное воздействие, ‑ весовая функция линейной нестационарной системы, ‑ выходная реакция объекта. При решении задачи идентификации в соотношении (1) известными считаются входной процесс и выходной процесс , неизвестной является весовая функция .
Текущая ошибка решения задачи идентификации
. (2)
Соответственно квадрат ошибки
(3)
Введем оператор экспоненциального усреднения квадрата ошибки
. (4)
Применение оператора усреднения (4) к выражению квадрата ошибки приводит к формуле экспоненциальной среднеквадратичной ошибки
, (5)
где , ,
. (6)
Выражение (5) представляет собой квадратичный функционал относительно неизвестной функции . Минимум данного функционала достигается решением линейного интегрального уравнения
. (7)
Решение линейного интегрального уравнения (7) можно выполнить с использованием численных методов, например, методом сеток путем сведения его к системе линейных алгебраических уравнений.
С этой целью проведем дискретизацию оси времени с некоторым шагом : , , , и введем обозначения: , , . Тогда интегральному уравнению (7) будет соответствовать система линейных алгебраических уравнений
. (8)
Решение системы уравнений (8) определяет решение задачи идентификации весовой функции .
Как следует из материала пункта 3.4.3 раздела 3, постановка задачи идентификации по единственному критерию точности является некорректной. Здесь необходимо использовать дополнительные критерии, отражающие в том или ином смысле сложность искомого решения, позволяющие регуляризовать постановку задачи. В качестве такого критерия можно использовать, например, интегральную полосу пропускания системы
. (9)
В этом случае задача идентификации ставится как задача минимизации функционала
, (10)
где ‑ коэффициент регуляризации: .
Интегральное уравнение, которому удовлетворяет искомая весовая функция
. (11)
Дискретная форма уравнения (11)
. (12)
Здесь ‑ символ Кронекера
Система уравнений (12) имеет решение при любых входных данных ,
Точность решения рассматриваемой задачи можно усилить, если априори будет известна номинальная весовая функция системы допустимой сложности, относительно которой текущая весовая функция представляет собой уклонение от номинала. Тогда в качестве критерия регуляризации постановки задачи можно использовать квадрат нормы уклонения от номинальной весовой функции
. (13)
Регуляризующий функционал вида (13) можно назвать стабилизирующим, так как он осуществляет стабилизацию решения в окрестности заданного номинала.
Далее, аналогично предыдущему случаю ставится задача минимизации функционала
. (14)
Соответствующее интегральное уравнение будет иметь вид
, (15)
система линейных алгебраических уравнений ‑
. (16)
Задача идентификации в соответствии с уравнениями (15), (16) имеет гарантированную точность решения не хуже точности номинальной весовой функции при любых входных данных , .
Построенное выше решение задачи идентификации для одномерного динамического объекта допускает естественное обобщение на многомерный случай.
Соответственно поведение многомерного динамического объекта может быть описано соотношениями
, (17)
где ‑ вектор входного воздействия (управления), ‑ выходная реакция объекта по -ому выходу, ‑ вектор весовых функций линейной нестационарной системы по -ому выходу.
Выражения экспоненциальных среднеквадратических ошибок по -ому выходу будут иметь вид
(18)
Здесь
, , (19)
.
Интегральные уравнения, определяющие минимум экспоненциальных среднеквадратических ошибок,
, . (20)
Соответствующие дискретные системы линейных алгебраических уравнений
, . (21)
Регуляризованные уравнения по первому варианту
, . (22)
, . (23)
где ‑ единичная матрица.
Регуляризованные уравнения по второму варианту
, . (24)
, . (25)
__________________________________________
Рассмотрим решение задачи упреждающего управления. С этой целью сначала проведем анализ решений данной задачи при упрощающих предположениях.
В качестве объекта управления будем рассматривать линейную многомерную динамическую систему, поведение которой описывается соотношением
, (26)
где ‑ управление, ‑ выходная реакция объекта управления, ‑ матрица весовых функций объекта управления.
Предположим, что нам известна заданная траектория движения объекта ‑ . Тогда ошибка управления для времени упреждения будет определяться следующим образом
. (27)
Соответственно квадрат нормы ошибки на интервале упреждения будет равен
(28)
В соответствии с вариационным исчислением минимум квадрата нормы ошибки (28) определяется решением уравнения
(29)
Из уравнения (29) тривиальным образом следует уравнение
. (30)
Решение уравнения (30) является некорректным в том смысле, что в общем случае указанное решение имеет бесконечную мощность, кроме того, оно не является единственным.
Для регуляризации постановки задачи введем дополнительное ограничение на мощность управления
. (31)
С учетом обоснований, приведенных в пункте 3.4.3 раздела 3, исходное уравнение (29) в конечном итоге может быть преобразовано к виду
(32)
Здесь ‑ коэффициент регуляризации.
Критическим вопросом рассмотренной методики является выбор регуляризующего функционала. В общем случае регуляризующий функционал может иметь произвольную форму при условии, что он в конечном итоге ограничивает с физической точки зрения сложность управления. С математической точки зрения регуляризующий функционал должен ограничивать норму искомого решения интегрального уравнения. При этом вид нормы может быть также произвольным.
С учетом сказанного, для примера, выберем в качестве регуляризующего функционал
, (33)
где ‑ матрица весовых функций некоторого динамического оператора, обратного динамическому оператору с матрицей весовых функций . Обратим внимание, что условное обозначение представляет здесь операцию обращения для динамического оператора, а не для матрицы его весовых функций. Операция обращения динамического оператора является отличной от операции обращения матрицы весовых функций.
С использованием функционала (33) задача упреждающего управления сводится к задаче минимизации штрафного функционала
. (34)
В результате эквивалентных преобразований соответствующее интегральное уравнение, определяющее решение задачи минимизации функционала (34), будет иметь вид
(35)
Из (35) следует уравнение
(36)
Структурная схема расчетов в соответствии с уравнением (36) представлена на рис. 4.3.1.
Рис. 4.3.1. Примерная расчетная схема упреждающего управления |
Расчетная схема упреждающего управления (рис. 4.3.1) (при ) получилась совпадающей с классической схемой автоматического управления по отклонению. Таким образом, данная классическая схема автоматического управления получается здесь как частный случай решения задачи упреждающего управления при регуляризующем функционале вида (33). Этот результат отражает взаимосвязь задач управления на основе целенаправленного выбора решений в реальном времени и на основе автоматических систем. Оба подхода в общем случае приводят к одинаковым решениям и являются дуальными друг к другу[12].
Обратим внимание, что в схеме (рис. 4.3.1) оператор с матрицей весовых функций является неопределенным. Но именно он определяет всю динамику системы управления, именно определение данного оператора по критериям устойчивости и качества является центральной задачей классической теории управления. Следовательно, выбор вида регуляризующего функционала в задачах упреждающего управления имеет решающее значение для обеспечения устойчивости и качества управления в замкнутой системе. Однако регулярные процедуры выбора регуляризующего функционала в настоящее время не разработаны. Поэтому здесь необходимо основываться на инженерных эвристиках, методы моделирования и экспериментальные исследования.
Например, с точки зрения инженерных соображений оценка ошибки управления в одномерном случае может иметь вид
, (37)
где ‑ функция, выделяющая знак ошибки.
Подстановка ошибки вида (37) в уравнение (32) с учетом соответствующих изменений приводит к уравнению
. (38)
Уравнению (38) соответствует структурная схема (рис. 4.3.2)
Рис. 4.3.2. Вариант расчетной схемы упреждающего управления |
Схема (рис. 4.3.2) представляет собой релейную систему автоматического управления.
Таким образом, разные математические постановки задач упреждающего, а также можно сказать и оптимального управления, приводят к разным схемам управления. При этом математические постановки задач по определению содержат в себе априорные условия, которые не всегда отражают объективную сторону решаемой задачи, а выбираются из соображений удобства использования математического аппарата. Так как априорные условия постановок задач существенно определяют структуру решения задач управления, то подобные решения являются конвенциональными[13]. Другими словами, подобные решения получены во многом, не исходя из технических требований, а из условных соглашений. Такими условными соглашениями являются, например, квадратичные критерии оптимальности, использование представлений типа пространства состояний в задачах оптимального управления и др. В итоге само понятие оптимальности систем управления, полученных аналитическими методами, становится конвенциональным, связанным с принятым подходом к решению задач. При этом конечным критерием проверки качества полученного аналитического решения является инженерная практика.
________________________________________
В общем случае объект управления находится под воздействием возмущений, которые обуславливают дополнительную ошибку управления. Задача управления в данном случае состоит в парировании возмущений с целью минимизации ошибки управления.
Будем полагать, что ошибка управления в данном случае состоит из двух компонент и описывается соотношениями
, (39)
где ‑ вектор возмущающих воздействий, ‑ матрица весовых функций, определяющих динамику влияния возмущений на выход объекта .
Соответственно квадраты норм ошибок определяются следующими аналитическими выражениями, приведенными ниже:
При решении задачи управления с учетом действия возмущений критерий оптимизации должен определяться на основе общего штрафного функционала
, (41)
где ‑ вес квадрата нормы ошибки по возмущению, .
Минимум квадрата нормы функционала (41) определяется решением уравнения
(42)
Отсюда следует
или
. (43)
Соотношение (43) позволяет наглядно выяснить суть оптимального управления по критерию минимума функционала (41). Так, при управление выбирается таким образом, чтобы выходная реакция объекта равнялась заданной траектории . При управление выбирается так, чтобы составляющая выходной реакции объекта, обусловленная действием управления , была равна с обратным знаком составляющей , обусловленной действием возмущений . В этом случае обе составляющие компенсируют друг друга, обеспечивая инвариантность к возмущениям. Другими словами, управление здесь парирует возмущения. Обе функции управления ‑ слежения за заданной траекторией и парирование возмущений, находятся в противоречии друг с другом. Мерой разрешения данного противоречия выступает здесь величина коэффициента .
Следует обратить внимание, что в классической теории управления инвариантность к возмущениям может быть обеспечена путем введения в канал управления дополнительной связи по возмущению с обратным знаком, т. е путем целенаправленного изменения структуры связей в объекте управления. В рассматриваемой задаче упреждающего управления этот способ не выводится аналитически, так как здесь априорно закладывается условие независимости переменных , . При необходимости учета указанного способа компенсации возмущений постановку задачи можно соответствующим образом изменить. Таким образом, структурные соображения и подход, основанный на решении экстремальных задач, здесь являются дополнительными друг другу.
Как и в ранее рассмотренном случае постановка задачи решения интегрального уравнения (43) является некорректной, поэтому необходимо использовать методы регуляризации. Для случая использования регуляризующего функционала (34) соответствующее интегральное уравнение будет иметь вид
(44)
______________________________________
Рассмотренные выше задачи упреждающего управления сводятся к решению систем линейных алгебраических уравнений. Дополнительно в инженерных расчетах на искомые управления могут накладываться ограничения в виде областей допустимых значений
, (45)
Введение ограничений вида (45) в задачах математического программирования не составляет принципиальных сложностей. Вычислительные методы совместного решения систем алгебраических уравнений и неравенств в настоящее время хорошо разработаны. В качестве примера отметим алгоритмы, которые были рассмотрены в пункте 2.4 раздела 2, настоящей работы. При структурном подходе к представлению схем автоматического управления введение ограничений на величины управлений также не представляет сложности. В этом случае вырабатываемые сигналы управления просто ограничиваются по величине в соответствии с заданными условиями.
_________________________________________
В общем случае постановка задачи модельно-упреждающего управления формулируется следующим образом[14].
Ставится задача найти управление технологическим процессом, которое осуществляет его перевод в желаемый режим в рамках заданных ограничений. Управление находится из условия минимума динамической целевой функции:
, (46а)
при заданных модельных ограничениях
(46b)
и при ограничениях в виде неравенств
(46c)
Целевая функция (46а) содержит четыре составляющих, конфликтующих друг с другом.
Первая составляющая
, ; (47)
где – выходная траектория процесса до текущего горизонта прогноза длиною Р;
– желаемая выходная траектория процесса до текущего горизонта прогноза.
Составляющая (47) оценивает отклонение выходной траектории управляемого процесса от желаемой траектории на интервале прогноза , где – текущий момент времени.
Вторая составляющая оценивает уклонение выходной траектории за пределы установленных жестких ограничений
(48)
Здесь , – нижняя и верхняя границы области допустимых значений выходной траектории процесса. Значения вектора определяются соотношениями
.
С учетом сказанного ограничения на область допустимых значений выходной траектории процесса могут быть представлены в виде
Две следующие составляющие целевой функции определяют ограничения на допустимые управления процессом.
Составляющая
, , (49)
определяет уклонение траектории управления от желаемого установившегося значения управления в интервале времени до текущего горизонта управления длиною .
Последняя составляющая
, ,
определяет быстрые вариации управления, которые с целью регуляризации постановки задачи управления должны быть ограничены.
Величины всех указанных составляющих целевой функции вычисляются как нормы векторов. Так, норма отклонения определяется квадратичной формой
.
Остальные нормы уклонений могут быть определены аналогично:
,
,
.
Здесь , , , – положительно-определенные матрицы весовых коэффициентов. Весовые коэффициенты выбираются из предпочтений по минимизации соответствующих составляющих ошибок.
Так, весовые коэффициенты матрицы определяют важность минимизации составляющих отклонений выходной траектории процесса от заданной траектории. Коэффициенты матрицы определяют жесткость выполнения заданных ограничений на допустимую выходную траекторию процесса. С помощью матрицы можно задать ограничения на область допустимых управлений процессом. Например, можно задать терминальные условия, плавное вхождение в терминальный установившийся режим и др. Весовые коэффициенты матрицы ограничивают амплитуду и частоту вариаций управления. Тем самым они выполняют роль коэффициентов регуляризации постановки задачи управления.
Уравнения (46b) описывают динамику управляемого процесса в виде нелинейной динамической системы общего вида. В частных случаях могут быть использованы самые разнообразные модели.
Например, в линейном случае модель динамических процессов может быть следующей
. (50)
Здесь – значение вектора выходных параметров управляемого процесса на текущий момент времени ; – текущее значение вектора управляемых параметров; – текущее значение вектора измеряемых неуправляемых параметров; – текущее значение вектора неизмеряемых неуправляемых параметров; – текущее значение вектора ошибок измерения выходных параметров.
Динамические операторы в выражении (50) представляют собой разностные операторы по структуре аналогичные оператору, приведенному ниже:
,
где – оператор временного запаздывания на один шаг; – матрицы коэффициентов.
Из (50) следует
. (51)
Модель (51) называется авторегрессионной моделью с внешними входами. Неизвестные матрицы коэффициентов данной авторегрессионной модели могут быть определены на основе известных методов, например, рассмотренным выше методом наименьших квадратов.
В целом задача модельно-упреждающего управления (56) относится к классу задач нелинейного программирования. Методы решения подобных задач в настоящее время достаточно разработаны, существует множество эффективных алгоритмов и программ.