С градиентным алгоритмом адаптации
Цель работы: изучение свойств системы с алгоритмом адаптации, синтезированным по градиентному методу, анализ влияния темпа параметрических возмущений на качество процессов и величину управляющего воздействия.
Основные сведения
Градиентный алгоритм относится к базовым алгоритмам адаптации. Вектор градиента всегда направлен в сторону максимального локального роста функции. Следовательно, если вектор скорости настраиваемых параметров направить в сторону антиградиента
, то реализуется последовательный спуск в локальный минимум
(3.1)
Проведем синтез адаптивной системы для одноканального линейного объекта управления
, (3.2)
где u, y – управляющая и выходная переменные соответственно. Параметры объекта ai, bj точно не определены, но заданы (n + m + 1)-мер-ной областью возможных значений Wab. Операторная запись уравнения (3.2) имеет вид
(3.3)
где an (p) = pn + an–1 pn–1 + …+ a0, bm (p) = bm pm + bm–1 pm-1 + … + b0,
pi = di / d ti – оператор i-кратного дифференцирования.
Цель управления зададим предельным соотношением
(3.4)
где yм(t) – эталонная траектория движения, которая удовлетворяет уравнению эталонной модели
(3.5)
здесь r – эталонное входное воздействие на систему. Оператор
является устойчивым, т.е. корни уравнения
имеют отрицательную действительную часть.
Для определения структуры «идеального» закона управления выполним преобразования уравнений (3.2) и (3.5). Вычтем из обеих частей уравнения (3.3) выражение (an (p) y):
0 = bm (p) u – an (p) y. (3.6)
Полагая y = yм, запишем уравнение (3.5)
. (3.7)
Прибавим к обеим частям уравнения (3.6) выражение ( ):
(3.8)
где Далее вычтем из (3.8) уравнение (3.5):
(3.9)
где e = y – yм. Пусть «идеальный» закон управления имеет вид
(3.10)
тогда
(3.11)
Так как полином является устойчивым по условию, то e ® 0при t ® ¥, т.е. закон управления (3.10) позволяет обеспечить выполнение цели управления (3.4). Учитывая неизвестность коэффициентов поли-
номов bm (p)и Dn-1(p), реальный закон управления запишем в виде
(3.12)
с операторами
Если в процессе настройки коэффициентов регулятора (3.12) будет выполнено при t ® ¥, то e ®0, что показывает достижение поставленной цели управления.
Для определения целевой функции введем новое рассогласование (s), которое возникает в результате замены yм на y в уравнении эталонной модели (3.5),
(3.13)
Если вычесть из (3.13) уравнение (3.5), то получим уравнение, описывающее связь между рассогласованиями e и s:
. (3.14)
Из (3.14) следует, что если s ®0 при t® ¥, то в силу устойчивости имеем e ®0при t ® ¥. Следовательно, будет выполнена поставленная цель. Это позволяет задать целевую функцию в виде
(3.15)
Выполним преобразования уравнения (3.13). Просуммируем уравнения объекта (3.8) и регулятора (3.12):
,
приведем подобные и учтем (3.13):
(3.16)
Введем обозначения для вектора неизвестных параметров
вектора настраиваемых параметров
и вектора координатных переменных
Уравнение для рассогласования (3.16) примет вид
. (3.17)
Алгоритм настройки коэффициентов согласно (3.1), (3.15), (3.17) имеет вид
,
или
Методические указания
Объект управления имеет математическую модель вида
= A x + B u, y = C x, (3.18)
где – вектор координат состояния, y – выходная переменная, u – управляющее воздействие, y, u Î
; A, B, C – матрицы коэффициентов соответствующих размерностей;
A = , B =
, C =
, (3.19)
здесь ,
, b – неизвестные коэффициенты, которые могут быть как постоянными, так и переменными. Стационарный объект управления моделируется по схеме, изображенной на рис. 1.1, нестационарный – по схеме, представленной на рис. 1.2. Желаемое поведение системы описывают уравнения эталонной модели:
, (3.20)
где r – входная переменная,
=
,
=
,
=
.
Рис. 1.1
\
Рис. 1.2
Коэффициенты определяются по заданным показателям качества переходного процесса, приведенным в табл. 1.1, статическая ошибка работы системы допускается равной 5 %.
Закон управления формируется в виде
,
или
. (3.21)
Т а б л и ц а 1.1
№ п/п | а0 | а1 | b | ![]() | а0 |
0,1 | 0,5 | 0,1 | |||
0.5 | 1.5 | 0.5 |
Коэффициенты регулятора изменяются по градиентному алгоритму адаптации:
,
, (3.22)
,
.
Структурная схема системы с градиентным алгоритмом адаптации (3.18)–(3.22) изображена на рис. 1.3. В данном случае предполагается «идеальное» измерение требуемых производных выходных переменных. Однако в большинстве реальных технических систем для оценки производных требуется введение наблюдателя состояния или фильтра оценки производных.
Уравнение асимптотического наблюдателя (идентификатора) имеет вид
,
где
причем – желаемый характеристический многочлен наблюдателя, коэффициенты которого определяются, исходя из требо-
ваний к динамическим свойствам: . Заметим, что
причем ,
. Для старшей производной выходной переменной наблюдателя, которая является оценкой соответствующей производной выходной переменной системы, справедливо выражение
или
.
Структурная схема адаптивной системы с наблюдателем изображена на рис. 1.4.
Качество работы адаптивной системы оценить с помощью показателей: перерегулирование (s %), установившаяся ошибка ( ),
s % = ,
,
=
,
где – максимальное значение выходной переменной. Оценкой быстродействия системы выбрано время переходного процесса (
), которое равно интервалу времени с начала работы системы до момента установления значения выходной переменной в диапазоне
.
Моделирование адаптивной системы рекомендуется выполнять в среде MatLab, приложение Simulink.