ИНС в системах автоматического управления
Классический подход к созданию систем автоматического управления (САУ) (систем автоматического регулирования – САР) базируется на аппарате интегродифференциального исчисления. Искусственные нейронные сети можно рассматривать как альтернативное направление в теории автоматического управления.
Появление термина «нейроуправление» связано с работами Вербоса, датируемыми 1976 годом. Однако первые практические результаты в данной сфере обозначились только к 1990 году [24].
В САУ ИНС применяются в качестве:
· нейроконтроллеров, выполняющих функции управления динамическими объектами;
· нейроэмуляторов, имитирующих поведение объекта управления в целом или по определенной его характеристике, трудно поддающейся математическому моделированию.
В качестве примера такого приложения ИНС можно привести результаты исследований (на уровне постановки задач и моделей их решения), опубликованные в работе [9].
Пусть ИНС, выполняющая функции нейроконтроллера, реализует управление инерционным колебательным звеном второго порядка, динамика поведения которого описывается дифференциальным уравнением
,
где — переменная, характеризующая состояние объекта управления (выходной сигнал) в момент времени ;
, и — параметры объекта управления, имеющие определенный физический смысл;
— входное воздействие на объект управления как функция времени.
Целью управления является подавление колебательности сигнала на выходе объекта при ступенчатом входном воздействии.
Схема взаимодействия нейроконтроллера с объектом управления и алгоритмом обучения представлена на рис. 20.
Нейроконтроллер (согласно данным о конкретных экспериментах из работы [9]) содержит три ретранслирующих нейрона во входном слое, четыре нейрона – в скрытом слое и один нейрон – в выходном слое (в принятых обозначениях это нейронная сеть NN3-4-1, где первые две буквы представляют аббревиатуру Neuron Network, а следующие три цифры определяют количество нейронов, соответственно, во входном, скрытом и выходном слоях). Все нейроны скрытого и выходного слоев имеют сигмоидальную активационную функцию.
На входные нейроны подаются:
· разность между сигналом воздействия на систему и выходным сигналом объекта управления ;
· производная от этой разности ( – оператор дифференцирования);
· интеграл разности ( – оператор интегрирования).
Выходной нейрон выдает управляющее воздействие .
В качестве алгоритма обучения в приведенной схеме может выступать любой достаточно эффективный алгоритм оптимизации, способный найти значения параметров сети, обеспечивающие минимальное отклонение выходного сигнала объекта от сигнала эталонной модели . Таким алгоритмом может быть генетический алгоритм [9].
Применение алгоритма обратного распространения ошибки в условиях рассмотренной модели не представляется возможным, т.к. он требует информации об ошибке на моторном слое нейронной сети. Получение таковой существенно усложняет задачу.
Обучающий алгоритм настраивает параметры нейроконтроллера по ошибке на выходе объекта управления. При этом эталонная модель описывает желаемое поведение объекта, т.е. выполняет роль библиотеки тренировочных шаблонов.
В машинном эксперименте значение выходного сигнала объекта управления может определяться как результат численного решения системы обыкновенных дифференциальных уравнений:
(8.4)
Качественный вид решения системы (8.4) при ступенчатом входном воздействии представлен на рис. 21.
При обучении нейроконтроллера приходится экспериментировать либо с самим объектом управления, либо с его математической моделью.
В моделировании как проблемной области можно выделить две различные ветви: фундаментализм и эмпиризм.
Классическая ветвь, фундаментализм, базируется на интегро-дифференциальных уравнениях, описывающих физическую (фундаментальную) суть объекта моделирования. Ее отличительной чертой является наличие так называемой фазы анализа, в ходе которой моделируемый объект декомпозируется на элементарные явления известной природы, описываемые простыми (обычно линейными) моделями с единственным коэффициентом и имеющие ясную физическую интерпретацию.
Эмпиризм, к которому относится и нейромоделирование, принципиально исключает фазу анализа. Он базируется на синтетическом (не аналитическом) подходе, моделируя объект сразу целиком в реальных, практических условиях его функционирования без выделения идеальных элементарных явлений. Нейронная сеть способна запомнить и обобщить конкретные эмпирические зависимости и в дальнейшем воспроизвести динамическое поведение объекта. При этом не обязательно акцентировать внимание на том, с чем связана активность того или иного нейрона и какой физический смысл приобретают синаптические веса.
Вместе с тем у обеих ветвей есть нечто общее: параметрический синтез моделей реализуется как процесс оптимизации по заданному набору шаблонов.
Поскольку нейросетевые модели только имитируют динамические характеристики объекта, их называют нейроэмуляторами или предикторами (по их способности предсказывать, прогнозировать следующие состояния объекта на основании текущего и, возможно, нескольких предыдущих состояний).
По глубине предсказания различают одношаговые и краткосрочные предикторы.
Одношаговый предиктор обучается по схеме, представленной на рис. 22. Он получает информацию о текущих состояниях объекта ( и ) от самого объекта ( — временная задержка сигнала на один такт). Поэтому ошибка в предсказании возникает только в пределах текущего шага, не накапливаясь от шага к шагу. Это обеспечивает более точное предсказание по сравнению с краткосрочным предиктором.
Краткосрочный предиктор обучается согласно схеме, представленной на рис. 23. Он может предсказывать поведение объекта на много шагов, отталкиваясь в прогнозе от собственных прогнозов предыдущих шагов. Это может приводить к значительному накоплению ошибки.
|
На основании вышеизложенного рассмотрим предложенную в работе [9] архитектуру САУ, базирующуюся на концепции виртуальной реальности.
Примем, что виртуальный – это значит существующий в понятии или производящий эффект, но не существующий в действительности и не имеющий названия. Виртуальная реальность существует в каждом человеке, который на протяжении всей своей жизни строит и уточняет картину окружающего мира, моделирует себя в этом мире и вырабатывает стратегию своего поведения.
Исходя из данных представлений об интеллекте человека и проводя аналогию, авторы работы [9] подошли к организации САУ следующим образом.
В роли окружающего мира для САУ выступает управляемый объект. Телом системы является нейроконтроллер. Функции мозга системы, с помощью которого она адаптирует себя к окружающему миру, выполняет виртуальный канал управления, содержащий модель объекта управления и модель нейроконтроллера. Схема взаимодействия рассмотренных составляющих изображена на рис. 24.
Исходной для работы системы, представленной на рис. 24, является априорная информация о поведении объекта управления в различных режимах. На основании этой информации синтезируется нейроэмулятор объекта, который копируется в виртуальный канал, где происходит обучение нейроконтроллера. При достижении виртуальным каналом требований эталонной модели параметры виртуального контроллера передаются на исполнительный нейроконтроллер, после чего система готова выполнять свои функции управления.
ВОПРОСЫ И ЗАДАНИЯ ДЛЯ САМОКОНТРОЛЯ
1. Дайте определение нейрокомпьютера.
2. Перечислите основные компоненты, которые должны входить в состав нейрокомпьютера.
3. Определите функции каждой из перечисленных компонент.
4. Изложите Ваши соображения относительно способов реализации каждой из перечисленных компонент.
5. В чем заключается основная идея синтеза схем произвольной комбинационной логики в нейросетевом базисе?
6. Как представляется комбинационная логическая схема в нейросетевом базисе?
7. Какие методы и алгоритмы используются для синтеза комбинационной схемы в нейросетевом базисе?
8. Какими преимуществами обладает подход к синтезу схем произвольной комбинационной логики в нейросетевом базисе?
9. Какие функции нейронная сеть может выполнять в системе автоматического управления?
10. Постройте схему обучения нейроконтроллера для примера управления инерционным колебательным звеном второго порядка.
11. По какой схеме обучается одношаговый предиктор?
12. По какой схеме обучается краткосрочный предиктор?
13. Изложите принципы организации САУ, базирующейся на концепции виртуальной реальности.