Применение нейронных сетей для решения задач идентификации объектов управления

ИВАНОВ И.А., КОМАРОВ И.О., ИГЭУ, г. Иваново

Науч. рук. доцент ТЕТЕРЕВКОВ И.В.

В процессе создания автоматизированных систем часто возникает необходимость проведения идентификации объекта управления. Существует большое количество методов, позволяющих получить искомую модель. Но часто классические подходы оказываются слишком затратными или просто невозможными. Например, при сильном влиянии шумов для получения кривой разгона, пригодной для обработки, необходимо провести значительное количество опытов. Это приводит к снижению технико-экономической эффективности объекта управления, так как он работает не в оптимальном режиме. Кроме того, большинство используемых методов непригодно для идентификации объекта в замкнутом контуре регулирования, а значит, система автоматического регулирования на время эксперимента должна быть отключена.

Желание снизить экономические потери, также как и требование проведения идентификации объекта в замкнутом контуре управления приводит к необходимости появления новых подходов для решения рассматриваемой задачи. Одним из наиболее привлекательных вариантов является использование генетических алгоритмов, реализующих при поиске решения идеи эволюции и естественного отбора. Еще один перспективный путь основан на применении нейронных сетей.

Изначально нейронные сети создавались как математический аппарат для восстановления некоторых зависимостей (наиболее удачное применение – задача распознавания образов). Но по своей сути идентификация также относится к подобному классу задач, что делает применение нейронных сетей в этой области крайне привлекательным.

Получить искомое решение можно с помощью двух подходов. Первый предполагает построение функциональной модели. В этом случае главная задача сети – выдавать на выходе такие же значения, что и объект при подаче на вход сети того же сигнала, что и на входе объекта. Таким образом, сеть становится неким «имитатором» объекта. При этом ее внутренняя структура может быть практически любой: количество слоев и нейронов в каждом слое, а также вид функций активации нейронов ничем не ограничиваются. Строго определенными являются только количества нейронов во входном и выходном слоях: они соответствуют числу входов и выходов в создаваемой модели.

Естественно, что сеть перед использованием должна быть подвергнута процессу обучения, что может занять довольно продолжительное время. Затем подобная нейронная сеть может быть использована в качестве «заменителя» объекта в процессе наладки элементов АСР. При этом основным недостатком является невозможность применения такой модели для решения задачи аналитической настройки регуляторов.

Более перспективным может стать построение параметрической модели. В этом случае задачей нейронной сети является не создание имитатора, а нахождение параметров, определяющих динамические и статические свойства объекта. Например, на выходе сеть может выдавать коэффициенты передаточной функции или разностного уравнения. В последнем случае структура нейронной сети определяется только порядками Z-передаточной функции. Количество нейронов во входном слое соответствует количеству слагаемых в правой части рекуррентного разностного уравнения, а выходной слой содержит всего один нейрон с функцией активации в виде суммирования. На выходе сеть должна выдавать тот же сигнал, что и на выходе объекта. Промежуточный слой является единственным, а веса синаптических связей соответствуют коэффициентам разностного уравнения. Таким образом, после обучения такая сеть в явном виде определит коэффициенты разностного уравнения. Для обучения наиболее подходящим является метод обратного распространения ошибки, который (ввиду крайне простой структуры сети) приводит к достаточно простым формулам перестроения весов.

Авторы использовали изложенный подход для построения нескольких параметрических моделей. Исследования показали его полезность и позволили сделать два практических вывода:

- Время, необходимое на обучение модели, возрастает вместе с повышением порядков разностного уравнения.

- Качество получаемого решения в значительной степени зависит от обучающей выборки: входной сигнал объекта не должен обладать «бедным» спектром, особенно в случае построения моделей низких порядков.

Необходимые теоретические выкладки, а также основные результаты, подтверждающие заявленные положения, приведены в докладе.

УДК 62-503.55

Наши рекомендации