Минимаксные (игровые) задачи синтеза. достаточные условия оптимальности
В предыдущих разделах были рассмотрены методы решения задач синтеза при предположении, что о действующих возмущениях известны все статистические характеристики. Однако во многих случаях информация, которой мы располагаем, является неполной и в статистическом смысле. В одних случаях статистические характеристики возмущений известны лишь с точностью до некоторых параметров. Например известно, что возмущение является гауссовским, но величины математического ожидания и дисперсия точно не известны, известны только пределы их изменений. В других случаях статистические характеристики вообще неизвестны, известно лишь, что возмущения относятся к некоторому классу, например значения возмущений по абсолютным величинам не могут превосходить некоторых значений. В обоих случаях имеет место неопределенность. Для принятия решения о выборе структуры управления в условиях неопределенности обратимся к минимаксному подходу — будем считать оптимальным управление, которое обращает в минимум наибольшее (по возмущениям) значение критерия. Значение критерия, соответствующее этому управлению, будем называть гарантированным, а саму стратегию управления — гарантирующей.
К минимаксным задачам приходим и в случаях игровых ситуаций, когда в процессе управления действуют две стороны, стремящиеся к противоположным целям. При этом стратегия одной из сторон может быть условно отнесена к возмущению с неопределенностью. Справедлива и обратная трактовка: любая минимаксная задача, в том числе и задача синтеза оптимального управления с неопределенностью по возмущению, может рассматриваться как игровая задача. В качестве второго «игрока», стремящегося противодействовать выбору оптимального управления, выступает в данном случае сама природа.
Рассмотрим задачу управления следующей дискретной системой:
где — вектор состояния системы в i-й момент времени; , — векторы управления; . Пусть критерием качества является функция конечного состояния
Полагаем, что управление , стремится обратить критерий (6.23) в минимум, в то время как управление , стремится его максимизировать. При этом считаем, что выбор управления любой стороной производится на каждом шаге управления, причем в распоряжении каждой стороны имеется полная информация как о состоянии системы, так и о стратегии противоположной стороны, предшествующей выбору текущего управления.
Рассмотрим задачу определения гарантирующей стратегии управления , т.е. задачу отыскания величины
Введем в рассмотрение функцию будущих потерь
Как и прежде, функция определяет наилучшее значение критерия (6.23), которое может быть достигнуто при движении системы (6.22) из состояния в момент i.
Очевидно, функция удовлетворяет следующему рекуррентному соотношению:
Из определения функции формально получаем следующее граничное условие:
Так как последовательность управлений , найденная с помощью соотношений (6.24), обеспечивает наилучшее значение критерия (6.23), то совокупность соотношений (6.24) при с учетом (6.25) может рассматриваться как достаточные условия оптимальности при определении гарантирующей стратегии управления системой (6.22) с критерием (6.23).
Как и прежде, можно показать, что в задаче определения гарантирующей стратегии управления системой (6.22) с критерием более общего вида
достаточные условия оптимальности принимают вид рекуррентного соотношения
с прежним граничным условием