С классическим вариационным исчислением

С помощью принципа максимума можно вывести необходимые условия существования экстремума в задачах вариационного исчисления. Рассмотрим динамическую управляемую систему с функционалом

С классическим вариационным исчислением - student2.ru .

Пусть С классическим вариационным исчислением - student2.ru , т.е. управляющие параметры есть скорости изменения фазовых координат. Применим принцип максимума.

Составим гамильтониан: С классическим вариационным исчислением - student2.ru . Используем необходимое условие максимума гамильтониана:

С классическим вариационным исчислением - student2.ru , С классическим вариационным исчислением - student2.ru .

Продифференцируем выражение для С классическим вариационным исчислением - student2.ru по времени: С классическим вариационным исчислением - student2.ru

Согласно канонического уравнения для сопряженных переменных

С классическим вариационным исчислением - student2.ru .

Сопоставляя два последних выражения, получим уравнение Эйлера

С классическим вариационным исчислением - student2.ru .

Условие второго порядка для существования максимума функции Гамильтона определяется как условие отрицательной определенности матрицы вторых частных производных гамильтониана, т.е. матрицы С классическим вариационным исчислением - student2.ru . Из этого условия следует условие положительной определенности матрицы С классическим вариационным исчислением - student2.ru , или С классическим вариационным исчислением - student2.ru , т.е. условие Лежандра.

Согласно принципу максимума, если С классическим вариационным исчислением - student2.ru является оптимальным управлением, то при любом другом управлении С классическим вариационным исчислением - student2.ru

С классическим вариационным исчислением - student2.ru .

Учитывая выражение для гамильтониана, получаем неравенство:

С классическим вариационным исчислением - student2.ru , или

С классическим вариационным исчислением - student2.ru ,

которое есть условие Вейерштрасса.

Таким образом, с помощью принципа максимума получены необходимые условия экстремума в задачах классического вариационного исчисления.

ДИНАМИЧЕСКОЕ ПРОГРАММИРОВАНИЕ

Принцип оптимальности Беллмана.

Уравнение Беллмана

В основе метода динамического программирования лежит принцип оптимальности, сформулированный Р.Беллманом: оптимальный процесс обладает тем свойством, что каким бы ни было начальное управление последующее управление должно быть оптимальным по отношению к состоянию, происходящему от начального управления.

Предположим, что С классическим вариационным исчислением - student2.ru - оптимальная траектория, приводящая систему из начального состояния С классическим вариационным исчислением - student2.ru в конечное С классическим вариационным исчислением - student2.ru , промежуточное состояние С классическим вариационным исчислением - student2.ru соответствует моменту времени С классическим вариационным исчислением - student2.ru (рис.4.1). Согласно принципу оптимальности Беллмана участок траектории С классическим вариационным исчислением - student2.ru представляет собой оптимальную траекторию по отношению к начальному состоянию С классическим вариационным исчислением - student2.ru , т.е. оптимальное управление на участке С классическим вариационным исчислением - student2.ru не зависит от того, каким образом система приведена в состояние С классическим вариационным исчислением - student2.ru .

С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru
С классическим вариационным исчислением - student2.ru

Рис.4.1. Оптимальная траектория

Другими словами, каждый участок оптимальной траектории является оптимальной траекторией относительно своей начальной точки, оптимальное управление не зависит от предыстории движения системы и для будущих моментов времени определяется только состоянием в данный момент. Таким образом, всю траекторию движения системы можно разбить на части, двигаясь от ее конца к началу, и оптимизировать движение по частям.

Рассмотрим задачу оптимального управления динамической системой:

С классическим вариационным исчислением - student2.ru , С классическим вариационным исчислением - student2.ru , С классическим вариационным исчислением - student2.ru , С классическим вариационным исчислением - student2.ru , С классическим вариационным исчислением - student2.ru , С классическим вариационным исчислением - student2.ru ,

С классическим вариационным исчислением - student2.ru .

Требуется синтезировать закон оптимального управления С классическим вариационным исчислением - student2.ru .

Пусть поставленная задача решена. Введем обозначение: С классическим вариационным исчислением - student2.ru - минимальное значение функционала для участка траектории С классическим вариационным исчислением - student2.ru , тогда С классическим вариационным исчислением - student2.ru - есть минимальное значение функционала С классическим вариационным исчислением - student2.ru для измененного относительно С классическим вариационным исчислением - student2.ru состояния и времени. Очевидно, что С классическим вариационным исчислением - student2.ru . Тогда в общем случае независимых изменений состояния и времени получим в соответствии с принципом оптимальности Беллмана

С классическим вариационным исчислением - student2.ru .

Введем допущения о том, что функция С классическим вариационным исчислением - student2.ru непрерывна и непрерывно дифференцируема (во многих задачах эти условия не выполняются). Разложим С классическим вариационным исчислением - student2.ru в ряд Тейлора, отбросив малые величины, получим

С классическим вариационным исчислением - student2.ru .

Подставив в предыдущее выражение, получим

С классическим вариационным исчислением - student2.ru .

Разделив на С классическим вариационным исчислением - student2.ru , при С классическим вариационным исчислением - student2.ru получим

С классическим вариационным исчислением - student2.ru .

Полученное нелинейное дифференциальное уравнение в частных производных относительно функции С классическим вариационным исчислением - student2.ru называется уравнением Беллмана. При решении конкретных задач аналитическое решение можно получить лишь в некоторых частных случаях. В общем случае уравнение Беллмана решается численно.

Функция С классическим вариационным исчислением - student2.ru есть функция текущего состояния системы, ее принято называть функцией будущих потерь или функцией Беллмана. Она является мерой стоимости перехода из точки с координатами С классическим вариационным исчислением - student2.ru в точку с координатами С классическим вариационным исчислением - student2.ru . В задаче Больца функция будущих потерь в конечный момент времени равна терминальному члену, т.е. С классическим вариационным исчислением - student2.ru , в задаче Лагранжа С классическим вариационным исчислением - student2.ru , следовательно, С классическим вариационным исчислением - student2.ru . Эти выражения задают граничные условия для уравнения Беллмана.

Наши рекомендации