Управление конечным состоянием

В ряде задач характер движения объекта в процессе управления интереса не представляет, а существенным является только состоя­ние хп, в которое переходит объект по окончании про­цесса управления. При этом критерием качества управ­ления будет служить значение целевой функции в конце процесса управления, т е. величина

Управление конечным состоянием - student2.ru

Рассмотрим путь поиска оптимального управления Управление конечным состоянием - student2.ru . На метода Беллмана конечным состоянием, который заключается в том, что если система находилась в состоянии Управление конечным состоянием - student2.ru , то необходимо найти оптимальное управление Управление конечным состоянием - student2.ru , которое на последующих шагах k+1,…,n приводило бы к максимуму целевую функцию Управление конечным состоянием - student2.ru .

Функция Управление конечным состоянием - student2.ru носит название локального оптимума на k-м шаге (условный оптимум).

Беллман предложил следующий путь поиска локального оптимума. Записывается уравнение целевой функции на k-м шаге в виде:

Управление конечным состоянием - student2.ru ,

где Управление конечным состоянием - student2.ru m- число возможных подсостояний хк , Управление конечным состоянием - student2.ru - оптимальная (максимальная) целевая функция или локальный оптимум на k+1 шаге; i=1,…z - число возможных подуправлений Uk.

Из уравнения видно, что оптимальная целевая функция на k-м шаге определяется путем поиска максимума суммы оптимальной целевой функции на (k+1)-м шаге и эффективности перехода из (k-1)-го состояния в

k-е состояние.

Пользуясь указанной формулой, Беллман предложил локальную оптимальную целевую функцию, а следовательно, и оптимальное управление для каждого k-го состояния определять, начиная с конечного состояния Управление конечным состоянием - student2.ru , т.е. двигаясь с конца к исходному состоянию. Такое предложение позволяет существенно упростить расчеты, т.к.

Управление конечным состоянием - student2.ru ,

а для вычисления целевой функции на (n-1)-м шаге используется уже известная оптимальная целевая функция на n-м шаге Управление конечным состоянием - student2.ru :

Управление конечным состоянием - student2.ru .

Зная оптимальную целевую функцию на (n-1)-м шаге, можно найти оптимальную целевую функцию на (n-2)-м шаге и т.д. до 1-го шага.

Таким образом, можно построить ряд локальных (условных) оптимумов. Условность состоит в том, что оптимальный переход осуществляется из состояния Управление конечным состоянием - student2.ru . Ряд условных оптимумов представляется в виде последовательности

Управление конечным состоянием - student2.ru .

Для каждого условного оптимума определяется условное оптимальное управление в виде последовательности

Управление конечным состоянием - student2.ru .

Окончательным решением задачи является определение безусловных оптимумов и безусловных оптимальных управлений, т.е. необходимо выстроить обратный ряд ряд вида:

Управление конечным состоянием - student2.ru .

Методика построения и решения задачи средствами

динамического программирования

Построение задачи ведется в следующей последовательности.

1. В поставленной задаче выделяются состояния Управление конечным состоянием - student2.ru и выбирается способ деления процесса на шаги k=1,…, n.

2. Каждое из состояний xk представляется в виде множества подсостояний Управление конечным состоянием - student2.ru и определяется управление Управление конечным состоянием - student2.ru .

3. Записывается уравнение, определяющее состояние Управление конечным состоянием - student2.ru , являющееся функцией предыдущего состояния Управление конечным состоянием - student2.ru и управления Управление конечным состоянием - student2.ru , в виде Управление конечным состоянием - student2.ru ; j =1,…m, i=1,…, z..

4. Вводится показатель эффективности для каждого k-го перехода Управление конечным состоянием - student2.ru .

5. Составляется общая целевая функция в виде суммы эффективностей на k-х шагах Управление конечным состоянием - student2.ru .

6. Для наглядности можно построить граф модели.

Этапы решения задачи следующие.

1. Записываются уравнения Беллмана для k-го и n-го шагов в виде: Управление конечным состоянием - student2.ru Управление конечным состоянием - student2.ru

Управление конечным состоянием - student2.ru ,

Управление конечным состоянием - student2.ru .

2. Определяется ряд условных оптимальных управлений Управление конечным состоянием - student2.ru .

3. Строится ряд безусловных оптимумов и безусловного оптимального управления. Если начальное состояние x0 единственное, то максимум

общей целевой функции равен условному оптимуму 1-го перехода Управление конечным состоянием - student2.ru .

Далее выстраивается ряд Управление конечным состоянием - student2.ru .

Выполняется это следующим образом. Предполагается, что система находится в состоянии x0 . Из всех вариантов перехода на первом шаге выбирается тот, у которого Управление конечным состоянием - student2.ru максимален. Исходя из этого выбирается оптимальное Управление конечным состоянием - student2.ru . Указанная процедура повторяется для всех последующих состояний Управление конечным состоянием - student2.ru .

4. Если начальных состояний x0i несколько i=1,…m и они составляют множество Управление конечным состоянием - student2.ru , то максимум целевой функции определяется по формуле Управление конечным состоянием - student2.ru .

Далее строится ряд Управление конечным состоянием - student2.ru .

Наши рекомендации