Метод динамического программирования, функция состояния, уравнение Беллмана

Динамическое программирование представляет собой математический аппарат, разработанный для решения некоторого класса задач математического программирования путем их разложения на относительно небольшие и, следовательно, менее сложные задачи. Специфика метода динамического программирования состоит в том, что для отыскания оптимального управления планируемая операция разделяется на ряд последовательных шагов или этапов. Соответственно и сам процесс планирования операции становится многошаговым и развивается последовательно, от этапа к этапу, причем каждый раз оптимизируется управление только на одном шаге.

В основе динамического программирования лежат 2 принципа:

Первый- принцип оптимальности Беллмана: каковы бы ни были начальное состояние системы и принятое решение, все последующие решения на остальных шагах должны составлять оптимальную стратегию относительно состояния, возникающего в результате первого решения.

Второй- принцип вложения: природа задачи, допускающая использование метода динамического программирования, не меняется при изменении числа шагов.

Структура процессов, исследуемых методом динамического программирования, должна удовлетворять следующим условиям:

· небольшое число переменных

· * управляемый процесс- Марковский, т.е. предыстория не имеет значения при определении будущих действий

· * критерий эффективности J является аддитивным.

Состояние на каждом шаге характ-ся некоторой переменной величиной, кот. называется параметром состояния. Наилучший эффект на данном этапе вместе с уже рассмотренными шагами хар-ся функцией состояния. Решение конкретной задачи методом динамич. программирования сводится к выбору параметра состояния, составлению ф-ии состояния и рекурентных соотношений, связывающих ф-ии состояния для двух соседних последовательных этапов, и их применению для выбора оптимального управления.

72. Составить математическую модель и записать функциональное уравнение Беллмана (рекуррентное соотношение), расшифровать все переменные и функции, входящие в него для следующей задачи:

Предприятие производит некоторое изделие, на которое оно имеет заказ на п месяцев.

Необходимо спланировать объем выпуска Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru и хранения Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru

продукции для каждого месяца его работы при условии, что суммарные затраты на производство и хранение продукции за п месяцев будут минимальными при полном удовлетворении спроса на продукцию. При этом уровень запасов к началу первого месяца Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru задан, а к концу последнего Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru . Известны также спрос Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru на продукцию в каждом j-м месяце и затраты Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru на производство Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru и хранение Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru единиц продукции в каждом j-ммесяце.

F(x1, x2, x3, x4) =f1(x1) + f2(x2) + f3(x3) + f4(x4)

x1+x2+x3+x4= Z(700)

gk= max( fk(xk) + gk-1 (Z-xk)) F= g4(Z)

xk= 0, 100, 200, 300, 400

G3 F3   0 100 200 300 400

g3(400) =105

73.Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Предполагается, что Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru принимают целые неотрицательные значения.

2). Пусть требуется загрузить в самолет грузоподъемностью W тоннгруз, состоящий из предметов п различных типов, таким образом, чтобы стоимость всего груза была

максимальной. Для каждого предмета j-го типа, j= 1,2,. . . ,п, заданы вес Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru в тоннах и

стоимость Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru в тысячах рублей одного предмета этого типа, где все Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru и Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru -целые

положительные числа. Причем предметов каждого типа можно загружать в самолет по несколько штук.

Ур-ние Беллмана: Fk*(ξ) = max {fk (xk) + Fk-1(ξ-xk)} = fk( Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru ) + F(ξ- Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru )

0 Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru xk Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru ξ xk

0 Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru ξ Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru b

Fk*(ξ) – max приращение прибыли по k предприятиям.

74.Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Средства в размере b млн. рублей распределяются между п предприятиями в количествах,

кратных а млн. руб., причем Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru - целое число. При выделении j-му предприятию Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru млн. рублей оно приносит доход Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru млн. рублей.Требуется распределить выделенные средства так, чтобы суммарный доход по всем предприятиям был максимальным.

Ур-ние Беллмана: Fk*(ξ) = max {fk (xk) + Fk-1(ξ-xk)} = fk( Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru ) + F(ξ- Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru )

0 Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru xk Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru ξ xk

0 Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru ξ Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru b

Fk*(ξ) – max приращение прибыли по k предприятиям.

Обозначим через Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru прирост мощности или прибыли на i-м предприятии, если оно получит Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru рублей капитальных вложений. Требуется найти такое распределение Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru капитальных вложений между предприятиями, которое максимизирует суммарный прирост мощности или прибыли

Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru при ограничении по общей сумме капитальных вложений Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru причем будем считать, что все переменные Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru принимают только целые неотрицательные значения: Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru или Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru или Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru или Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru

Функции Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru мы считаем заданными, заметив, что их определение – довольно трудоемкая экономическая задача. Введем параметр состояния и определим функцию состояния. За параметр состояния Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru примем количество рублей, выделяемых нескольким предприятиям, а функцию состояния Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru определим как максимальную прибыль на первых Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru предприятиях, если они вместе получают Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru рублей. Параметр Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru может изменяться от Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru до Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru . Если из Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru рублей Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru -е предприятие получит Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru рублей, то каково бы ни было это значение, остальные Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru рублей естественно распределить между предприятиями от первого до Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru -го так, чтобы была получена максимальная прибыль Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru . Тогда прибыль Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru предприятий будет равна Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru . Надо выбрать такое значение Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru между Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru и Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru , чтобы эта сумма была максимальной, и мы приходим к рекуррентному соотношению Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru для Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru . Если же Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru , то Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru (при условии, что функция Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru возрастающая).

75. Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Предприятие может производить п видов изделий, располагая некоторым ресурсом в объеме

b единиц (b - целое положительное число). Известны затраты ресурса Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru на изготовление

одного изделия j-го вида, а также известна ожидаемая прибыль сj от реализации одного

изделия j-го вида ( Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru . - целые положительные числа), j = 1, 2,..., п.

Требуется составить план выпуска изделий, максимизирующий суммарную прибыль.

Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru Требуется найти такой план выпуска изделий (x1,x2, ... , xn), которое максимизирует суммарную прибыль: z = c1x1 + c2х2 + ... + cnxn

при ограниченности ресурсов:

причем все переменные xj принимают только целые неотрицательные значения: xj = 0, 1, 2 ...

За параметр состояния x принимаем количество ресурсов, выделяемых для производства нескольких видов изделий, а функцию состояния Сk(x) определим как максимальную прибыль при производстве k видов изделий, если для их производства имеется x единиц ресурса, функцию Аk(x) как издержки при производстве k видов изделий, если для их производства имеется x единиц ресурса. Параметр x может изменяться от 0 до b.

Fk(x)=max{(ck-ak) xk + Сk-1(x-xk)-A k-1(x-xk)}, 0 £ xk £ x

76. Составить математическую модель и записать функциональное уравнение Беллмана
(рекуррентное соотношение), расшифровать все переменные и функции, входящие в него
для следующей задачи:

Пусть п предприятиями некоторого объединения должен быть произведен определенный

продукт в количестве bединиц. При изготовлении хj единиц продукта на j-м предприятии

издержки составляют Метод динамического программирования, функция состояния, уравнение Беллмана - student2.ru денежных единиц. Требуется спланировать производство

Наши рекомендации