Оптимальное распределение инвестиций методом динамического программирования

Динамическое программирование (ДП) - метод оптимизации, приспособленный к операциям, в которых процесс принятия решения может быть разбит на этапы (шаги). Такие операции называются многошаговыми. Начало развития ДП относится к 50-м годам XX в. Оно связано с именем Р.Беллмана.

Если модели линейного программирования можно использовать в экономике для принятия крупномасштабных плановых решений в сложных ситуациях, то модели ДП применяются при решении задач значительно меньшего масштаба, например, при разработке правил управления запасами, устанавливающими момент пополнения запасов и размер пополняющего заказа; при разработке принципов календарного планирования производства и выравнивания занятости в условиях колеблющегося спроса на продукцию; при распределении дефицитных капитальных вложений между возможными новыми направлениями их использования; при составлении календарных планов текущего и капитального ремонта сложного оборудования и его замены; при разработке долгосрочных правил замены выбывающих из эксплуатации основных фондов и т. п.

В реально функционирующих больших экономических системах еженедельно требуется принимать микроэкономические решения. Модели ДП ценны тем, что позволяют на основе стандартного подхода с использованием при минимальном вмешательстве человека принимать такие решения. И если каждое взятое в отдельности такое решение малосущественно, то в совокупности эти решения могут оказать большое влияние на прибыль.

Рассматривается управляемый процесс, например, экономический процесс распределения средств между предприятиями, использования ресурсов в течение ряда лет, замены оборудования, пополнения запасов и т. п.

В результате управления система (объект управления) S переводится из начального состояния (So), в конечное состояние (Sn). Предположим, что управление можно разбить на n-шагов, т.е. решение принимается последовательно на каждом шаге, а управление, переводящее систему S из начального состояния в конечное, представляет собой n-шаговый процесс управления.

На каждом шаге применяется некоторое управленческое решение xk, при этом множество х-{х1,х2,...,хn) называется управлением. Метод динамического программирования опирается на условие отсутствия последействия и условие аддитивности целевой функции.

Условие отсутствия последействия. Состояние Sk, в которое перешла система за один K- ый шаг, зависит только от состояния Sk-1 и выбранного управления xk , и не зависит от того, каким образом система пришла в состояние Sk-1:

Sk ( Sk-1, xk )

Также учитывается, что выбор управления на k-ом шаге зависит только от состояния системы к этому шагу:

xk (Sk-1 )

На каждом шаге управления xkзависит от конечного числа управляющих переменных. Состояние системы на каждом шаге зависит от конечного числа параметров.

Принцип оптимальности. Каково бы ни было состояние s системы в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех последующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный. Основное требование, при котором принцип верен - процесс управления должен быть без обратной связи, т.е. управление на данном шаге не должно оказывать влияния на предшествующие шаги.

Таким образом, решение на каждом шаге оказывается наилучшим с точки зрения управления в целом.

Рекуррентные соотношения Беллмана.

Нахождение оптимального решения управляемого процесса можно произвести на основе рекуррентных соотношений Беллмана. Пусть fk (Sk-1,xk) - показатель эффективности k – ого шага при всевозможных управлениях Оптимальное распределение инвестиций методом динамического программирования - student2.ru . Выделяют обратную и прямую схемы Беллмана.

Таблица 6. Значения прибыли предприятий

Объем выделенных ресурсов Прибыль от проектов
Q f1 f2 f3 f4 f5
133043,0 3060740,0 2952286,5 1979010,0 379411,2
8201178,2 13468259,6 53695480,7 13852142,7 10686411,7
11768570,1 21560779,5 80905781,1 22327479,0 18422504,8
14984721,7 29653133,1 108116081,5 30802815,3 26158598,0
17207052,5 37745486,7 135326382,0 37940550,2 33399897,8
19429383,4 44484228,3 162536682,4 44223736,0 40567270,2

В данной таблице 6. представлены значения прибыли (F;(Q)),которые были получены путем решения производственно-экономической задачи каждого инвестируемого предприятия. Эти значения изменяются в зависимости от объемов вложенных инвестиции.

Таблица 7. Данные о дополнительном доходе предприятий

Выделяемые ресурсы Дополнительный доход от проектов
Q P1 P2 P3 P4 P5
7 068 135,2 9407519,6 50743194,2 11873132,7 10307000,5
2 567 391,9 8092519,9 27210300,4 8475336,3 7736093,1
2 216 151,6 8092353,6 27210300,4 8475336,3 7736093,2
1 222 330,8 8092353,6 27210300,5 7137734,9 7241299,8
1 222 330,9 6738741,6 27210300,4 6283185,8 7167372,4

В данной таблице 7. представлены данные о дополнительном доходе, которое предприятие-инвестор получит от каждого инвестируемого предприятия в зависимости от объема вложенных инвестиций.

В таблице 8. рассчитаны показатели эффективности (Zi(Q)) инвестируемых предприятий, которые были получены с помощью прямой схемы Беллмана.

Таблица 8.Показатели эффективности

Выделяемые ресурсы Дополнительный доход от проектов
Q Z1 Z2 Z3 Z4 Z5
7 068 135,2 9 407 519,6 50 743 194,2 50 743 194,2 11 873 132,7
2 567 391,9 16 475 654,8 60 150 713,8 62 616 326,9 22 180 133,2
2 216 151,6 15 160 655,1 58 835 714,1 59 218 530,5 19 609 225,8
1 222 330,8 15 160 488,8 58 835 547,8 59 218 530,5 19 609 225,9
1 222 330,9 15 160 488,8 58 835 547,8 57 880 929,1 19 714 432,5

Рассмотрим нахождение каждого из показателей эффективности:

Для показателей эффективности одного предприятия [Zi(Q)]Zi(0) = pi(0)=0

Z1(200’000)= p1(200'000)=7068135,2

Z1(400'000)= p1(400'000)=2567391,9

Z1(600'000)=p1(600'000)=2216151,6

Z1(800'000)=p1(800'000)=1222330,8

Z1(l'OOO'OOO)= p1(l'000'000)=122233,09
Для показателей эффективности двух предприятий [Z2(Q)].

Z2(0)=p2(0)=0

Z2(200'000)= max{0 + 70 68135,2; 94 07519,6 + 0)=9407519,6

Z2(400'000)= max{0 + 25 67391,9; 94 07519,6 + 70 68135,2; 80 92519,9 + 0}=16475654,8

Z2(600'000)=max{0 + 22 16151,6; 94 07519,6 +25 67391,9 ; 80 92519,9
+70 68135,2
; 80 92353,6 + 0)=15160655,1

Z2(800'000)= max{0 + 12 2233,08; 94 07519,6 + 22 16151,6; 80 92519,9 + 25 67391,9; 80 92353,6 + 70 68135,2: 80 92353,6 + 0}=15160488,8

Z2(l'000'000)=max{0 + 12 22330,9; 94 07519,6 + 12 22330,8; 80 92519,9 +22 16151,6; 80 92353,6 + 25 67391,9; 80 92353,6 + 70 68135,2; 67 38741,6 + 0}=15160488,8

Для показателей эффективности трех предприятий [Z3(Q)].

Z3(0)= p3(0)=0

Z3(200'000)= max (0 + 94 07519,6; 507 43194,2 + 0)=50743194,2

Z3(400'000)= max {0 + 8092519,9; 507 43194,2 + 94 07519,6; 272 10300,4 + 0}=60150713,8

Z3(600'000)= max {0 + 8092353,6; 507 43194,2 + 8092519,9; 272 10300,4+94 07519,6; 272 10300,4 + 0}=58835714,1

Z3(800'000)= max {0 + 8092353,6:507 43194,2 + 8092353,6; 272 10300,4 +9407519,6; 272 10300,4 + 8092519,9; 272 10300,5 + 0}= 58835547,8

Z3(l "000'000)= max {0+6738741,6; 507 43194,2 + 8092353,6; 272 10300,4 + 8092353,6; 272 10300,4 + 8092519,9; 272 10300,5 + 94 07519,6; 27210300,4+0}=58835547,8

Для показателей эффективности четырех предприятий [Z4(Q)].

Z4(0)=p4(0)=0

Z4(200'000)= max (0 + 507 43194,2; 118 73132,7 + 0}= 507 43194,2

Z4(400'000)= max {0 + 27210300,4; 118 73132,7 + 507 43194,2; 84 75336,3+0}=62616326,9

Z4(600'000)= max {0 + 27210300,4; 118 73132,7 + 27210300,4; 84 75336,3 + 507 43194,2; 84 75336,3 + 0}= 59218530,5

Z4(800'000)= max {0 + 27 210 300,5; 11 873 132,7 + 27 210 300,4; 8 475 336,3+27 210 300,4; 8 475 336,3 + 50 743 194,2; 71 37734,9 + 0}=59218530,5

Z4(l '000'000)= max {0 + 27210300,4; 118 73132,7 + 27210300,5; 84 75336,3+ 27210300,4; 84 75336,3 + 27210300,4; 71 37734,9 + 507 43194,2; 62 83185,8+0}=57880929,1

Для показателей эффективности пяти предприятий [Zs(Q)].

Z5(0)=p5(0)=0

Z5(200'000)= max (0 + 11873132,7; 103 07000,5 + 0}= 11873132,7

Z5(400'000)= max (0 + 8475336,3; 103 07000,5 + 11873132,7; 77 36093,1+ 0}=22180133,2

Z5(600'000)= max (0 + 8 475 336,3; 10 307 000,5 + 8 475 336,3; 7 736 093,1+11 873 132,7; 7 736 093,2 + 0}=19609225,8

Z5(800'000)= max {0 + 7137734,9; 10 307000,5 + 8 475336,3; 77 36093,1 + 8475336,3; 77 36093,2 + 11873132,7; 72 41299,8 + 0}= 19609225,9

Z5(l '000000)= max {0 + 6283185,8; 103 07000,5 + 7137734,9; 77 36093,1 + 8475336,3;7736093,2+ 8475336,3; 72 41299,8+11873132,7; 71 67372,4+, 0}=19714432,5

После получения последнего показателя эффективности [Zs(l 000 000)] можно получить решение задачи:

Z5(1'000'000)= 103 07000,5 + 59218530,5 = 69525531,00 Q1 = 20 000 000p.

Z4(800'000)= 118 73132,7 + 58835714,1 = 70708846,80 Q2 = 20 000 000p.

Z3(600'000)= 507 43194,2 + 16475654,8 = 67218849,00 Q3 = 20 000 000 p.

Z2(400'000)= 94 07519,6 + 7068135,2 = 164756548 Q4 = 20 000 000p.

Z1(200000) = p!(200'000)= 70 68135,2 Q5 = 20 000 000р.

Для получения максимальной прибыли предприятием- инвестором выделенные ресурсы (денежные средства в размере 100 000 000 рублей) должны быть распределены следующим образом - каждому инвестируемому предприятию следует выделить по 20 000 000 рублей. При этом максимальный объединенный показатель эффективности будет равен 70 708 846,80 рублей.

Заключение

Решение задачи распределения ресурсов между пятью предприятиями,
(ОАО «Весёлый молочник», ОАО «Нижнекамская пищевая компания», ООО «Сэлдом», ООО «СтройКом», ОАО «Счастье») было произведено методами линейного и динамического программирования.

Метод линейного программирования позволил найти оптимальные планы производства продукции и значения прибыли каждого предприятия в зависимости от объема выделенных инвестором денежных средств. Также этим методом были найдены значения прибыли, которую получит каждое из инвестируемых предприятий без выделения инвестором дополнительных ресурсов (денежных средств): ОАО «Весёлый молочник» - 133 043,0 рублей; ОАО «Нижнекамская пищевая компания» - 3060740,0 рублей; ООО «Сэлдом», - 2952286,5 рублей; ООО «СтройКом», - 1979010,0 рублей; ОАО «Счастье» - 379411,2 рублей.

Метод динамического программирования позволил определить оптимальный план распределения ресурсов между предприятиями, который обеспечит предприятию-инвестору максимальную совокупную прибыль.

Оптимальный план распределения ресурсов предполагает, что каждое предприятие должно получить от инвестора определенное количество дополнительных средств:

1. 20 000 000 рублей - ОАО «Весёлый молочник»;

2. 20 000 000рублей - ОАО «Нижнекамская пищевая компания»;

3. 20 000 000 рублей - ООО «Сэлдом»;

4. 20 000 000 рублей - ООО «СтройКом»;

5. 20 000 000 рублей – ОАО «Счастье».

Данный оптимальный план предполагает, что максимальный объединенный, показатель эффективности (совокупная прибыль от пяти предприятий) будет равен 70 708 846,80 рублей.

Список использованной литературы

1. Учебное пособие «Экономико-математические модели и методы. Динамическое программирование», составители: Смирнов Ю.Н., Шибанова Е.В., Набережные Челны: Изд-во КамПИ, 2004 год.

2. Учебное пособие «Экономико-математические модели и методы. Линейное программирование», составители: Смирнов Ю.Н., Шибанова Е.В., Набережные Челны: Изд-во КамПИ, 2004 год;

3. Курс лекций по математическому моделированию Смирнова Ю.Н, 2007-2008 гг;

4. «Исследование операций в экономике: Учебное пособие для вузов», Н.Ш. Кремер, Б.А. Путко, И.М. Тришин, М.Н. Фридман; М.: Юнити,

2000 год;

5. «Математическое программирование в примерах и задачах»/И.Л.Акулич, Москва 2004 г. – 317стр.

Наши рекомендации