Минимизация на простых множествах
Наиболее простая задача условной минимизации имеет вид
, (6.1.1)
где – множество простой структуры. Например, параллелепипед , шар , линейное многообразие .
Условия экстремума. Точка называется локальной точкой минимума (или просто точкой минимума) в задаче (6.1.1),
если при некотором .
Если то – точка глобального минимума.
Множество называется выпуклым,
если при точка для .
Теорема 1 (необходимое условие минимума 1 порядка). Пусть дифференцируема в точке минимумаx , а –выпуклое множество. Тогда
. (6.1.2)
Доказательство производится от противного. Предполагается, что существует точка не удовлетворяющая (6.1.2). На основе этого предположения на луче находится точка с меньшим значением функции, что противоречит предположению, что – точка минимума.
Условие (6.1.2) означает, что множество и множество , образованное направлениями локального убывания не должны пересекаться.
Для выпуклой удается сформулировать достаточное условие экстремума в терминах первой производной.
Теорема 2 (достаточное условие минимума 1 порядка). Пусть дифференцируема в точке , –выпуклое множество и выполняется условие
,
. (6.1.3)
Тогда –точка локального минимума на .
В условиях теоремы 2 минимум достигается на границе.
Теорема 3 (Необходимое и достаточное условие минимума 1 порядка). Пусть выпуклая на и дифференцируемая в точке функция. Тогда условие
, (6.1.4)
является необходимым и достаточным для того, чтобы был глобальным минимумом на .
Существование и единственность минимума.
Теорема 4 (Вейерштрасса). Пусть –непрерывная на , множество замкнуто, а множество ограничено и непусто для некоторого . Тогда задача (6.1.1) имеет решение.
Если выполняется достаточное условие минимума (6.1.3), то минимум единственный.
Теорема 5 . В условиях теоремы 2 –локально единственная точка минимума.
Как и в случае минимизации без ограничений, единственность решения гарантируется строгой выпуклостью функции .
Дадим изложение основных методов решения задачи (6.1.1).
Метод проекции градиентаявляется обобщением градиентного метода, в котором выход за множество ограничений всякий раз компенсируется посредством перехода в точку проекции
, (6.1.5)
где операция проектирования определена выражением
. (6.1.6)
Теорема 6. Пусть – выпуклая дифференцируемая функция в , градиент которой удовлетворяет условию Липшица с константой . Пусть выпуклое и замкнутое, и . Тогда:
а) ;
б) если сильно выпукла, то со скоростью геометрической прогрессии;
в) если дважды дифференцируема и , то знаменатель прогрессии равен ;
Метод условного градиента. В его основе лежит идея линеаризации функции и использование линеаризации для вычисления направления спуска посредством минимизации методом проекции градиента полученной линейной функции на множестве
, (6.1.7)
. (6.1.8)
Предполагается что задача минимизации (6.1.7) имеет решение, что решение может быть найдено достаточно просто и указано правило выбора шагового множителя .
Теорема 7. Пусть f(x) – выпуклая дифференцируемая функция в , градиент которой удовлетворяет условию Липшица с константой . Пусть выпуклое и замкнутое, и . Тогда предельные точки последовательности – точки минимума и справедливы оценки:
(6.1.9)
(6.1.10)