Метод циклического покоординатного спуска
Метод циклического покоординатного спуска заключается в изменении каждый раз одной переменной, тогда как другие остаются постоянными. Опишем этот метод для задачи (2.1).
Пусть X0– некоторое начальное приближение, а a0–некоторое положительное число, являющееся параметром алгоритма. Допустим, что уже известны точка XkÎEn и число ak>0 при некотором k³0. Обозначим ej=(0,…,0,1,0,…,0)–единичный координатный вектор, у которого j-я координата равна 1, остальные равны нулю, j=1,…,n. Положим
Sk=ejk, jk=k-n +1, (2.13)
где - целая часть числа k/n. Условие (2.13) обеспечивает циклический перебор координатных векторов e1,…,en, т.е. S0=e1,…, Sn-1=en, Sn=e1,…,
S2n-1=en, S2n=e1….
Вычислим значение функции f(X) в точке X= Xk+ akSk и проверим неравенство
f(Xk+ akSk) < f(Xk). (2.14)
Если оно выполняется, то полагаем
Xk+1= Xk+ akSk, ak+1=ak. (2.15)
В случае, если условие (2.14) не выполняется, вычисляем значение функции f(X) в точке X= Xk -akSk и проверяем неравенство
f(Xk - akSk) < f(Xk). (2.16)
При выполнении условия (2.15) полагаем
Xk+1= Xk - akSk, ak+1=ak. (2.17)
Будем считать (k+1)–й этап удачным, если выполнилось хотя бы одно из условий (2.14) или (2.16). Если же ни одно из этих условий не выполнено, считаем (k+1)–й этап неудачным и полагаем
Хk+1=Xk, ak+1= (2.18)
где lÎ(0;1) –фиксированное число, являющееся параметром алгоритма. Условие (2.18) означает, что если за один цикл из n этапов при переборе направлений всех координатных векторов e1,…,en с шагом ak реализовался хотя бы один удачный этап, то длина шага ak не дробится и сохраняется на протяжении по крайней мере следующего цикла из n этапов. Если же среди последних n этапов ни одного удачного не оказалось, то шаг ak дробится.
Скорость сходимости данного метода невысока. Несмотря на это, метод циклического покоординатного спуска широко применяется на практике благодаря простоте реализации.
Заметим, что такой метод работает плохо, если в выражение минимизируемой функции входят произведения x ix j, т.е. если имеет место взаимодействие между x i, i=1,…,n.
Указанного в конце предыдущего пункта недостатка можно избежать с помощью следующей модификации метода покоординатного спуска, известной под названием метода Зейделя.
Метод Зейделя.
Этот метод заключается в последовательной минимизации функции f(X) по направлению каждого из координатных векторов ej, j=1,…,n всегда начиная из самой последней точки построенной последовательности. После завершения минимизации по направлению последнего координатного вектора en цикл, называемый внешней итерацией, повторяется до тех пор, пока не выполнится одно из возможных условий окончания поиска:
|f(Xk) - f(Xk-n)|<e или || Xk - Xk-n||<e, (2.19)
где e>0 - заданный параметр точности.
Для приближенного решения вспомогательной задачи минимизации
min{f(Xk - a×Sk) |aÎR} (2.20)
на каждом внутреннем шаге внешней итерации целесообразно использовать изученный ранее метод поразрядного поиска. Опишем алгоритм метода Зейделя.
Шаг 0. Задать параметр точности e>0, выбрать точку начального приближения X0ÎEn, вычислить значение функции f(X0), положить k=0.
Шаг 1. Положить j=k-n +1, Sk=ej, где –целая часть числа k/n.
Решить задачу одномерного поиска (2.20), т.е. определить оптимальную величину шага ak=arg min{f(Xk+a×Sk)|aÎR}. Найти новую точку последовательности Xk+1= Xk+akSk и вычислить значение функции f(Xk+1).
Шаг 2. Если j<n , то положить k=k+1 и перейти к шагу 1, иначе – перейти к шагу 3.
Шаг 3. Проверить условие достижения заданной точности (2.19). Если оно выполняется, то перейти к шагу 4, иначе – к шагу 1, положив k=k+1.
Шаг 4. Завершить вычисления, положив X*» Xk+1, f*»f(Xk+1).
Эффективность метода Зейделя существенно зависит от свойств целевой функции f(X). Так, если линиями уровня целевой функции двух переменных являются концентрические окружности, то очевидно, что два шага исчерпывающего спуска приведут в точку минимума из любой начальной точки, т.е минимум такой функции удается с помощью описанного алгоритма найти точно за конечное число шагов.
Метод Хука-Дживса
Эффективность решения задачи (2.1) рассмотренными методами покоординатного спуска можно повысить, если дополнить описанные алгоритмы периодически повторяющимся поиском точки минимума в направлении вектора Xk-Xk-n из точек Xk, k=s×n, где s – количество выполненных внешних итераций. Такой подход и лежит в основе метода Хука-Дживса.
Алгоритм метода Хука-Дживса содержит две основные процедуры:
1) Исследующий покоординатный поиск в окрестности данной точки с целью определения направления убывания функции f(X);
2) Перемещение в направлении убывания.
Опишем вначале алгоритм исследующего покоординатного поиска из заданной точки X с приращениями по каждой координате Dj, j=1,…,n.
Шаг 1. Положить =X, j=1.
Шаг 2. Сделать пробный шаг Y= - Djej,где ej - j-й координатный вектор. Если f(Y)³f( ), то перейти к шагу 3, иначе – к шагу 4.
Шаг 3. Сделать пробный шаг Y= +Djej. Если f(Y)³f( ), то перейти к шагу 5, иначе – к шагу 4.
Шаг 4. Положить =Y.
Шаг 5. Положить j=j+1. Если j£n, то перейти к шагу 2. В противном случае исследующий поиск окончен, т.е. получена точка , для которой f( )<f(X), если ¹X.
В результате исследующего поиска может оказаться, что =X. Тогда исследующий поиск считается неудачным. Если при этом ||D||£e , где e – заданная точность, то полагают X*=X. Если же заданная точность не достигнута, то полагают Dj=Djg, где gÎ(0;1)–коэффициент уменьшения шага и повторяют исследующий поиск.
Опишем теперь полный алгоритм Хука-Дживса.
Шаг 0. Выбрать начальную точку X0ÎEn, вектор приращений D=(D1,…, Dn), коэффициент уменьшения gÎ(0;1), параметр точности e>0, положить k=0.
Шаг 1. Провести исследующий покоординатный поиск из точки Xk и найти точку k. Если k ¹Xk, то перейти к шагу 3, иначе – к шагу 2.
Шаг 2. Проверить условие достижения заданной точности ||D||<e. Если оно выполняется , то перейти к шагу 5, иначе положить Dj=Djg и перейти к шагу 1.
Шаг 3. Сделать “диагональный ” шаг из точки k в направлении вектора k-Xk в точку X= k+( k-Xk )=2 k-Xk.
Шаг 4. Провести исследующий поиск в точке X и найти точку . Если f( )<f( k), то положить Xk= k, k =X и перейти к шагу 3. Иначе положить k=k+1, Xk=X и перейти к шагу 1.
Шаг 5. Завершить вычисления, положив X*=Xk, f *=f(Xk).
Метод Пауэлла.
В основе этого метода лежит рассмотренный в пункте 2.2.2 метод покоординатного спуска Зейделя, дополненный последовательным нахождением направлений убывания после завершения очередной внешней итерации и минимизацией функции f(X) по этим направлениям.
Пусть задана точка начального приближения X0ÎEn. Выполним одну внешнюю итерацию метода покоординатного спуска Зейделя (см. пункт 2.2.2), т.е. найдем точку
Xn= X0+
где ej – единичный координатный вектор, у которого j–я координата равна 1, остальные равны 0, j=1,…,n. При этом величина шага определяется с помощью какой-либо процедуры одномерной оптимизации по a
a j =arg min {f(Xj-1+a ej ) ½aÎR}.
Далее выполняется “диагональный”шаг в направлении убывания функции f(X) по вектору: Sn+1=Xn-X0: Xn+1=Xn+an+1Sn+1, где величина шага an+1 определяется путем минимизации целевой функции в направлении вектора Sn+1 с помощью одномерного поиска по a:
a n+1 =arg min {f(Xn+aSn+1) | a>0}.
Полагая X0=Xn+1, приступаем к выполнению следующей внешней итерации. Описанная процедура повторяется до тех пор, пока не выполнится одно из условий (2.19).
Типовые примеры
Пример 1. Решить задачу минимизации функции двух переменных f(X)=5x12+5x22+8x1x2 из начальной точки X0=(5;5)Т методом покоординатного спуска Зейделя.
Заметим, что линии уровня данной целевой функции - соосные эллипсы с центром в начале координат, большая ось которых наклонена под углом 135° к оси х1. Результаты расчетов по приведенному в пункте 3 алгоритму приведены в таблице и графически проиллюстрированы на рис.5. При нахождении очередной точки Xк минимизирующей последовательности происходит смещение по прямой, параллельной одной из координатных осей, до точки с наименьшим на этой прямой значением функции f(X). Очевидно, эта точка будет точкой касания рассматриваемой прямой и соответствующей линии уровня.
|
Рис.5. Траектория поиска методом
покоординатного спуска Зейделя(к примеру1).
Пример 2. Решить задачу минимизации функции f(X)=(x1+1)2+x22 методом Хука-Дживса из начальной точки X0=(2;3)T.
Зададим вектор перемещения D=(2;3)T. Исходное значение функции в начальной точке f(X0)=18. В соответствии с алгоритмом, описанным в пункте 4, сначала проводим исследующий поиск из точки X0
x1(1)=2+0,5=2,5; f(2,5;3)=21,25 (неудача);
x1(1)=2-0,5=1,5; f(1,5;3)=15,25 (успех);
x2(1)=3+1=4; f(1,5;4)=22,25 (неудача);
x2(1)=3-1=2; f(1,5;2)=10,25 (успех).
Исследующий поиск оказался удачным. Теперь из новой точки X1=(1,5;2)T перемещаемся в направлении убывания по вектору X1-X0 в точку X2=2X1- X0:
x1(2)=2×1,5-2=1; x2(2)=2×2-3=1; f(1;1)=5.
Проводим исследующий поиск в точке X1=(1,5;2)T:
x1(3)=1+0,5=1,5; f(1,5;1)=7,25 > f(X2) (неудача);
x1(3)=1-0,5=0,5; f(0,5;1)=3,25 < f(X2) (успех);
x2(3)=1+1=2; f(0,5;2)=6,25 > f(X2) (неудача);
x2(3)=1-1=0; f(0,5;0)=2,25 < f(X2) (успех);
Поскольку f(X3)=2,25< f(X1)=10,25 и перемещение из точки X1 в точку X2=(1;1)T успешно, то вновь перемещаемся по направлению убывания из точки X3 в точку
X4=2X3- X1:
x1(4)=2×0,5-1,5=-0,5; x2(4)=2×0-2=-2; f(-0,5;-2)=4,25.
После этого проводим исследующий поиск в точке X4=(-0,5;-2)T:
x1(5)=-0,5+0,5=0; f(0;-2)=5 > f(X4) (неудача);
x1(5)=-0,5-0,5=-1; f(-1;-2)=4 > f(X4) (неудача);
x2(5)=-2+1=-1; f(-0,5;-1)=1,25 < f(X4) (успех).
Поскольку f(X5)=1,25< f(X3)=2,25 и перемещение из точки X3 в точку X4 можно признать успешным, то последовательность поисков по направлению убывания продолжаем до тех пор, пока на очередном этапе в конце исследующего поиска значение f(X) не окажется больше, чем в предыдущей точке. Тогда из последней проводим исследующий поиск для определения нового удачного направления. На рис.6 приведена графическая интерпретация этапов поиска. Линии уровня целевой функции f(X)=(x1+1)2+x22– концентрические окружности с центром в точке X*=(-1;0). Пунктиром на рисунке выделены траектории исследующего поиска, сплошными линиями – перемещения в направлении убывания. Убедитесь в соответствии графической иллюстрации описанному алгоритму.
Рис.6. Минимизация функции Рис.7. Минимизация функции методом
методом Хука-Дживса (к примеру 2). Пауэлла (к примеру 3).
Пример 3. Рассмотрим графическую иллюстрацию решения задачи минимизации функции f(X)=2x12+x22-x1x2 методом Пауэлла из начальной точки X0=(2;2)T(рис.7).
Линии уровня функции f(X) – соосные эллипсы с центром в начале координат, большая ось которых наклонена к оси x1 под углом 67°,5. Первый шаг делается в соответствии с методом покоординатного спуск Зейделя ( см. 2.2.2 ) из точки X0 в направлении -e1=(-1;0), т.е. минимизируется f(X0– ae1) по a>0 с помощью процедуры одномерного поиска. В результате находится точка X1=X0- a1e1, где a1=arg min{f(X0– ae1)|a>0}. Очевидно, эта точка будет точкой касания с соответствующей линией уровня f(X)=const. Аналогично выполняется второй шаг из точки X1 в направлении -e2=(0;-1) и находится точка X2=X1-a2e2, где a2=arg min{f(X1– ae2)|a>0}. Затем выполняется «диагональный» шаг из точки X2 в направлении вектора X2- X0. Поскольку целевая функция f(X) квадратичная, точку её минимума удалось найти точно за конечное число шагов.