Алгоритм переменной метрики (АПМ)

В основе АПМ лежит ньютоновский алгоритм оптимизации с использованием вторых производных оценки, т.е. трех первых слагаемых в разложении (3.2). Для достижения минимума Алгоритм переменной метрики (АПМ) - student2.ru необходимо, чтобы Алгоритм переменной метрики (АПМ) - student2.ru , т.е. дифференцированием (3.2) условие оптимальности можно получить в виде Алгоритм переменной метрики (АПМ) - student2.ru с очевидным решением

Алгоритм переменной метрики (АПМ) - student2.ru (3.5)

однозначно указывающим направление, гарантирующее достижение на данном шаге минимальной Алгоритм переменной метрики (АПМ) - student2.ru .

Применение (3.5) требует положительной определенности Алгоритм переменной метрики (АПМ) - student2.ru на каждом шаге, что в общем случае практически неосуществимо, поэтому в известных реализациях алгоритма, как правило, вместо точного Алгоритм переменной метрики (АПМ) - student2.ru используется его приближение Алгоритм переменной метрики (АПМ) - student2.ru , при котором гессиан или обратная ему величина модифицируется на величину некоторой поправки, вычис–ляемой по формулам Бройдена–Флетчера–Гольдфарба–Шенно (BFGS – метод) или Дэвидона–Флетчера–Пауэлла (DFP – метод). Если обозначить Алгоритм переменной метрики (АПМ) - student2.ru то процесс уточнения матрицы V можно описать рекуррентными зависимостями: для BFGS – метода –

Алгоритм переменной метрики (АПМ) - student2.ru (3.6)

а для DFP – метода –

Алгоритм переменной метрики (АПМ) - student2.ru (3.7)

где в качестве начального значения обычно принимается V0=1, а первая итерация выполняется в соответствии с АНС. Показано, что обеспечение с помощью (3.5), (3.6) положительной определенности гессиана на каждом шаге итерации действительно гарантирует решение проблемы оптимизации, причем метод BFGS менее чувствителен к различным погрешностям вычислительного процесса.

АПМ характеризуется более быстрой сходимостью, чем АНС, и именно он в настоящее время считается одним из наиболее эффективных методов оптимизации функций нескольких переменных, а, следовательно, и обучения ИНС. Его недостаток – это большие вычислительные затраты, связанные с необходимостью расчета и хранения в памяти n2 элементов гессиана в каждом цикле, что при оптимизации функции с большим количеством переменных может стать серьезной проблемой. По этой причине метод применяется для не очень больших НС, имеющих не более тысячи взвешенных связей.

3.2.1.3. Алгоритм Левенберга–Марквардта (АЛМ)

Как и АПМ, АЛМ относится к ньютоновским методам оптимизации с заменой Алгоритм переменной метрики (АПМ) - student2.ru приближенным Алгоритм переменной метрики (АПМ) - student2.ru , рассчитываемым на основе имеющейся информации о Алгоритм переменной метрики (АПМ) - student2.ru с учетом некоторого фактора регуляризации. Обозначая

Алгоритм переменной метрики (АПМ) - student2.ru (3.8)

где Алгоритм переменной метрики (АПМ) - student2.ru , вектор градиента Алгоритм переменной метрики (АПМ) - student2.ru и матрицу Алгоритм переменной метрики (АПМ) - student2.ru можно представить в виде

Алгоритм переменной метрики (АПМ) - student2.ru (3.9)

где Алгоритм переменной метрики (АПМ) - student2.ru – компоненты Алгоритм переменной метрики (АПМ) - student2.ru с высшими производными относительно Алгоритм переменной метрики (АПМ) - student2.ru , которые в АЛМ аппроксимируются с помощью скалярного параметра Левенберга–Марквардта u, изменяющегося в процессе оптимизации таким образом, что

Алгоритм переменной метрики (АПМ) - student2.ru (3.10)

В начале обучения, когда значения Алгоритм переменной метрики (АПМ) - student2.ru далеки от решения, используют Алгоритм переменной метрики (АПМ) - student2.ru , т.е. Алгоритм переменной метрики (АПМ) - student2.ru и Алгоритм переменной метрики (АПМ) - student2.ru , однако по мере уменьшения погрешности Алгоритм переменной метрики (АПМ) - student2.ru первое слагаемое в (3.10) начинает играть все более важную роль. Эффективность метода сильно зависит от выбора ut. Существуют различные способы подбора этого параметра, однако наиболее известна методика Д. Марквардта:

– если Алгоритм переменной метрики (АПМ) - student2.ru , то Алгоритм переменной метрики (АПМ) - student2.ru , где r>1 – коэффициент уменьшения u;

– если Алгоритм переменной метрики (АПМ) - student2.ru , а Алгоритм переменной метрики (АПМ) - student2.ru , то Алгоритм переменной метрики (АПМ) - student2.ru ;

– если Алгоритм переменной метрики (АПМ) - student2.ru и Алгоритм переменной метрики (АПМ) - student2.ru , то Алгоритм переменной метрики (АПМ) - student2.ru до достижения Алгоритм переменной метрики (АПМ) - student2.ru .

Заметим, что в непосредственной близости к точке решения u=0, процесс определения Алгоритм переменной метрики (АПМ) - student2.ru сводится к аппроксимации 1–го порядка, а АЛМ превращается в алгоритм Гаусса–Ньютона, характеризующийся квадратичной сходимостью к оптимальному решению.

Наши рекомендации