Алгоритм сопряженных градиентов (АСГ)

Этот метод не использует информацию о Алгоритм сопряженных градиентов (АСГ) - student2.ru , а направление поиска Алгоритм сопряженных градиентов (АСГ) - student2.ru выбирается ортогональным и сопряженным всем предыдущим направлениям Алгоритм сопряженных градиентов (АСГ) - student2.ru . Показано, что этим условиям удовлетворяет

Алгоритм сопряженных градиентов (АСГ) - student2.ru (3.11)

где коэффициент сопряжения bt-1 играет важную роль, аккумулируя информацию о предыдущих направлениях поиска. Наиболее известны следующие правила определения bt-1:

Алгоритм сопряженных градиентов (АСГ) - student2.ru (3.12)

Метод сопряженных градиентов имеет сходимость, близкую к линейной, он менее эффективен, чем АПМ, но заметно быстрее АНС. Благодаря невысоким требованиям к памяти и относительно низкой вычислительной сложности, АСГ широко применяется как единственно эффективный алгоритм оптимизации при значительном числе переменных (до нескольких десятков тысяч весов связей при обучении НС).

Эвристические методы обучения НС

Помимо алгоритмов обучения, использующих апробированные методы оптимизации нелинейной целевой функции, создано огромное количество алгоритмов эвристического типа, представляющих собой, в основном, модификацию АНС или АСГ. Подобные модификации связаны с внесением в них некоторых изменений, ускоряющих (по мнению авторов) процесс обучения ИНС. Как правило, эти методы не имеют серьезного теоретического обоснования, однако в них реализуется личный опыт работы авторов с нейронными сетями. К наиболее известным и эффективным эвристическим алгоритмам относятся:

- алгоритм Quickprop Фальмана, содержащий элементы, предотвращающие зацикливание в точках неглубоких локальных минимумов. Изменение весов на шаге t алгоритма осуществляется согласно

Алгоритм сопряженных градиентов (АСГ) - student2.ru (3.13)

где первое слагаемое соответствует АНС, последнее – методу моментов, а средний член Алгоритм сопряженных градиентов (АСГ) - student2.ru предназначен для минимизации (g ~ 10–4) абсолютных значений весов вплоть до возможного разрыва соответствующих связей (при wij » 0). Важную роль в алгоритме Quickprop играет фактор момента aij(t), который подбирается индивидуально для каждого веса Алгоритм сопряженных градиентов (АСГ) - student2.ru и адаптируется к текущим результатам обучения;

- алгоритм RPROP Ридмиллера–Брауна, где при уточнении весов учитывается только знак градиентной составляющей, а ее значение отбрасывается. т.е.

Алгоритм сопряженных градиентов (АСГ) - student2.ru (3.14)

Коэффициент обучения Алгоритм сопряженных градиентов (АСГ) - student2.ru также подбирается индивидуально для каждого Алгоритм сопряженных градиентов (АСГ) - student2.ru с учетом изменения градиента на каждом шаге обучения. Предельные значения Алгоритм сопряженных градиентов (АСГ) - student2.ru для алгоритма RPROP составляют hmin=10‑6 и hmax=50 соответственно. Заметим, что этот алгоритм позволяет значительно ускорить процесс обучения в тех случаях, когда угол наклона целевой функции невелик.

Наши рекомендации