Краткие сведения о решении систем нелинейных уравнений

Лекция 9

Нелинейные системы

Краткие сведения о решении систем нелинейных уравнений

Системы нелинейных уравнений могут возникать при интегрировании уравнений движения деформируемых систем, при решении задач оптимизации и во многих других случаях. Наиболее часто количество уравнений в таких системах количество уравнений равно количеству неизвестных. Во всяком случае, это справедливо для большинства задач вычислительной механики.

Общий вид таких систем:

Краткие сведения о решении систем нелинейных уравнений - student2.ru (9.1)

Как обычно запись системы (9.1) можно значительно упростить, введя векторные обозначения. Обозначим Краткие сведения о решении систем нелинейных уравнений - student2.ru ‑ вектор, содержащий неизвестные, а Краткие сведения о решении систем нелинейных уравнений - student2.ru ‑ вектор функций.

Система (9.1) принимает вид

Краткие сведения о решении систем нелинейных уравнений - student2.ru , (9.2)

внешне совпадающий с единственным уравнением с одним неизвестным, методы решения которого были рассмотрены в предыдущих параграфах. Однако обобщение этих методов на многомерный случай представляет существенные трудности.

Краткие сведения о решении систем нелинейных уравнений - student2.ru Начнем, как обычно, с графической иллюстрации (Рис.9.1). Рассмотрим систему двух уравнений с двумя неизвестными:

Краткие сведения о решении систем нелинейных уравнений - student2.ru

На рисунке изображены две поверхности, определяемые уравнениями Краткие сведения о решении систем нелинейных уравнений - student2.ru и Краткие сведения о решении систем нелинейных уравнений - student2.ru . Очевидно, что уравнения Краткие сведения о решении систем нелинейных уравнений - student2.ru и Краткие сведения о решении систем нелинейных уравнений - student2.ru представляют собой уравнения линий пересечения этих поверхностей с плоскостью Краткие сведения о решении систем нелинейных уравнений - student2.ru . Соответственно точка пересечения этих линий и определяет решение исходной системы.

Попытка обобщить эти наглядные представления на системы с большим количеством уравнений, пожалуй, мало полезна. Хотя в некоторых книгах по численным методам (например, [9.1]) можно встретить формулировку типа: Решение представляет собой точку Краткие сведения о решении систем нелинейных уравнений - student2.ru -мерного пространства, в которой Краткие сведения о решении систем нелинейных уравнений - student2.ru гиперповерхностей Краткие сведения о решении систем нелинейных уравнений - student2.ru пересекаются с гиперплоскостью Краткие сведения о решении систем нелинейных уравнений - student2.ru . Звучит красиво, но, на мой взгляд, наглядностью не отличается.

Уже на двумерном случае понятно, что метод половинного деления здесь, к сожалению, не работает. Для одного уравнения этот метод, не отличаясь высокой скоростью, был с другой стороны крайне надежным. Но для одного уравнения в методе бисекций на каждом шаге требовалось вычислить значения функций на границах интервала, то есть всего в двух точках. Уже для двух уравнений аналогичный подход требует определения значений функций на границе двумерной области (пунктирный прямоугольник на рисунке), то есть в бесконечном числе точек.

Краткие сведения о решении систем нелинейных уравнений - student2.ru Более плодотворной выглядит попытка применить идею метода касательных. На рис.9.2 изображены поверхности Краткие сведения о решении систем нелинейных уравнений - student2.ru и Краткие сведения о решении систем нелинейных уравнений - student2.ru . И на этом рисунке видно, что эти две поверхности и плоскость Краткие сведения о решении систем нелинейных уравнений - student2.ru пересекаются в точке, координаты которой и представляют решение системы

Краткие сведения о решении систем нелинейных уравнений - student2.ru

В качестве начального приближения мы принимаем некоторую точку Краткие сведения о решении систем нелинейных уравнений - student2.ru , изображенную на рисунке кружком. На первой поверхности этим значениям аргументов соответствует точка, отмеченная на рисунке крестиком, с координатами Краткие сведения о решении систем нелинейных уравнений - student2.ru . На второй поверхности – точка с координатами Краткие сведения о решении систем нелинейных уравнений - student2.ru . Проведем через точку Краткие сведения о решении систем нелинейных уравнений - student2.ru плоскость касательную к поверхности Краткие сведения о решении систем нелинейных уравнений - student2.ru . На рисунке фрагмент этой плоскости изображен темным треугольником, ограниченным пунктирной линией. Через точку Краткие сведения о решении систем нелинейных уравнений - student2.ru проводим плоскость касательную к поверхности Краткие сведения о решении систем нелинейных уравнений - student2.ru . На рисунке эта плоскость изображена треугольником, ограниченным линиями из точек. Точка Краткие сведения о решении систем нелинейных уравнений - student2.ru , в которой эти плоскости пересекаются между собой и с плоскостью Краткие сведения о решении систем нелинейных уравнений - student2.ru , принимается в качестве очередного приближения. И далее эта процедура повторяется до тех пор, пока не будет достигнута необходимая точность.

Теперь попробуем перевести эти довольно приблизительные рассуждения перевести на язык формул. Для случая Краткие сведения о решении систем нелинейных уравнений - student2.ru уравнений с Краткие сведения о решении систем нелинейных уравнений - student2.ru неизвестными начальное приближение определяется вектором:

Краткие сведения о решении систем нелинейных уравнений - student2.ru

Очередное приближение можно представить как

Краткие сведения о решении систем нелинейных уравнений - student2.ru , или Краткие сведения о решении систем нелинейных уравнений - student2.ru

Если разложить функции Краткие сведения о решении систем нелинейных уравнений - student2.ru , определяющие систему (9.1) в ряд Тейлора в окрестности точки Краткие сведения о решении систем нелинейных уравнений - student2.ru (см, например [9.2]), получим следующие выражения:

Краткие сведения о решении систем нелинейных уравнений - student2.ru (9.3)

Производные здесь вычисляются, разумеется, в точке Краткие сведения о решении систем нелинейных уравнений - student2.ru . В методе Ньютона-Рафсона (методе касательных) при определении очередного приближения мы заменяем функции Краткие сведения о решении систем нелинейных уравнений - student2.ru (криволинейные поверхности) их линейными приближениями (касательными плоскостями), то есть в выражениях (9.3) отбрасываем члены второго порядка малости Краткие сведения о решении систем нелинейных уравнений - student2.ru . Полагая значения функций в левой части уравнений (9.3) равными нулю, приходим к системе уравнений

Краткие сведения о решении систем нелинейных уравнений - student2.ru

В матричной записи эта система выглядит таким образом:

Краткие сведения о решении систем нелинейных уравнений - student2.ru , (9.4)

где

Краткие сведения о решении систем нелинейных уравнений - student2.ru ,

а матрица Краткие сведения о решении систем нелинейных уравнений - student2.ru

Краткие сведения о решении систем нелинейных уравнений - student2.ru (9.5)

представляет собой хорошо известный по курсу матанализа якобиан.

В случае если якобиан не вырожден Краткие сведения о решении систем нелинейных уравнений - student2.ru , система уравнений (9.4) имеет единственное решение: Краткие сведения о решении систем нелинейных уравнений - student2.ru , и очередное приближение решения имеет вид: Краткие сведения о решении систем нелинейных уравнений - student2.ru . Таким образом, итерационная формула метода Ньютона-Рафсона для системы линейных уравнений имеет вид:

Краткие сведения о решении систем нелинейных уравнений - student2.ru (9.6)

Если рассматривать якобиан как обобщение производной, то можно сказать, что формулы этого метода для системы уравнений и для одного уравнения совпадают.

При программной реализации обычно не вычисляют матрицу обратную якобиану непосредственно, а сначала вычисляют поправку, решая систему

Краткие сведения о решении систем нелинейных уравнений - student2.ru , (9.7)

и затем определяют очередное приближение:

Краткие сведения о решении систем нелинейных уравнений - student2.ru . (9.8)

Объем вычислений для систем, естественно, значительно больше, чем для одного уравнения и, к сожалению, не всегда сходится к решению. В программном комплексе MATLAB для решения систем уравнений можно использовать функцию fsolve (содержится в Optimization Toolbox). Если вы поэкспериментируете с этой функцией, то обнаружите, что не так уж редко функция будет сообщать либо о том, что сходимости добиться не удалось, либо о том, что процесс сходится к некоторой точке, но эта точка не является нулем функций системы.

Вообще проблема решения систем нелинейных уравнений вида еще далека от своего окончательного решения. Не случайно, поэтому, хорошие программы предусматривают возможность неудачи и сообщают о ее причинах.

Что касается метода Ньютона-Рафсона, определяемого формулой (9.6), то он, обладает квадратичной сходимостью, превосходя по эффективности другие методы. Однако для его успешной работы необходимо выполнение следующих условий:

· Якобиан должен быть достаточно хорошо обусловленной матрицей. Иначе будет затруднительно вычислить поправку Краткие сведения о решении систем нелинейных уравнений - student2.ru с хорошей точностью.

· Начальное приближение Краткие сведения о решении систем нелинейных уравнений - student2.ru должно быть достаточно хорошим. Иначе первая же поправка, определяемая по формуле (9.7) может дать не приближение к решению, а удаление от него.

В формулировке обоих этих условий присутствует слово достаточно, не отличающееся здесь математической точностью. И действительно, чаще всего, определить ‑ достаточно ли хорошо выбрано начальное приближение можно только предприняв попытку решения.

Поэтому, как правило, метод Ньютона-Рафсона используют в комбинации с другими методами и применяя различные меры предосторожности. Здесь приведем, предложенную в книге [9.3] стратегию решения ‑ относительно простую, но достаточно надежную. Она основана на ограничении величины поправки Краткие сведения о решении систем нелинейных уравнений - student2.ru (уравнения (9.7) и (9.8)) и требовании уменьшения величин функций Краткие сведения о решении систем нелинейных уравнений - student2.ru с каждой поправкой.

1) Вводится ограничение на величину поправки Краткие сведения о решении систем нелинейных уравнений - student2.ru , где Краткие сведения о решении систем нелинейных уравнений - student2.ru ‑ заданный допуск.

2) Если Краткие сведения о решении систем нелинейных уравнений - student2.ru ‑ останов.

3) Вычислить Краткие сведения о решении систем нелинейных уравнений - student2.ru . Здесь используется не формула (9.7) Краткие сведения о решении систем нелинейных уравнений - student2.ru , но решается задача оптимизации (минимизации): определить Краткие сведения о решении систем нелинейных уравнений - student2.ru , обеспечивающее минимум функции Краткие сведения о решении систем нелинейных уравнений - student2.ru Краткие сведения о решении систем нелинейных уравнений - student2.ru при условии Краткие сведения о решении систем нелинейных уравнений - student2.ru . (Здесь должны использоваться специальные методы оптимизации, не рассматриваемые в данном курсе. Ознакомиться с ними можно по упомянутой книге Каханера, Моулера, Нэша)

4) Если Краткие сведения о решении систем нелинейных уравнений - student2.ru , то шаг принимается как удачный, полагается Краткие сведения о решении систем нелинейных уравнений - student2.ru и Краткие сведения о решении систем нелинейных уравнений - student2.ru . Управление возвращается на второй шаг алгоритма.

5) Иначе полагаем Краткие сведения о решении систем нелинейных уравнений - student2.ru . Управление передается на третий шаг алгоритма

Возможно также обобщение метода секущих на многомерный случай. На рис.9.3 приведена соответствующая иллюстрация для системы двух уравнений. В этом случае для первого приближения надо выбрать три начальных точки Краткие сведения о решении систем нелинейных уравнений - student2.ru , Краткие сведения о решении систем нелинейных уравнений - student2.ru , Краткие сведения о решении систем нелинейных уравнений - student2.ru . На каждой из поверхностей Краткие сведения о решении систем нелинейных уравнений - student2.ru (на рисунке показана только одна из этих поверхностей) этим точкам соответствуют три точки 3-х мерного пространства: Краткие сведения о решении систем нелинейных уравнений - student2.ru , Краткие сведения о решении систем нелинейных уравнений - student2.ru , Краткие сведения о решении систем нелинейных уравнений - student2.ru . Через эти три точки можно провести секущую плоскость. На рисунке эта плоскость изображена затемненным треугольником. Пересечение двух таких плоскостей с плоскостью Краткие сведения о решении систем нелинейных уравнений - student2.ru дает точку Краткие сведения о решении систем нелинейных уравнений - student2.ru , которая считается новым приближением. Для следующей итерации одна из ранее выбранных точек 0,1,2 заменяется на новую 3-ю точку.

Краткие сведения о решении систем нелинейных уравнений - student2.ru В случае системы Краткие сведения о решении систем нелинейных уравнений - student2.ru уравнений для проведения гиперплоскости в Краткие сведения о решении систем нелинейных уравнений - student2.ru -мерном пространстве требуется задать Краткие сведения о решении систем нелинейных уравнений - student2.ru точку. В остальном последовательность действий остается такой же.

Существует много разновидностей метода секущих, использующий различные способы выбора точек и различные стратегии решения. Ознакомиться с ними можно по книге Ортеги, Рейнболдта [9.1]. Здесь же отметим только, что метод секущих и в многомерном случае можно рассматривать как вариант метода Ньютона-Рафсона с заменой производных их приближенными выражениями через значения функций в отдельных точках (разностными соотношениями).

Вопрос о сходимости методов здесь рассмотрим на примере метода простой итерации. Так же как и в случае одной функции можно ввести понятия неподвижной точки и сжимающего отображения

Рассмотрим некоторую Краткие сведения о решении систем нелинейных уравнений - student2.ru -мерную вектор-функцию Краткие сведения о решении систем нелинейных уравнений - student2.ru от Краткие сведения о решении систем нелинейных уравнений - student2.ru переменных. Здесь Краткие сведения о решении систем нелинейных уравнений - student2.ru . Эту функцию можно рассматривать как оператор, отображающий точки Краткие сведения о решении систем нелинейных уравнений - student2.ru -мерного пространства на то же самое пространство.

Определение 1. Точка Краткие сведения о решении систем нелинейных уравнений - student2.ru для которой Краткие сведения о решении систем нелинейных уравнений - student2.ru называется неподвижной точкой оператора (функции) Краткие сведения о решении систем нелинейных уравнений - student2.ru .

Определение 2. Оператор (функция) Краткие сведения о решении систем нелинейных уравнений - student2.ru называется сжимающим оператором на некотором множестве Краткие сведения о решении систем нелинейных уравнений - student2.ru , если для любых значений Краткие сведения о решении систем нелинейных уравнений - student2.ru и Краткие сведения о решении систем нелинейных уравнений - student2.ru , принадлежащих этому множеству Краткие сведения о решении систем нелинейных уравнений - student2.ru , выполняется неравенство

Краткие сведения о решении систем нелинейных уравнений - student2.ru , (9.9)

где Краткие сведения о решении систем нелинейных уравнений - student2.ru называется коэффициентом сжатия.

Для исследования сходимости итерационных методов принципиальное значение имеет следующая теорема:

Принцип сжимающих отображений. Пусть оператор Краткие сведения о решении систем нелинейных уравнений - student2.ru определен на множестве Краткие сведения о решении систем нелинейных уравнений - student2.ru , представляющем собой окрестность некоторой точки Краткие сведения о решении систем нелинейных уравнений - student2.ru : Краткие сведения о решении систем нелинейных уравнений - student2.ru и является на этом множестве сжимающим оператором с коэффициентом сжатия Краткие сведения о решении систем нелинейных уравнений - student2.ru , причем

Краткие сведения о решении систем нелинейных уравнений - student2.ru .

Тогда итерационный метод Краткие сведения о решении систем нелинейных уравнений - student2.ru сходится к неподвижной точке оператора Краткие сведения о решении систем нелинейных уравнений - student2.ru при любом начальном приближении Краткие сведения о решении систем нелинейных уравнений - student2.ru .

Доказательства этой теоремы здесь не приводится. Более подробную информацию по этому вопросу можно найти в книгах [9.1, 9.4].

Отметим, что, как и в случае одного уравнения, вместо условия (9.9) можно, с некоторыми оговорками, воспользоваться более строгим условием:

Краткие сведения о решении систем нелинейных уравнений - student2.ru для Краткие сведения о решении систем нелинейных уравнений - student2.ru (9.10)

(норма якобиана функции Краткие сведения о решении систем нелинейных уравнений - student2.ru меньше единицы).

Сформулированный выше принцип сжимающих отображений применим для исследования сходимости только таких итерационных методов, которые являются разновидностями метода простой итерации. То есть метода, который исходную систему уравнений

Краткие сведения о решении систем нелинейных уравнений - student2.ru

заменяет эквивалентной системой вида

Краткие сведения о решении систем нелинейных уравнений - student2.ru

и определяет итерационную последовательность как

Краткие сведения о решении систем нелинейных уравнений - student2.ru

Метод Ньютона-Рафсона удовлетворяет этому описанию, если положить Краткие сведения о решении систем нелинейных уравнений - student2.ru. Метод секущих, в котором для получения очередного приближения используются уже не одна, а несколько точек, уже не является методом простой итерации. И исследование сходимости здесь представляет большие сложности.

Литература

9.1. Ортега Дж., Рейнболдт В. Итерационные методы решения нелинейных систем уравнений со многими неизвестными. – М.: Мир, 1975. – 558 с.

9.2. Смирнов В.И. Курс высшей математики. Том I. – М.: Наука, 1967. – 480 с.

9.3. Каханер Д., Моулер К., Нэш С. Численные методы и математическое обеспечение. – М.: Мир, 1998. – 575 с.

9.4. Самарский А.А., Гулин А.В. Численные методы. ‑ М.: Наука, 1989. – 432 с.

Наши рекомендации