Классификация дифференциальных уравнений
Здесь будет рассмотрен минимальный объем информации о дифференциальных уравнениях, их классификации. Так же будут описаны основные подходы к решению различных типов уравнений. По возможности, я постараюсь не влезать в математические премудрости, предельно упрощая формулировки[3].
Во-первых, уравнения бывают линейными и нелинейными. Пусть из уравнения требуется найти некоторую функцию f, и для функций f1 и f2 известно, что они являются различными решениями данного уравнения. То если f1+a(f2-f1) (где a - некоторое число) – является решением уравнения, то уравнение называется линейным, в противном случае – нелинейным.
На практике, как правило, определить линейность уравнения можно гораздо проще. Если ни в один из членов уравнения ни функция, ни ее производные не входят более чем в первой степени, и нет произведений различных производных функции между собой или произведений функции на ее производные – то уравнение линейное.
Примером линейного уравнения может служить уравнение сохранения массы
Все неизвестные входят в это уравнение линейно. В дальнейшем, чтобы не затенять суть ненужной писаниной, для показа применения численных методов будем использовать более простое уравнение. Во-первых, будем рассматривать одномерное (по пространству) уравнение. Во-вторых, будем считать скорость известной и постоянной. Неизвестную переменную (в данном случае - плотность) обозначим буквой f, а известную постоянную (в данном случае – скорость) – буквой a. Получаем
.
Это уравнение описывает распространение чего-либо со скоростью a. В частности, оно описывает распространение волн, поэтому его часто называют одномерным волновым уравнением.
В качестве примера нелинейного уравнения рассмотрим уравнение сохранение импульса
Скорость входит в него нелинейным образом. Снова подберем уравнение, обладающее теми же свойствами, но более простое. Отбросим правую часть, рассмотрим одномерный (по пространству) и будем считать плотность постоянной. Обозначим неизвестную буквой f. Получаем уравнение Бюргерса
.
Это же уравнение можно записать в дивиргентном виде (без коэффициента перед производной)
.
В дальнейшем будем рассматривать применение численных методов к нелинейным уравнениям вида
,
где F(f) – некоторая известная функция от искомой неизвестной.
Линейность уравнения – очень полезное свойство. Для линейных уравнений человечество придумало множество методов: аналитических, численных, методов оценки погрешности и т.д. При решении нелинейных уравнений часто их аппроксимируют линейными (т.н. линеаризация уравнений) и ищут решение этих упрощенных уравнений. Часто после решения линейных уравнений оказывается, что первоначальная аппроксимация нелинейных уравнений оказалась недостаточно точной. Тогда процесс приходится повторять до достижения требуемой точности (т.н. итерации по нелинейности).
Кроме того для нелинейных уравнений может нарушаться условие единственности решения, т.е при одном и том же наборе начальных и граничных условий может существовать два или более решений. Это соответствует тем физическим случаям, когда существуют два или более режимов. Примером могут служить явления гистерезиса. Применительно к плазме можно привести другой пример: газоразрядное устройство, газ есть, напряжение подано, разряда нет. Небольшое воздействие (дополнительная эмиссия электронов или кратковременное повышение напряжения) зажигают разряд, который после этого устойчиво горит при тех же условиях, при которых только что не горел. Чтобы избежать неединственности решения часто вводят дополнительные условия или ограничения.
Большинство реальных процессов в природе (в том числе и в плазме) наиболее полно и точно описываются нелинейными уравнениями.
Если искомая функция или ее производные входят во все члены уравнения, то уравнение называется однородным, в противном случае – неоднородным. Если функция f является решением линейного однородного уравнения, то af – также является решением этого уравнения. Упоминавшееся выше уравнение сохранения импульса – неоднородное, т.к. в правой части стоят члены независящие от скорости.
Порядком дифференциального уравнения называется максимальный порядок производной неизвестной функции, входящей в данное уравнение. Как правило, в математических моделях плазмы фигурируют только первые и вторые производные неизвестных функций. Соответственно, используются дифференциальные уравнения первого и второго порядка.
Упоминавшиеся выше уравнения являются уравнениями первого порядка. Если в уравнениях сохранения импульса и энергии учитывать вязкость, диффузию и теплопроводность, то в правых частях появятся члены с производными второго порядка. В качестве простого уравнения второго порядка будем рассматривать «цветовое» уравнение
Название это уравнение получило за то, что описывает изменение концентрации чернил в жидкости, движущейся со скоростью a. Коэффициент b определяет диффузию чернил в жидкости.
Теперь рассмотрим общие подходы к решению дифференциальных уравнений. Рассмотрим для начала одно дифференциальное уравнение первого порядка. Для получения единственного решения необходимо задать в какой-либо точке значение функции. Получаем так называемую задачу Коши. Далее необходимо в какой-то соседней точке найти решение тем или иным методом. Мы приходим к задаче, аналогичной исходной, но с начальным условием в новой точке. Двигаясь так дальше, мы получаем решение во всей расчетной области.
Следующий случай. Система дифференциальных уравнений первого порядка. Здесь возможны варианты. В простейшем случае все условия, необходимые для единственности решения, поставлены в одной точке. Тогда это тоже задача Коши, и ее решают соответственно. Но возможен и другой случай: условия поставлены в разных точках. Например, часть условий поставлена на одной границе расчетной области, а остальные – на противоположной. Тогда задачу сводят к задаче Коши. Такой подход называют методом стрельбы. На одной границе ставят полный комплект условий: в качестве недостающих задают приближенные значения функций и их производных, для которых значения на этой границе не заданы (аналогично условиям, стоящим на другой границе). Решают задачу Коши («стреляют»). Естественно, с первого раза промахиваются: решение на другой границе не соответствует изначально стоящим там условиям. Тогда подправляют нами поставленные дополнительные условия на первой границе и «стреляют» снова. И так до получения требуемой точности.
Теперь вспомним, что система дифференциальных уравнений аналогична системе из меньшего числа уравнений (или даже одного) большего порядка. Таким образом, система уравнений первого порядка обладает свойствами уравнений второго (иногда и большего) порядка. Вот уравнениями второго порядка сейчас и займемся.
Пусть в некоторой системе координат дифференциальное уравнение второго порядка записывается в виде
На классификацию уравнений влияют только коэффициенты при вторых производных. Если хотя бы один из коэффициентов A, B, C равен нулю, то уравнение называется параболическим. Если эти три коэффициента имеют один знак, то уравнение называется эллиптическим, если разные – гиперболическим. В различных моделях плазмы можно встретить все три типа уравнений.
Для определения типа системы уравнений можно либо применять математические методы (здесь не описываются), либо анализировать описываемые физические процессы (для человека с инженерным образованием это, как правило, проще). Обычно исходят из предположения, что решение существует, и рассматривают реакцию системы на внесение малого возмущения.
Начнем с гиперболических уравнений. Они типичны для систем, где возмущения распространяются без затухания, но не на всю расчетную область. Показано, что соответствующая система уравнений эквивалентна системе уравнений первого порядка таких, что решение каждого из уравнений не меняется вдоль некоторой линии. Эти линии называются характеристиками. Физически эти линии, как правило, являются границами области влияния возмущения. Часто, многие эффекты, возникающие в системе, описываемой гиперболическими уравнениями, можно показать на одном уравнении первого порядка (чем мы в дальнейшем воспользуемся).
Примером гиперболического уравнения является волновое уравнение
где a – скорость распространения волны. Оно эквивалентно системе уравнений первого порядка
можно показать, что функции произвольные f1(at+x) и f2(at-x), являющиеся функциями одной переменной каждая, являются решениями системы уравнений. При этом семейства линий at+x=const и at-x=const являются характеристиками. Наконец, исходная функция находится в виде f=f1+f2.
Доказывается это так. Исходное уравнение представляется в виде
Перейдем от переменных t и x к переменным ζ и η. Выберем
Производные в исходном уравнении преобразуются к виду
Тогда исходное уравнение преобразуется к виду
Решением этого уравнения является сумма функций одной переменной
Приведем пример физического процесса, соответствующего приведенному только что математическому примеру. Нестационарное бесстолкновительное движение зарядов в одномерном (по пространству) случае. Кулоновским взаимодействием зарядов пренебрежем. Носители заряда бегают в обоих направлениях со скоростью a. Рассмотрим распределение зарядов на отрезке [0,L]. В момент времени t=0 распределение задано. Вопрос: как оно будет меняться по времени, и какие нужны еще условия, чтобы рассчитать это распределение на большом промежутке времени? Изобразим схематично расчетную область на рисунке.
x |
L |
t |
характеристики |
Область зависимости |
Область влияния |
Если выбрать какую-то точку расчетной области (точка характеризуется положением в пространстве и моментом времени), то для того, чтобы определить от чего зависит значение в этой точке, надо провести через нее характеристики. Значение будет зависеть от значений функции (в данном случае распределения зарядов) в предыдущие моменты времени в области, ограниченной характеристиками. Если в этой точке изменить значение функции (внести возмущение), то оно повлияет в последующие моменты времени на область, опять же ограниченную характеристиками.
Возвращаясь к рисунку, рассмотрим область, где можно определить значения искомой функции, зная только распределение в начальный момент времени. Эта область ограничена характеристиками, идущими с концов отрезка. Точка пересечения характеристик (отмечена красным на рисунке) является последней (по времени) точкой, в которой можно определить значение функции. Если взять последующие моменты времени, то для однозначного определения значения не хватает информации. Характеристики, исходящие из таких точек будут упираться в левую и правую границы расчетной области. А что оттуда будет приноситься – пока не задано. Следовательно, надо задать граничные условия на этих границах, т.е зависимости значения функции на концах отрезка от времени.
Рассмотрим теперь случай наличия переносной скорости, т.е. к значениям скоростей частиц-переносчиков заряда добавим скорость, превышающую a. Тогда характеристики будут иметь наклон в одну сторону. Следовательно, граничное условие можно поставить только с одной стороны. Основные свойства таких систем часто можно рассмотреть даже на примере одного уравнения первого порядка.
Если все необходимые начальные и граничные условия поставлены, то такие уравнения можно решать маршевым методом. Т.е. считая слой за слоем по времени. Нулевым слоем является заданное для начального момента времени распределение. Нужно рассчитать все значения (по пространственной координате) в некоторый следующий момент времени. Тогда получаем задачу, аналогичную исходной. Продолжаем считать слой за слоем до достижения заданного момента времени.
Теперь рассмотрим параболические уравнения. Они типичны для систем, где возмущения распространяются с затуханием, но не на всю расчетную область. Обычно, механизм затухания связан с диффузией, вязкостью или теплопроводностью. Характеристики здесь не играют такой роли, как в гиперболических системах. В некотором смысле можно считать это предельным случаем, когда характеристики имеют нулевой угол наклона, т.е. вырождаются в прямую t=const.
С точки зрения физики такие свойства означают, что возмущения мгновенно распространяются в пространстве. Естественно, в природе такого нет. Но, поскольку параболические хорошо описывают многие процессы, то они широко используются для описания этих процессов.
Примером параболического уравнения является уравнение теплопроводности
где a – коэффициент теплопроводности. Аналогичными урванениями описываются диффузия и вязкость. В этих случаях коэффициент в уравнении является соответственно коэффициентом диффузии или вязкости.
Как следует из названия, приведенное выше уравнение описывает распространение тепла в неподвижной среде (например, газ с нулевой скоростью).
Рассмотрим распределение температуры на отрезке [0,L]. В момент времени t=0 распределение задано. Теперь, чтобы однозначно рассчитать изменение температуры по времени нам необходимо задать изменение температуры на обеих границах. В отличие от гиперболических уравнений для параболических ни при каких обстоятельствах не удастся ограничиться заданием изменения функции на одной границе. Изобразим схематично расчетную область на рисунке.
x |
L |
t |
Область зависимости |
Область влияния |
Если выбрать какую-то точку расчетной области, то значение в ней будет зависеть от значений функции (в данном случае распределения температуры) в предыдущие моменты времени на всем отрезке. Если в этой точке изменить значение функции (внести возмущение), то оно повлияет во все последующие моменты времени на значения на всем отрезке.
Как и в предыдущем случае, параболические уравнения можно решать маршевым методом. Т.е. считая слой за слоем по времени. Нулевым слоем является заданное для начального момента времени распределение. Нужно рассчитать все значения (по пространственной координате) в некоторый следующий момент времени. Тогда получаем задачу, аналогичную исходной. Продолжаем считать слой за слоем до достижения заданного момента времени.
Осталось рассмотреть эллиптические уравнения. Они типичны для некоторых стационарных систем, где возмущения распространяются на всю расчетную область. Обычно такие уравнения описывают потенциалы полей (например, электрического или магнитного) или течений.
С точки зрения физики такие свойства означают, что возмущения распространяются в пространстве во все стороны на неограниченные расстояния (возможно затухая).
Примерами эллиптических уравнении являются уравнение Лапласа
и уравнение Пуассона
Примерами физических величин, описываемых эллиптическими уравнениями, являются температура и концентрация в стационарных случаях, где необходимо учитывать теплопроводность и диффузию. Эллиптическими уравнениями часто описываются распределения скоростей в стационарных течениях, где необходимо учитывать вязкость.
Отдельно нужно сказать о потенциалах векторных полей. Векторное поле называется потенциальным, если равен нулю интеграл по любому замкнутому контуру от проекции вектора на касательную к этому контуру. Математически это записывается
Для скоростей в плазме это условие, как правило, удовлетворяется, если можно пренебречь вязкостью. Для индукции магнитного поля это справедливо в случае стационарного электрического поля при условии, что поле, создаваемое внешней магнитной системой, много интенсивнее поля, создаваемого токами внутри расчетной области. Для напряженности электрического поля потенциал (в математическом смысле) существует только в случае стационарного (или нулевого) магнитного поля. Как правило, для векторного поля известно еще одно уравнение вида
Тогда можно ввести потенциал, удовлетворяющий уравнению
при этом компоненты векторного поля находятся из уравнения
Введение потенциала (где это возможно) очень удобно, так как сокращает число искомых функций. Так в случае трехмерного потенциального течения вместо решения трех уравнений для трех компонент скорости можно решить одно уравнение для потенциала, после чего компоненты скорости легко находятся как производные от потенциала.
Рассмотрим распределение температуры в области, задаваемой неравенствами 0£x£Lx и 0£y£Ly. Оно описывается уравнением Пуассона, где коэффициент в правой части равен отношению выделяемой в единице объема мощности к теплопроводности. Чтобы однозначно рассчитать распределение температуры необходимо задать граничные условия (распределение температуры) на всех границах. Изобразим схематично расчетную область на рисунке.
x |
Lx |
Y |
Область зависимости |
Область влияния |
Ly |
Если выбрать какую-то точку расчетной области, то значение в ней будет зависеть от значений функции (в данном случае распределения температуры) во всех остальных точках расчетной области. Если в этой точке изменить значение функции (внести возмущение), то оно повлияет на значения во всей расчетной области.
Важно отметить, что даже в случае наличия разрывов в граничных условиях, решение внутри расчетной области получается непрерывным.
Как правило, эллиптические уравнения решаются методом установления. При этом вводится новая переменная (как правило, время), а к уравнениям в левой части приписывают первую производную по новой переменной. Таким образом, уравнения превращаются из эллиптических в параболические. Задается начальное приближение. Далее задача решается маршевым методом по новой переменной до тех пор, пока изменения между слоями не станут меньше некоторой заранее выбранной величины, зависящей от требуемой точности. Как правило, решение дифференциальных уравнений (не только эллиптических) сводят к решению системы алгебраических уравнений. В простейших случаях в эту систему алгебраических уравнений новая переменная (например, время) может не входить.
Теперь несколько слов о классификации граничных условий. Как правило, при моделировании плазмы используются три типа граничных условий:
1) условие Дирихле. На границе задается значение функции. Именно оно использовалось в приведенных выше примерах.
2) Условие Неймана. На границе задается значение производной функции. Часто применяется для параболических и эллиптических уравнений. Для эллиптических уравнений не рекомендуется, чтобы условия Неймана стояли на всех границах.
3) Смешанное. На границе задается линейная комбинация условий Дирихле и Неймана.
Лекция 4. Информационная. Рассматриваются численные методы решения дифференциальных уравнений. Излагаются методы конечных разностей. Излагаются понятия аппроксимации и устойчивости разностных схем.