Математическое описание графиков методом наименьших квадратов
При экспериментальном исследовании различных объектов получение графика зависимости реакции объекта на входное воздействие и его сглаживание не всегда являются достаточными результатами. В ряде случаев необходимо получить еще и математическое описание графика.
Под математическим описанием понимается составление в явном видематематической формулы, наилучшим образом отражающей особенности связи аргумента xi и функции yi в рассматриваемом диапазоне значений аргумента xmin … xmax.
В настоящее время не существует универсального математического метода, который позволял бы по экспериментальным данным сразу указать точный закон связи величин xi и yi . Поэтому обычно поступают следующим образом.
Во-первых,инженер анализирует форму полученного графика и по своему усмотрению назначает тот или иной закон связи аргумента и функции. При этом ему следует учитывать:
1) традиции математического описания функциональных зависимостей, существующие в данной области инженерной деятельности. Инженеру следует понять истоки возникновения этих традиций, их «рациональное зерно», а также решить вопрос о целесообразности придерживаться этих традиций в данном конкретном случае;
2) удобство дальнейшего использования полученного выражения, в том числе удобство его дифференцирования в частных производных.
Во-вторых, инженер, пользуясь известными математическими методами, определяет оптимальные значения числовых коэффициентов назначенного им закона.
Наиболее распространенным методом определения оптимальных значений коэффициентов в произвольно выбранном законе связи аргумента и функции является так называемый метод наименьших квадратов.
Суть этого метода заключается в следующем: коэффициенты аппроксимирующего выражения подбираются так, чтобы сумма квадратов абсолютных погрешностей аппроксимации (Dap.i = yi–yti) была бы минимальной: , где n – количество экспериментальных точек, аyti– теоретические значения ординат, соответствующие конкретным значениям абсцисс.
Методика работы следующая.
1. Назначают в явном виде желаемый закон связи аргумента xiи фунцииyi: yti = y(xi), после чего составляют выражение:
.
2. Полученное выражение дифференцируют в частных производных по всем коэффициентам, входящим в него, и каждый частный дифференциал приравнивают к нулю. Получается система алгебраических уравнений, количество которых равно количеству определяемых коэффициентов.
3. Решают полученную систему алгебраических уравнений. Эту систему можно решить с помощью какого-либо аналитического метода (например, методом Гаусса для системы линейных уравнений) и сразу получить числовые значения коэффициентов. Но так поступать нецелесообразно по двум причинам:
1) потому, что прежде чем пользоваться результатами математических выкладок, разумно сперва убедиться в отсутствии в них ошибок;
2) полученные числовые значения будут частными решениями, справедливыми только для данного массива экспериментальных данных, они не справедливы в общем случае. Поэтому рекомендуется, для того чтобы можно было бы и в будущем пользоваться результатами проделанной работы, а не производить заново необходимые математические выкладки каждый раз при использовании того же самого математического описания графика, сначала вывести в явном виде математические формулы для определения оптимальных числовых значений коэффициентов аппроксимирующего выражения, справедливые для массива экспериментальных данных любого объема, затем проверить их правильность и только после этого определять числовые значения коэффициентов аппроксимирующего выражения, оптимальные для конкретного массива экспериментальных данных.
Методику математического описания графиков методом наименьших квадратов подробно рассмотрим на следующем простейшем примере. Пусть в результате экспериментов получен график некой функциональной зависимости,при анализе которого установлено, что по форме он близок к прямой линии, не проходящей через начало координат. Поэтому принимаем решение аппроксимировать эту функциональную зависимость выражением y= a + bx. Необходимо вывести формулы для определения оптимальных значений коэффициентов a и b.
Составляем выражение: .
Полученное выражение дифференцируем в частных производных сначала по a, затем по b; в результате получаем систему из двух алгебраических уравнений:
[ Пояснение: сложное выражение можно рассматривать как частную реализацию степенной функции Zn, в котором Z= , а n=2; как известно, дифференциал такой функции имеет следующий вид: nZn-1dZ.
Оба равенства сокращаем на множители "2" и "-1" и после раскрытия скобок получаем:
Учитывая, что и что постоянный множитель суммируемых произведений можно вынести за знак суммы: , , , после преобразований получим систему в следующем виде:
Из первого уравнения выражаем коэффициент a:
Это выражение подставляем во второе уравнение и после преобразований получаем формулы для определения оптимальных значений коэффициентов aи b:
.
Учитывая, что при выполнении математических выкладок возможно появление ошибок, то прежде чем воспользоваться полученными формулами, всегда следует предварительно проверить их правильность.
Для этого сначала задаются любыми удобными для расчетов значениями коэффициентов аппроксимирующей функции, отличными от нуля, например: a = 1, b = 1, тогда функция примет вид: yi=1+xi.
Затем задаются не менее чем пятью любыми удобными для расчетов значениями аргумента, одним из которых может быть и ноль, например: -2, -1, 0, +1, +2 и рассчитывают все необходимые величины для определения коэффициентов (таблица 1).
Таблица 1 - Вспомогательные значения величин для расчета aи b.
№ точки | S | |||||
xi | -2 | -1 | ||||
yi | -1 | |||||
xi2 | ||||||
xi·yi |
Полученные значения подставляются в формулы для расчета коэффициентов:
=
=
Рассчитанные значения коэффициентов aи bсовпали с произвольно заданными; это означает, что формулы выведены правильно и их можно использовать для реальных расчетов.
В рассмотренном выше примере математического описания графика методом наименьших квадратов аппроксимирующее выражение было назначено в виде суммы yti= a + bxi,т.е. в виде формулы, которую довольно просто дифференцировать при любом количестве и виде слагаемых. Если же принятое аппроксимирующее выражение является какой-либо сложной нелинейной функцией, трудной для дифференцирования, то тогда целесообразно искать не минимум суммы квадратов абсолютных погрешностей аппроксимации, а минимум суммы квадратов разностей логарифмов этих же функций: .
Опыт показывает, что при выводе формул для определения оптимальных значений коэффициентов аппроксимирующих выражений математические выкладки существенно упрощаются, если в назначенной формуле отсутствует постоянное слагаемое, определяющее значение функции при xi = 0 (в рассмотренном примере это «a»), Поэтому в ряде случаев работу может упростить искусственное перенесение начала координат графика в точку его физического начала путем замены переменных x®v , y®z, и пересчета значений абсцисс ( vi = xi – xmin) и ординат ( zi= yi – a ) графика.
Метод наименьших квадратов характеризуется следующим сочетанием свойств.
1. Он является общепринятым, вследствие чего можно не обосновывать целесообразность его применения в каждом случае употребления.
2. Имеется возможность воспользоваться плодами работы предыдущих поколений математиков и инженеров и найти в соответствующей литературе готовые формулы для определения оптимальных значений коэффициентов аппроксимирующих выражений (следует только помнить о возможности наличия опечаток в источнике информации и потому обязательно проводить проверку правильности этих формул перед использованием по приведенной выше методике).
3. Рассчитанные значения коэффициентов аппроксимирующих выражений оптимальны только для данного диапазона значений аргумента и только для данного количества точек в нем. Добавление или изъятие хотя бы одной экспериментальной точки даже в пределах того же самого диапазона значений аргумента может привести к существенному изменению значений коэффициентов.
4. За границами данного диапазона значений аргумента рассчитанные оптимальные значения коэффициентов в общем случае могут терять свойство оптимальности, поэтому распространять их действие за указанные границы не следует.
5. Когда в данном диапазоне значений аргумента максимальное значение функции отличается от ее минимального значения более чем в 3 раза, то возможна очень грубая аппроксимация при минимальных значениях функции.
6. Как правило, имеет место очень грубая аппроксимация графиков с преимущественно односторонними «выбросами» экспериментальных точек, особенно в области минимальных значений ординат.
Нельзя быть уверенным в том, что при математическом описании графика сразу же, с первой попытки, будет выбрано самое лучшее математическое выражение функциональной зависимости. Поэтому на практике часто выбирают несколько математических законов связи аргумента и функции. Для каждого из них определяют оптимальные числовые значения коэффициентов, рассчитывают теоретические значения функции yti, соответствующие экспериментальным значениям xi, сравнивают их с экспериментальными значениями yi и определяют погрешность аппроксимации для каждого значения аргумента xi (значения погрешностей аппроксимации не должны превышать по абсолютному значениюзаданного допустимого значения dдоп, в противном случае данный вариант математического описания графика немедленно отвергается). Наилучшим математическим описанием признается то, при использовании которого наименьшее значение имеет сумма , либо, что менее обоснованно, получаются наименьшие значения dаp.i для большинства точек экспериментальной зависимости.
Если допустимое значение погрешности аппроксимации не задано, то наилучшим следует признать то выражение, которое обеспечивает погрешность аппроксимации большинства точек меньше суммарной погрешности принятого метода измерений или хотя бы не превышает последнюю.
Если на экспериментально полученном графике имеют место явно «выскакивающие» точки, то как относиться к этому инженер должен решить, сообразуясь с особенностями рассматриваемого процесса – учитывать их или отбросить как промахи.