Аппроксимация зависимостей методом наименьших квадратов
В практике обработки экспериментальных данных могут быть ситуации, когда применение лагранжевой аппроксимации (полиномиальной или сплайновой) не оправдано или в принципе невозможно. Первым примером такой ситуации могут служить случаи, когда набор экспериментальных данных был получен со значительной погрешностью, либо на измеряемую (зависимую) величину влияли некоторые дополнительные, не учитываемые факторы. Для демонстрации этой ситуации на рис.5.5 представлены экспериментальные точки, истинная неизвестная кривая f(x) и аппроксимирующая кривая (x), полученная одним из методов лагранжевой аппроксимации. Второй пример, представленный на рис.5.6, демонстрирует ситуацию, когда экспериментальные замеры в каждом узле проводились неоднократно и, вследствие погрешности измерительных приборов либо каких-либо других факторов, дали разные результаты. В этом случае применение лагранжевой аппроксимации в принципе невозможно, так как каждому узлу xi соответствует несколько разных значений fi.
В этих условиях требуется проводить аппроксимирующую кривую, которая не обязательно проходит через узловые точки, но в то же время отражает исследуемую зависимость и сглаживает возможные выбросы, возникшие из-за погрешности эксперимента.
Рис.5.5. | Рис.5.6. |
Как и в описанных выше методах аппроксимации считаем известными значения экспериментальных данных в узлах f(x i) = f i и через (x) обозначим непрерывную аппроксимирующую функцию. В узлах значения функций f(x) и (x) будут отличаться на величину i = f (x i) - (x i). Отклонения i могут принимать как положительные, так и отрицательные значения. Чтобы не учитывать знаки, возведем каждое отклонение в квадрат, а для оценки близости функций f(x) и (x) возьмем сумму этих квадратов
Q = = . | (5.11) |
Метод построения аппроксимирующей функции (x) из условия минимума величины Q называется методом наименьших квадратов ( далее - МНК).
Наиболее распространен способ выбора функции (x) в виде линейной комбинации
(x) = с0 0(x) + с1 1(x) + … + сm m(x), | (5.12) |
где 0(x), 1(x), …, m(x) - базисные функции; ;
с0, с1, …, сm - коэффициенты, определяемые при минимизации величины Q.
Математически минимум величины Q достигается при равенстве нулю частных производных от Q по всем коэффициентам с0, с1, …, сm:
(5.13) | |
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . | |
Эта система линейных алгебраических уравнений относительно неизвестных с0, с1, …, сm называется системой нормальных уравнений, а матрица ее коэффициентов имеет следующий вид:
(5.14) |
Элементы матрицы (5.14) являются скалярными произведениями базисных функций
. | (5.15) |
Так как , то матрицу (5.14) можно переписать в виде
(5.16) |
Матрица (5.16) называется матрицей Грама.
Расширенная матрица системы (5.13) получается добавлением справа к (5.16) столбца свободных членов
, | (5.17) |
где - скалярные произведения. аналогичные (5.15).
При обработке экспериментальных данных, полученных с погрешностью в каждой узловой точке, обычно начинают с аппроксимации функцией , представленной одной-двумя базисными функциями. После определения коэффициентов сk вычисляется величина Q по формуле (5.11). Если окажется, что , то необходимо расширить базис добавлением новых базисных функций . Расширение базиса необходимо продолжать до тех пор, пока не выполнится условие .