Понятие об эмпирических формулах. Метод наименьших квадратов
Пусть изучается зависимость между двумя переменными х и у (эксперимент, опыт, наблюдение). В результате опыта получена таблица
x | x1 | x2 | … | xi | … | xn |
y | y1 | y2 | … | yi | … | yn |
По результатам наблюдения возможны погрешности. Отобразим результаты наблюдений точками Мi (xi , yi).
Полученные точки говорят о том, что между переменными х и у явно прослеживается некоторая зависимость.
Если опыт повторить, то возможно будут получены другие точки. Но зависимость будет похожей. Это обусловлено рядом причин: помехи наблюдений, погрешности наблюдений и тому подобное.
Задача заключается в сглаживании экспериментальных данных, то есть в отыскании некоторой функции , которая как можно более точно отображала бы имеющуюся зависимость и описывала бы основную тенденцию изучаемого процесса, исключив погрешности наблюдений (измерений).
Формулы, служащие для аналитического описания экспериментальных данных, называются эмпирическимиформулами.
При этом должны быть решены две задачи:
1. Определить в общем вид зависимости , то есть решить является ли функция линейной, параболической, показательной (возможно, периодической) или какой-то другой.
|
Если задача выбора вида функции решена, то переходят ко второму этапу – отысканию параметров выбранной зависимости. Эти параметры выбирают из тех (и только тех) соображений, чтобы отклонения экспериментальных точек Мi (xi , yi) были бы минимальными от точек с той же ….. абсциссой, лежащих на кривой. Эти отклонения обозначим через для каждой точки и назовем невязками.
При этом нас интересует не каждая невязка отдельно, а суммарная невязка:
Но при малых и при больших невязках сумма невязок близка к нулю из-за различия знаков невязок, то есть сумма невязок никак не характеризует качество выбранной эмпирической функции (как средняя температура по больнице). Другим показателем можно было бы выбрать . Но функция не является всюду дифференцируемой. Поэтому эмпирическую функцию выбирают из тех соображений, чтобы сумма квадратов невязок была минимальной. Такой способ подбора эмпирической формулы называется методом наименьших квадратов.
Используем метод наименьших квадратов (МНК), выбрав в качестве эмпирической функции линейную функцию .
Задача сводится к отысканию параметров а, b таких, чтобы величина - была бы минимальной.
S – есть функция двух переменных S, а величины х, у рассматриваются как заданные постоянные. В соответствии с необходимым условием существование экстремума потребует выполнения условий:
Из свойств суммы вытекает система (10.4), которая называется системой
нормальных уравнений:
Ее определитель не равен нулю, следовательно, она имеет единственное решение.
Если оба уравнения разделить на n, то получим
Решив систему, можно построить эмпирическую кривую
Для решения системы удобно пользоваться таблицей
№ | |||||||
… n | |||||||
Решив систему (10.4. ), найденные значения a и b подставим в уравнение искомой прямой получим линейную функцию, наилучшим образом отражающую зависимость между величинами х и у, полученную в результате наблюдений.