Построение регрессионной модели (определение функции «черного ящика»)

Регрессионные модели. Аппроксимация данных. Подбор формул со многими неизвестными

Построение регрессионной модели (определение функции «черного ящика»)

Задача. Известны данные динамики выпуска продукции предприятия за 10 лет (набор из n=10 экспериментальных точек):

X
Y

X – порядковый номер года с 2001 по 2010; Y – объем валовой продукции предприятия.

Выполним регрессионный анализ, то есть, опираясь на имеющиеся экспериментальные данные, построим регрессионную модель (определим функцию черного ящика), по которой вход преобразуется в выход.

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Схема одномерной регрессионной модели

Экспериментальные точки отображены на графике:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

График экспериментальных данных

Занесите экспериментальные данные в таблицу Excel:

Xi Yi

Результат ввода данных:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Предположим, что экспериментальные данные подчиняются линейному закону, т.е. выдвигаем гипотезу о линейной модели: Y = aX + b.

Построение модели выполним по методу наименьших квадратов, суть которого в том, что необходимо найти такие значения коэффициентов a и b, при которых сумма квадратов отклонений F экспериментальных данных от расчетных (теоретических) значений Y будет минимальной:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Здесь: Ei – ошибки между экспериментальными данными и расчетными значениями Y; F – суммарная ошибка (сумма квадратов отклонений).

Уравнения для Ei и F имеют вид:

Ei = (YiЭксп. – YiТеор.) = Yi – b – aXi, i = 1, …, n.

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Для определения значений b и a, которые доставляют экстремум функции F, находятся частные производные по переменным b и a и приравниваются к нулю (условие экстремума):

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

После раскрытия скобок получится система линейных уравнений:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Для ее решения составьте в Excel таблицу промежуточных вычислений, используя соответствующие формулы и функцию СУММ:

  Xi Yi Xi2 XiYi
Сумма:

Результат ввода

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Полученная система линейных уравнений в матричной форме имеет вид:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Подстановка из таблицы соответствующих значений сумм при решении системы «вручную» дает:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Существуют следующие способы решения системы линейных уравнений (определения коэффициентов b и a):

- методом Крамера;

- методом Гаусса;

- методом обращения начальной матрицы.

При решении системы методом Крамера получаются следующие выражения для b и a:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Введите данное решение в таблицу Excel:

- для коэффициента b:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

- для коэффициента a:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Здесь для вычисления общего числа точек n использована функция СЧЁТ.

Найдем значения b и a «ручным» способом:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Удостоверьтесь, что полученные с помощью Excel и «вручную» значения b и a совпадают.

Существует также способ определения коэффициентов b и a с использованием расчетных формул, представленных в развернутом (скалярном) виде:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

где Построение регрессионной модели (определение функции «черного ящика») - student2.ru – средние значения Y и X (в Excel реализуется функцией СРЗНАЧ).

Решение задачи данным способом выполните на самостоятельной подготовке. Таблица Excel с расчетами этим способом имеет вид:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Итак, найденные значения b = 11.8 и a = 0.89 обеспечивают прохождение графика Y = aX + b как можно ближе одновременно ко всем экспериментальным точкам. Таким образом, получено линейное уравнение: Y = 0.89X + 11.8.

Произведите расчеты теоретических (эмпирических) значений Yiтеор. по данной линейной функции. Для расчетов используйте абсолютные ссылки (знак $) на ячейки с полученными значениями b и a.

Для ожидаемого значения Xож=11 (на 11-й год) определите прогнозное значение Y(Xож=11).

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Теперь необходимо проверить правомерность принятой гипотезы о полученной линейной зависимости Y = 0.89X + 11.8.

Для этого необходимо рассчитать ошибку Ei между экспериментальными точками Y и точками полученной теоретической зависимости Yтеор., суммарную ошибку F, значение стандартного отклонения σ и вероятного отклонения S по формулам:

Ei = Yi – b – aXi, i = 1, …, n

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Значение S связано с σ соотношением:

S = σ/sinβ = σ/sin(90°–arctga) = σ/cos(arctga).

Такая зависимость между S и σ получена из рисунка:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Рис. Связь σ и S

Для проверки правильности принятия гипотезы используется нормальный закон распределения случайных ошибок. На рисунке P – вероятность распределения ошибки.

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Рис. Иллюстрация закона нормального распределения ошибок

Если в полосу, ограниченную линиями Yтеор-S = aX+b-S и Yтеор+S = aX+b+S попадет 68.26% или более из всех экспериментальных точек, то можно сделать вывод о том, что принятая гипотеза о линейной зависимости Y = aX + b верна.

Создайте таблицу для расчетов ошибок между точками экспериментальной и теоретической зависимости:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Примечание: формулы последнего столбца L реализованы с использованием функций ЕСЛИ и И.

Значение суммарной ошибки будет F = 10.62

Значение Построение регрессионной модели (определение функции «черного ящика») - student2.ru .

Значение S = σ/cos(arctg(a)) = 1.38.

Таблица результатов создания регрессионной линейной модели:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Расчеты показывают, что 7 точек из 10 (то есть 70%) попадают в полосу, ограниченную линиями Yнижняя = 0.89X + 11.8 – 1.38 и Yверхняя = 0.89X + 11.8 + 1.38, из чего заключаем: зависимость между входом и выходом модели линейная, то есть выдвинутая гипотеза о линейной зависимости верна.

Проиллюстрируем расчеты на графике:

Построение регрессионной модели (определение функции «черного ящика») - student2.ru

Рис. Найденная линейная зависимость с обозначенным интервалом [–S; +S]

Наши рекомендации