Изучение модели нелинейной регрессии
Цель работы: овладеть способами выбора уравнения нелинейной регрессии, выработать умения и навык расчета параметров уравнения.
Задача. Зависимость между ростом X (тыс. руб.) производительности труда на одного работающего и выпуском Y (тыс. руб.) товарной продукции ремонтного цеха машиностроительного завода характеризуется следующими данными (табл.2.18):
Таблица 2.18
X | 1,5 | 2,9 | 3,0 | 3,1 | 3,2 | 3,4 | 3,5 | 3,6 | 4,2 | 4,3 | 4,8 |
Y |
Содержание работы: необходимо на основании данных:
1. Построить корреляционное поле и по расположению точек определить вид функции регрессии.
2. Записать необходимое уравнение регрессии.
3. Между рассматриваемыми признаками X и Y определить тесноту связи.
4. Найденное уравнение регрессии проверить на адекватность.
5. Изобразить полученную линию регрессии графически.
Выполнение работы
В декартовой системе координат отметим все корреляционные точки и получим корреляционное поле.
Рис. 2.8 Корреляционное поле
Если внимательно посмотреть на данное корреляционное поле, то можно предположить, что через данные точки можно провести ветвь гиперболы. А это значит, что, уравнение регрессии необходимо искать в виде или . Что бы определиться с выбором вида данного уравнения, необходимо проверить следующие условия, представленные в таблице (табл. 1.14).
Рассмотрим формулу . Для нее необходимо проверить следующее равенство: . После вычисления получим:
.
Так как значения 2,28 в теоретических данных нет, то его необходимо найти. Применим для этого линейное интерполирование (ф.1.76):
.
.
Теперь необходимо вычислить отклонения и и проверить выполнение равенства .
Отклонение . Для формулы находим:
.
Так же как и в предыдущем случае находим значение применяя линейное интерполирование (ф.1.76):
.
Перейдем к вычислению отклонения : . Сравним полученные значения. Так как , то по методу необходимых условий необходимо выбирать следующую формулу:
.
Используем теперь метод конечных разностей и произведем выбор одной из выше рассматриваемых формул. Пусть . Необходимо свести эту зависимость к линейной . Применим следующие преобразования: , (табл. 1.14). Вычисляем отношения . Составляем расчетную табл. 2.19.
Рассмотрим теперь зависимость . Пользуясь теоретическим материалом (табл. 1.14), сводим нелинейную зависимость к линейной , где , .Для нахождения отношений составляем расчетную табл. 2.20.
Таблица 2.19
1,5 | 2,9 | 3,1 | 3,2 | 3,4 | 3,5 | 3,6 | 4,2 | 4,3 | 4,8 | ||
1792,2 | 2118,4 | 2376,6 | 2509,5 | 3301,2 | |||||||
922,2 | 181,8 | 41,4 | 258,2 | 132,9 | 280,5 | 511,2 | 95,8 | ||||
1,4 | 0,1 | 0,1 | 0,1 | 0,2 | 0,1 | 0,1 | 0,6 | 0,1 | 0,5 | ||
DY/DX | 658,7 |
Таблица 2.20
X = x | 1,5 | 2,9 | 3,1 | 3,2 | 3,4 | 3,5 | 3,6 | 4,2 | 4,3 | 4,8 | |
y | |||||||||||
Y = 1/y | 0,0017 | 0,0016 | 0,0015 | 0,0015 | 0,0015 | 0,0014 | 0,0014 | 0,0013 | 0,0013 | 0,0013 | 0,0013 |
-0,000106 | -0,0001 | -0,0001 | -0,0001 | ||||||||
1,4 | 0,1 | 0,1 | 0,1 | 0,2 | 0,1 | 0,1 | 0,6 | 0,1 | 0,5 | ||
DY/DX | -0,00008 | -0,00100 | -0,0005 | 0,00000 | -0,00100 |
Отношения , полученные для формулы , мало отличаются друг от друга, чем для формулы . Поэтому по методу конечных разностей в качестве лучшей выбираем формулу . К такому же выводу мы пришли, применяя метод необходимых условий. Итак, зависимость между ростом X (тыс. руб.) производительности труда на одного работающего и выпуском Y (тыс. руб.) товарной продукции ремонтного цеха машиностроительного завода выражается формулой . Оценки и неизвестных параметров истинного уравнения регрессии находим, решая систему нормальных уравнений:
Для вычисления сумм, входящих в систему, составляем расчетную табл. 2.21.
Таблица 2.21
х | ||||
1,5 | 0,0017 | 0,0026 | 2,25 | |
2,9 | 0,0016 | 0,0047 | 8,41 | |
0,0015 | 0,0046 | |||
3,1 | 0,0015 | 0,0046 | 9,61 | |
3,2 | 0,0015 | 0,0048 | 10,24 | |
3,4 | 0,0014 | 0,0049 | 11,56 | |
3,5 | 0,0014 | 0,0049 | 12,25 | |
3,6 | 0,0013 | 0,0046 | 12,96 | |
4,2 | 0,0013 | 0,0053 | 17,64 | |
4,3 | 0,0013 | 0,0054 | 18,49 | |
4,8 | 0,0013 | 0,0060 | 23,04 | |
37,5 | 0,0158 | 0,0525 | 135,45 |
Составляем и решаем систему
Решением является точка (а0, а1) = (0,00204; -0,00018). Поэтому уравнение регрессии примет вид:
.
Оценим силу корреляционной связи между ростом X (тыс. руб.) производительности труда на одного работающего и выпуском Y (тыс. руб.) товарной продукции. Вычислим индекс корреляции по формуле (ф.1.77):
,
где
,
(так как n=11>50). Для нахождения и составляем расчетную табл. 2.20.
Тогда . Связь между ростом производительности труда на одного работающего и выпуском товарной продукции сильная.
Таблица 2.20
1,1 | 91,2025 | |||
1,4 | 22,7 | 22,09 | 52,5625 | |
1,7 | 22,1 | 17,2 | 24,01 | 44,2225 |
2,1 | 19,8 | 16,2 | 12,96 | 18,9225 |
2,6 | 15,1 | 3,61 | 2,4025 | |
4,7 | 12,3 | 11,7 | 0,36 | 9,9225 |
6,1 | 10,7 | 10,2 | 0,25 | 22,5625 |
7,0 | 9,4 | 0,36 | 29,7025 | |
8,2 | 7,5 | 0,49 | 52,5625 | |
12,8 | 6,7 | 6,3 | 0,16 | 76,5625 |
100,29 | 400,0625 |
Проверяем адекватность полученного уравнения регрессии по критерию Фишера — Снедекора (ф.1.78). Находим статистику:
.
При уровне значимости и числах степеней свободы , по таблице критических точек распределения Фишера — Снедекора (приложение 7) находим
.
Так как
,
то модель адекватна. Следовательно, зависимость роста производительности труда на одного работающего и выпуском товарной продукции описывается уравнением .
Построение данной кривой в корреляционном поле предлагается выполнить самостоятельно.
Лабораторная работа № 5.