Изучение модели нелинейной регрессии

Цель работы: овладеть способами выбора уравнения нелинейной регрессии, выработать умения и навык расчета параметров уравнения.

Задача. Зависимость между ростом X (тыс. руб.) производительности труда на одного работающего и выпуском Y (тыс. руб.) товарной продукции ремонтного цеха машиностроительного завода характеризуется следующими данными (табл.2.18):

Таблица 2.18

X 1,5 2,9 3,0 3,1 3,2 3,4 3,5 3,6 4,2 4,3 4,8
Y

Содержание работы: необходимо на основании данных:

1. Построить корреляционное поле и по расположению точек определить вид функции регрессии.

2. Записать необходимое уравнение регрессии.

3. Между рассматриваемыми признаками X и Y определить тесноту связи.

4. Найденное уравнение регрессии проверить на адекватность.

5. Изобразить полученную линию регрессии графически.

Выполнение работы

В декартовой системе координат отметим все корреляционные точки и получим корреляционное поле.

Рис. 2.8 Корреляционное поле

Если внимательно посмотреть на данное корреляционное поле, то можно предположить, что через данные точки можно провести ветвь гиперболы. А это значит, что, уравнение регрессии необходимо искать в виде или . Что бы определиться с выбором вида данного уравнения, необходимо проверить следующие условия, представленные в таблице (табл. 1.14).

Рассмотрим формулу . Для нее необходимо проверить следующее равенство: . После вычисления получим:

.

Так как значения 2,28 в теоретических данных нет, то его необходимо найти. Применим для этого линейное интерполирование (ф.1.76):

.

.

Теперь необходимо вычислить отклонения и и проверить выполнение равенства .

Отклонение . Для формулы находим:

.

Так же как и в предыдущем случае находим значение применяя линейное интерполирование (ф.1.76):

.

Перейдем к вычислению отклонения : . Сравним полученные значения. Так как , то по методу необходимых условий необходимо выбирать следующую формулу:

.

Используем теперь метод конечных разностей и произведем выбор одной из выше рассматриваемых формул. Пусть . Необходимо свести эту зависимость к линейной . Применим следующие преобразования: , (табл. 1.14). Вычисляем отношения . Составляем расчетную табл. 2.19.

Рассмотрим теперь зависимость . Пользуясь теоретическим материалом (табл. 1.14), сводим нелинейную зависимость к линейной , где , .Для нахождения отношений составляем расчетную табл. 2.20.

Таблица 2.19

1,5 2,9 3,1 3,2 3,4 3,5 3,6 4,2 4,3 4,8
1792,2 2118,4 2376,6 2509,5 3301,2
922,2 181,8 41,4 258,2 132,9 280,5 511,2 95,8  
1,4 0,1 0,1 0,1 0,2 0,1 0,1 0,6 0,1 0,5  
DY/DX 658,7  

Таблица 2.20

X = x 1,5 2,9 3,1 3,2 3,4 3,5 3,6 4,2 4,3 4,8
y
Y = 1/y 0,0017 0,0016 0,0015 0,0015 0,0015 0,0014 0,0014 0,0013 0,0013 0,0013 0,0013
-0,000106 -0,0001 -0,0001 -0,0001  
1,4 0,1 0,1 0,1 0,2 0,1 0,1 0,6 0,1 0,5  
DY/DX -0,00008 -0,00100 -0,0005 0,00000 -0,00100  

Отношения , полученные для формулы , мало отличаются друг от друга, чем для формулы . Поэтому по методу конечных разностей в качестве лучшей выбираем формулу . К такому же выводу мы пришли, применяя метод необходимых условий. Итак, зависимость между ростом X (тыс. руб.) производительности труда на одного работающего и выпуском Y (тыс. руб.) товарной продукции ремонтного цеха машиностроительного завода выражается формулой . Оценки и неизвестных параметров истинного уравнения регрессии находим, решая систему нормальных уравнений:

Для вычисления сумм, входящих в систему, составляем расчетную табл. 2.21.

Таблица 2.21

х
1,5 0,0017 0,0026 2,25
2,9 0,0016 0,0047 8,41
0,0015 0,0046
3,1 0,0015 0,0046 9,61
3,2 0,0015 0,0048 10,24
3,4 0,0014 0,0049 11,56
3,5 0,0014 0,0049 12,25
3,6 0,0013 0,0046 12,96
4,2 0,0013 0,0053 17,64
4,3 0,0013 0,0054 18,49
4,8 0,0013 0,0060 23,04
37,5   0,0158 0,0525 135,45

Составляем и решаем систему

Решением является точка (а0, а1) = (0,00204; -0,00018). Поэтому уравнение регрессии примет вид:

.

Оценим силу корреляционной связи между ростом X (тыс. руб.) производительности труда на одного работающего и выпуском Y (тыс. руб.) товарной продукции. Вычислим индекс корреляции по формуле (ф.1.77):

,

где

,

(так как n=11>50). Для нахождения и составляем расчетную табл. 2.20.

Тогда . Связь между ростом производительности труда на одного работающего и выпуском товарной продукции сильная.

Таблица 2.20

1,1 91,2025
1,4 22,7 22,09 52,5625
1,7 22,1 17,2 24,01 44,2225
2,1 19,8 16,2 12,96 18,9225
2,6 15,1 3,61 2,4025
4,7 12,3 11,7 0,36 9,9225
6,1 10,7 10,2 0,25 22,5625
7,0 9,4 0,36 29,7025
8,2 7,5 0,49 52,5625
12,8 6,7 6,3 0,16 76,5625
      100,29 400,0625

Проверяем адекватность полученного уравнения регрессии по критерию Фишера — Снедекора (ф.1.78). Находим статистику:

.

При уровне значимости и числах степеней свободы , по таблице критических точек распределения Фишера — Снедекора (приложение 7) находим

.

Так как

,

то модель адекватна. Следовательно, зависимость роста производительности труда на одного работающего и выпуском товарной продукции описывается уравнением .

Построение данной кривой в корреляционном поле предлагается выполнить самостоятельно.

Лабораторная работа № 5.

Наши рекомендации