Определениеуравненийрегрессии

Корреляционную зависимость между переменными X и Y можно выра- зить с помощью уравнений типа

Y = F(x)

или

Xy =F(Y) ,(1)



которые называются уравнениями регрессии. В этих уравнениях

ляются средними арифметическими переменных X и Y.

Yxи Xyяв-

Графическое выражение регрессионного уравнения называют линией регрессии. Линия регрессии выражает наилучшее предсказание зависимой переменной Y по независимым переменным X (рис. 2.17). Эти независимые переменные в математике называются предикатами.

Определениеуравненийрегрессии - student2.ru Определениеуравненийрегрессии - student2.ru

xy= в0 + в1y
O
B yx= ao + a1x
у

y

A

x X

Рис. 2. 17. Линия регрессии У = F(x) и X = F(у)

в системе прямоугольных координат

В соответствии с уравнениями (1) корреляционную зависимость можно выразить с помощью двух уравнений регрессии, которые в самом простом случае выглядят как уравнения прямой:

Y = a0 +a1X, (2.10)

X = b1 +b1Y. (2.11)

В уравнении (2.10) Y – зависимая переменная, а X – независимая пере- менная, a0 – свободный член, a1 – коэффициент регрессии, или угловой коэф- фициент, определяющий наклон линии регрессии по отношению к осям ко- ординат.

В уравнении (2.11) наоборот X – зависимая переменная, а Y – независи- мая, b0 – свободный член, b1 – коэффициент регрессии, или угловой коэффи- циент, определяющий наклон линии регрессии по отношению к осям коор- динат.

Если произвольно на рис. 2.17 изобразить линии регрессии по уравнени- ям (2.10) и (2.11), то они пересекаются в точке O(x,y) с координатами, соот- ветствующими средним арифметическим значений переменных X и Y. Линия AB, проходящая через точку O, соответствует линейной функциональной за- висимости между переменными Y и X, когда коэффициент корреляции меж- ду ними rxy равен единице. При этом наблюдается следующая закономер- ность: чем сильнее связь между X и Y, тем ближе обе линии регрессии к прямой АВ, и наоборот, чем слабее корреляция, тем больше линии регрессии отклоняются от прямой АВ. При отсутствии связи (rxy =0) между X и Yли- нии регрессии оказываются под прямым углом по отношению друг к другу.

Количественное установление связи (зависимости) между X и Y (или между Y и X) называется регрессионным анализом.Главнаязадачарегрес- сионногоанализасостоит:

- в определение коэффициентов a0, b0, a1,b1,

- вопределениеуровнязначимостиполученныхуравненийрегрессии

(2.10) и (2.11), связывающих между собой переменные X и Y.

Если до проведения регрессионного анализа выполнен корреляционный анализ переменных и определены коэффициенты корреляции между ними, то легко определить коэффициенты регрессии a1 и b1 по формулам:




a1 = rxy

×Sy ,

S

b1 = ryx

x

× Sx,

S

y

где Sx, Sy – среднеквадратические отклонения, подсчитанные для пере- менныхX и Y соответственно.

å å
(y- y)
i
(x- x)
i
Можно рассчитать коэффициенты регрессии и без подсчета среднеквад- ратических отклонений по формулам:

a1 =rxy×

, (2.12)



å å
(x- x)
i
(y- y)
i
b1 =ryx

. (2.13)


В том случае, если коэффициент корреляции неизвестен, коэффициенты регрессии можно вычислить по следующим формулам:

a=å(xi-x)×(yi-y). (2.14)


i
1 å(x -x)

b=å(xi-x)×(yi-y). (2.15)

1 å(y-y)

Зная коэффициенты регрессии, можно легко получить коэффициент кор- реляции:

rxy=

a1 ×b1 .

(2.16)

i
i
Свободные члены уравнений регрессии a0 и b0 вычисляются по следую- щим формулам:

a

i
i
=åyi

×åx2 -åx

× åxi

×yi. (2.17)

i
i
0 åx 2 -å(x)2

i
i
b=åxi

×åy2-åy

× åxi

× yi.

0 åy2-å(y)2

Трудоемкость вычислений по формулам (2.14),(2.15),(2.16),(2.17) сво- бодных членов и коэффициентов регрессии достаточно велика, поэтому в регрессионном анализе используются более простые методы их определения, базирующиеся на методе наименьших квадратов [3].

Применяя этот метод для линейной функции зависимости переменных, получим две системы уравнений, позволяющие определить из одной систе- мы величины a0 и a1:

aN+a1Σxi=Σyi, (2.18)

a0 ·Σxi + a1Σ(xi·xi) = Σyxi ,

а из другой системы величины b0 и b1:

b0·N + bΣyi = Σxi, bΣyi+b1·Σ(yi·yi)=Σyi·xi,

где N – число переменных x или y.

Приведем примервычисления коэффициентов линейной регрессии.

Допустим, что при исследовании статистической зависимости между объемом снятого в процессе токарной обработки материала заготовки Q и глубиной резания s получены следующие результаты эксперимента (табл.2.11):

Таблица 2.11

Номерэксперимента Глубинарезания s, мм Объем материала Q, куб. см
2,2 2,70
2,4 3,15
2,6 3,44
2,8 3,52
3,0 4,05
3,2 4,12
3,4 4,54
3,6 4,61
3,8 4,80
4,0 5,31
4,2 5,53
4,4 5,66

Графическое отражение экспериментальных данных приведено на рис.2.18.

Уравнение регрессии при этом имеет вид

Y = a0+aX,

где в качестве независимой переменной X выступает глубина резания s, а в качестве зависимой переменной Y выступает объем снятого материала Q.

Q, см3

Определениеуравненийрегрессии - student2.ru

a
0

2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,63,8 4 4,2

s, мм

Рис. 2.18. Экспериментальная зависимость сошлифованного материала Q

от глубины резания s; а – линия регрессии Q = f (s)

Для решения уравнений (2.18) заполним вспомогательную таблицу 2.12:

Таблица 2.12

Номерэкс- перимента X X·X Y Y·Y X·Y
2,2 4,84 2,70 7,29 5,94
2,4 5,76 3,15 9,92 7,56
2,6 6,76 3,44 11,83 8,94
2,8 7,84 3,52 12,39 9,86
3,0 9,00 4,05 16,40 12,15
3,2 10,24 4,12 16,97 13,18
3,4 11,56 4,54 20,61 15,44
3,6 12,96 4,61 21,25 16,60
3,8 14,44 4,80 23,04 18,24
4,0 16,00 5,31 28,20 21,24
4,2 17,64 5,53 30,58 23,23
4,4 19,36 5,66 32,04 24,90
Σ 39,60 136,40 51,43 230,52 177,28

Подставляя значения данных табл.2.12 в уравнение (2.18), получим сле- дующую систему линейных уравнений:

a0 ·12 + a1·39,60 = 51,43, a0×39,60 + a1·136,40 =177,28.

Решая эту систему уравнений, получим a0= -0,44 ;a1= 1,40.Тогда

Y = -0,44+ 1,40·X..

Для решения уравнения регрессии

X = b0 + bY

получим следующую систему уравнений:

b0 12 + b1·51,43 = 39,60,

b0 ·51,43 + b1·230,52 = 177,28.

Решая эту систему уравнений, получим b0 = 0,30; b1 = 0,70. Тогда

X = 0,30 + 0,70·Y.

Наши рекомендации