Определениеуравненийрегрессии
Корреляционную зависимость между переменными X и Y можно выра- зить с помощью уравнений типа
Y = F(x)
или
Xy =F(Y) ,(1)
которые называются уравнениями регрессии. В этих уравнениях
ляются средними арифметическими переменных X и Y.
Yxи Xyяв-
Графическое выражение регрессионного уравнения называют линией регрессии. Линия регрессии выражает наилучшее предсказание зависимой переменной Y по независимым переменным X (рис. 2.17). Эти независимые переменные в математике называются предикатами.
xy= в0 + в1y |
O |
B yx= ao + a1x |
y
A
x X
Рис. 2. 17. Линия регрессии У = F(x) и X = F(у)
в системе прямоугольных координат
В соответствии с уравнениями (1) корреляционную зависимость можно выразить с помощью двух уравнений регрессии, которые в самом простом случае выглядят как уравнения прямой:
Y = a0 +a1X, (2.10)
X = b1 +b1Y. (2.11)
В уравнении (2.10) Y – зависимая переменная, а X – независимая пере- менная, a0 – свободный член, a1 – коэффициент регрессии, или угловой коэф- фициент, определяющий наклон линии регрессии по отношению к осям ко- ординат.
В уравнении (2.11) наоборот X – зависимая переменная, а Y – независи- мая, b0 – свободный член, b1 – коэффициент регрессии, или угловой коэффи- циент, определяющий наклон линии регрессии по отношению к осям коор- динат.
Если произвольно на рис. 2.17 изобразить линии регрессии по уравнени- ям (2.10) и (2.11), то они пересекаются в точке O(x,y) с координатами, соот- ветствующими средним арифметическим значений переменных X и Y. Линия AB, проходящая через точку O, соответствует линейной функциональной за- висимости между переменными Y и X, когда коэффициент корреляции меж- ду ними rxy равен единице. При этом наблюдается следующая закономер- ность: чем сильнее связь между X и Y, тем ближе обе линии регрессии к прямой АВ, и наоборот, чем слабее корреляция, тем больше линии регрессии отклоняются от прямой АВ. При отсутствии связи (rxy =0) между X и Yли- нии регрессии оказываются под прямым углом по отношению друг к другу.
Количественное установление связи (зависимости) между X и Y (или между Y и X) называется регрессионным анализом.Главнаязадачарегрес- сионногоанализасостоит:
- в определение коэффициентов a0, b0, a1,b1,
- вопределениеуровнязначимостиполученныхуравненийрегрессии
(2.10) и (2.11), связывающих между собой переменные X и Y.
Если до проведения регрессионного анализа выполнен корреляционный анализ переменных и определены коэффициенты корреляции между ними, то легко определить коэффициенты регрессии a1 и b1 по формулам:
a1 = rxy
×Sy ,
S
b1 = ryx
x
× Sx,
S
y
где Sx, Sy – среднеквадратические отклонения, подсчитанные для пере- менныхX и Y соответственно.
å å |
(y- y) |
i |
(x- x) |
i |
a1 =rxy×
, (2.12)
å å |
(x- x) |
i |
(y- y) |
i |
. (2.13)
В том случае, если коэффициент корреляции неизвестен, коэффициенты регрессии можно вычислить по следующим формулам:
a=å(xi-x)×(yi-y). (2.14)
i |
b=å(xi-x)×(yi-y). (2.15)
Зная коэффициенты регрессии, можно легко получить коэффициент кор- реляции:
rxy=
a1 ×b1 .
(2.16)
i |
i |
a
i |
i |
×åx2 -åx
× åxi
×yi. (2.17)
i |
i |
i |
i |
×åy2-åy
× åxi
× yi.
0 åy2-å(y)2
Трудоемкость вычислений по формулам (2.14),(2.15),(2.16),(2.17) сво- бодных членов и коэффициентов регрессии достаточно велика, поэтому в регрессионном анализе используются более простые методы их определения, базирующиеся на методе наименьших квадратов [3].
Применяя этот метод для линейной функции зависимости переменных, получим две системы уравнений, позволяющие определить из одной систе- мы величины a0 и a1:
a0·N+a1Σxi=Σyi, (2.18)
a0 ·Σxi + a1Σ(xi·xi) = Σyi·xi ,
а из другой системы величины b0 и b1:
b0·N + b1·Σyi = Σxi, b0·Σyi+b1·Σ(yi·yi)=Σyi·xi,
где N – число переменных x или y.
Приведем примервычисления коэффициентов линейной регрессии.
Допустим, что при исследовании статистической зависимости между объемом снятого в процессе токарной обработки материала заготовки Q и глубиной резания s получены следующие результаты эксперимента (табл.2.11):
Таблица 2.11
Номерэксперимента | Глубинарезания s, мм | Объем материала Q, куб. см |
2,2 | 2,70 | |
2,4 | 3,15 | |
2,6 | 3,44 | |
2,8 | 3,52 | |
3,0 | 4,05 | |
3,2 | 4,12 | |
3,4 | 4,54 | |
3,6 | 4,61 | |
3,8 | 4,80 | |
4,0 | 5,31 | |
4,2 | 5,53 | |
4,4 | 5,66 |
Графическое отражение экспериментальных данных приведено на рис.2.18.
Уравнение регрессии при этом имеет вид
Y = a0+a1·X,
где в качестве независимой переменной X выступает глубина резания s, а в качестве зависимой переменной Y выступает объем снятого материала Q.
Q, см3
a |
2 2,2 2,4 2,6 2,8 3 3,2 3,4 3,63,8 4 4,2
s, мм
Рис. 2.18. Экспериментальная зависимость сошлифованного материала Q
от глубины резания s; а – линия регрессии Q = f (s)
Для решения уравнений (2.18) заполним вспомогательную таблицу 2.12:
Таблица 2.12
Номерэкс- перимента | X | X·X | Y | Y·Y | X·Y |
2,2 | 4,84 | 2,70 | 7,29 | 5,94 | |
2,4 | 5,76 | 3,15 | 9,92 | 7,56 | |
2,6 | 6,76 | 3,44 | 11,83 | 8,94 | |
2,8 | 7,84 | 3,52 | 12,39 | 9,86 | |
3,0 | 9,00 | 4,05 | 16,40 | 12,15 | |
3,2 | 10,24 | 4,12 | 16,97 | 13,18 | |
3,4 | 11,56 | 4,54 | 20,61 | 15,44 | |
3,6 | 12,96 | 4,61 | 21,25 | 16,60 | |
3,8 | 14,44 | 4,80 | 23,04 | 18,24 | |
4,0 | 16,00 | 5,31 | 28,20 | 21,24 | |
4,2 | 17,64 | 5,53 | 30,58 | 23,23 | |
4,4 | 19,36 | 5,66 | 32,04 | 24,90 | |
Σ | 39,60 | 136,40 | 51,43 | 230,52 | 177,28 |
Подставляя значения данных табл.2.12 в уравнение (2.18), получим сле- дующую систему линейных уравнений:
a0 ·12 + a1·39,60 = 51,43, a0×39,60 + a1·136,40 =177,28.
Решая эту систему уравнений, получим a0= -0,44 ;a1= 1,40.Тогда
Y = -0,44+ 1,40·X..
Для решения уравнения регрессии
X = b0 + b1·Y
получим следующую систему уравнений:
b0 12 + b1·51,43 = 39,60,
b0 ·51,43 + b1·230,52 = 177,28.
Решая эту систему уравнений, получим b0 = 0,30; b1 = 0,70. Тогда
X = 0,30 + 0,70·Y.