Уравнение прямолинейной регрессии

Прямолинейная корреляция отличается тем, что при этой форме связи каждому из одинаковых изменений первого признака соответствует вполне определенное и тоже одинаковое в среднем изменение другого признака, связанного с первым или зависящего от первого.

Та величина, на которую в среднем изменяется второй признак, при изменении первого на единицу измерения, называется коэффициентом регрессии. Рассчитывается он по формуле:

Уравнение прямолинейной регрессии - student2.ru , (11.14)

где R2/1 – коэффициент регрессии второго признака по первому;

s2 – стандартное отклонение второго признака, который изменяется в связи с изменением первого;

s1 – стандартное отклонение первого признака, в связи с изменением которого изменяется второй признак;

r12 – коэффициент корреляции между первым и вторым признаками.

Ошибка коэффициента регрессии равна ошибке коэффициента корреляции, умноженной на отношение сигм:

Уравнение прямолинейной регрессии - student2.ru (11.15)

Критерий достоверности коэффициента регрессии равен критерию достоверности коэффициента корреляции:

Уравнение прямолинейной регрессии - student2.ru Уравнение прямолинейной регрессии - student2.ru , (11.16)

Пример

Для разработки способа определения веса лошадей без взвешивания по обхвату груди было взвешено 1618 лошадей и у каждой из них измерен обхват груди. Получены следующие показатели: х – обхват груди:

n= 1618, μх = 174 см, sx= 7,9 см;

n = 1618, μy = 424 кг, sy = 56,8 кг.

Коэффициент корреляции rx/y = +0,89 ± 0,011.

Коэффициент регрессии массы по обхвату равен:

Уравнение прямолинейной регрессии - student2.ru .

Ошибка коэффициента регрессии массы лошадей по обхвату их груди равна:

Уравнение прямолинейной регрессии - student2.ru

Достоверность этого коэффициента регрессии определяется следующим образом:

Уравнение прямолинейной регрессии - student2.ru , n = 1618–2 =1616, tst = {2,0 – 2,6 – 3,3}

Возможная максимальная погрешность при прогнозе генерального параметра:

D = tst × sR = 2,0 × 0,08 = 0,16.

Доверительные границы:

Уравнение прямолинейной регрессии - student2.ru .

Таким образом, можно ожидать, что при увеличении (или уменьшении) обхвата груди на 1 см вес лошадей увеличится (или уменьшится) в среднем на R = 6,4 кг при гарантированном минимуме изменения +6,24 кг и возможном максимуме +6,56 кг, если учитывать изменения признаков в обе стороны от их средней величины.

Коэффициент прямолинейной регрессии показывает, на сколько от своей средней отклоняется второй признак, если первый признак от своей средней отклонился на единицу измерения. Это можно выразить следующей формулой:

(X2 – μ2) = R2/1 (X1 – μ1) (11.17)

Обозначая X1 через х, X2 через у, R1/2 через b и произведя необходимые преобразования этого выражения, можно получить рабочую формулу прямолинейной регрессии:

y=a+bx (11.18)

Уравнение прямолинейной регрессии - student2.ru . (11.19)

По этой формуле, зная значение х (аргумент), можно определить значение у (функция) без непосредственного его измерения: нужно аргумент х помножить на коэффициент регрессии и к полученному произведению прибавить (или отнять) свободный член а.

Для предыдущего примера (определение веса лошадей по обхвату груди) уравнение регрессии может быть выведено следующим образом:

а = μу–Ry/x×μx = 424–(+ 6,4) 174 = – 690,

b = Ry/x = + 6,4,

у = а + bх = –690 + 6,4x.

Следовательно, чтобы определить (без взвешивания живой вес лошади по этому способу, надо обхват груди лошади умножить на постоянный коэффициент 6,4 и из полученного произведения вычесть постоянное число – 690.

На основе уравнения прямолинейной регрессии можно заранее рассчитать значение функции для каждого значения аргумента.

По обхвату груди можно определить живой вес лошадей.

Если эти цифры нанести на график, по оси абсцисс которого отложить через равные интервалы значения аргумента (обхвата), а по оси ординат — значения функции (веса), то получится номограмма для определения веса лошадей без взвешивания и без вычислений.

Наши рекомендации