Парная регрессия на основе метода наименьших
Квадратов и метода группировок
Парная регрессияхарактеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями:
прямой
гиперболы
параболы (3)
показательной функции
полулогарифметической функции и так далее.
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболическая или степенная регрессия.
Оценка параметров уравнений регрессии ( и - в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит предположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели ( ), при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
(4)
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
(5)
где n - объем исследуемой совокупности (число единиц наблюдения).
В уравнениях регрессии параметр a показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков; коэффициент регрессии a показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Пример. По данным наблюдения окупаемость затрат на радиоприборы зависит от срока освоения их производства (см. табл. 2).
Таблица 2
Зависимость между окупаемостью затрат и сроком освоения
Производства приборов
№ продук- ции | Срок освоения, лет (x) | Окупаемость затрат, тыс. ден. ед. (y) | |||
10,2 7,5 13,9 12,8 0,6 2,8 13,2 10,1 5,4 12,7 | 97,3 0,6 5,6 105,6 121,2 16,2 76,2 | 8,104 7,084 10,144 13,204 4,024 5,044 11,164 15,244 6,064 9,124 | |||
Итого | 89,2 | 631,7 | 89,2 |
Предположим наличие линейной зависимости между рассматриваемыми признаками. Тогда, система нормальных уравнений для данного примера будет иметь следующий вид:
Отсюда: a = 3,004; a = 1,02. Следовательно, =3,004 + 1,02x.
На практике исследования часто проводятся по большому числу наблюдений. В этом случае исходные данные удобнее представлять в сводной групповой таблице. При этом анализу подвергаются сгруппированные данные и по факторному (x) и по результативному (y) признакам, то есть уравнения парной регрессии целесообразно строить на основе сгруппированных данных.