Парная регрессия на основе метода наименьших квадратов
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитическая связь между ними описывается уравнениями:
_
прямой yx = a0 + a1*x ;
_
параболы yx = a0 + a1*x + a2*x2 ;
гиперболы _ 1
yx = a0 + a1* -- и т.д.
x
Определить тип уравнения можно, исследуя зависимость графически, однако существуют более общие указания, позволяющие выявить уравнение связи, не прибегая к графическому изображению. Если результативный и факторный признаки возрастают одинаково, то это свидетельствует о том, что связь между ними линейная, а при обратной связи - гиперболическая. Если результативный признак увеличивается в арифметической прогрессии, а факторный значительно быстрее, то используется параболлическая или степенная регрессия.
Оценка параметров уравнений регрессии a0 и a1 (и a2 в уравнении параболы второго порядка) осуществляется методом наименьших квадратов, в основе которого лежит прежположение о независимости наблюдений исследуемой совокупности и нахождении параметров модели a0 и a1, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии:
å ( yi - yt ) 2 ® min.
Система нормальных уравнений для нахождения параметров линейной парной регрессии методом наименьших квадратов имеет следующий вид:
ì a0*n + a1*å t = å y
í
î a0*å t + a1*å t2 = å y*t ,
где n - объем исследуемой совокупности (число единиц наблюдения) .
В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных в уравнении факторных признаков, коэффициент регрессии a1 показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.
Множественная регрессия
Изучение связи между тремя и более связанными между собой признаками носит название множественной (многофакторной) регрессии:
_
y1,2,…k = f (x1, x2, …, xk). (11.3.1)
Построение моделей множественной регрессии включает несколько этапов:
v выбор формы связи (уравнение регрессии);
v отбор факторных признаков;
v обеспечение достаточного объема совокупности.
Выбор типа уравнения затрудняется тем, что для любой формы зависимости можно выбрать целый ряд уравнений, которые в определенной степени будут описывать эти связи. Основное значение имеют линейные модели в силу простоты и логичности их экономической интерпретации.
Линейное уравнение множественной регрессии имеет вид:
_
y1,2,…k = a0 + a1*x1 + a2*x2 + … + ak*xk , (11.3.2)
_
где y1,2,…k - теоретические значения результативного признака, полученные в результате подстановки соответствующих значений факторных признаков в уравнение регрессии;
x1 x2 … xk - факторные признаки;
a0 a1 a2 …ak - параметры модели (коэффициенты регрессии).
Параметры уравнения могут быть определены графическим методом, методом наименьших квадратов и т.д.
Важным этапом построения уже выбранного уравнения множественной регрессии является отбор и последующее включение факторных признаков. С одной стороны, чем больше факторных признаков включено в уравнение, тем оно лучше описывает явление. С другой стороны, сокращение размерности модели за счет исключения второстепенных факторов способствует простоте и качеству ее реализации.
При построении модели регрессии возможна проблема мультиколлинеарности, под которой понимается тесная зависимость между факторными признаками, включенными в модель (rxy > 0,8).
Наличие мультиколлинеарности между признаками приводит к искажению величины параметров модели, которые имеют тенденцию к завышению, чем осложняется процесс определения наиболее существенных факторных признаков.
В качестве причин возникновения мультиколлинеарности между признаками можно выделить следующие:
Ø изучаемые факторные признаки являются характеристикой одной и той же стороны явления или процесса. Например, показатели объема производимой продукции и среднегодовой стоимости основных фондов одновременно включать в модель не рекомендуется, так как они оба характеризуют размер предприятия;
Ø факторные признаки являются составляющими элементами друг друга;
Ø факторные признаки по экономическому смыслу дублируют друг друга.