Выбор формы уравнения регрессии
Различают следующие виды уравнений множественной регрессии: линей-ные, нелинейные, сводящиеся к линейным, и нелинейные, не сводящиеся к ли-нейным (внутренне нелинейные). В первых двух случаях для оценки парамет-ров модели применяются классического линейного регрессионного анализа. В случае внутренне нелинейных уравнений для оценки параметров приходится применять методы нелинейной оптимизации.
Основное требование, предъявляемое к уравнениям регрессии, заключает-ся в наличии наглядной экономической интерпретации модели и ее параметров.
Исходя из этих соображений, наиболее часто используются линейная и
степенная зависимости. | |
Линейная множественная регрессия имеет вид | |
yˆ a b1 x1 b2 x2... b p x p. | (3.4) |
Параметры bi при факторах хi называются коэффициентами «чистой» регрессии. Они показывают, на сколько единиц в среднем изменится результативный при-знак y за счет изменения соответствующего фактора на единицу при неизме-ненном значении других факторов, закрепленных на среднем уровне.
Предположим, например, что зависимость спроса на товар (Qd) от цены (P) и дохода (I) характеризуется следующим уравнением:
Qd= 2,5 0,12P + 0,23 I.
Коэффициенты данного уравнения говорят о том, что при увеличении цены на единицу, спрос уменьшится в среднем на 0,12 единиц измерения спроса, а при увеличении дохода на единицу, спрос возрастет в среднем 0,23 единицы.
Параметр а в (3.14) не всегда может быть содержательно проинтерпретирован. Степенная множественная регрессия имеет вид
yˆ | a x | b | x | b | ... x | bp | (3.5) | |
p | ||||||||
Параметры bj(степени факторов хi) являются коэффициентами эластично-сти. Они показывают, на сколько процентов в среднем изменится результатив-ный признак y за счет изменения соответствующего фактора хi на 1 % при не-измененном значении остальных факторов.
Наиболее широкое применение этот вид уравнения регрессии получил в производственных функциях, а также при исследовании спроса и потребления.
Например, зависимость выпуска продукции Y от затрат капитала K и труда L
Y 0,89 K 0.23 L0.81
говорит о том, что увеличение затрат капитала K на 1 % при неизменных затра-тах труда вызывает увеличение выпуска продукции Y на 0,23 %. Увеличение за-трат труда L на 1 % при неизменных затратах капитала K вызывает увеличение выпуска продукции Y на 0,81 %.
Экономический смысл имеет также сумма коэффициентов bi каждого фак-тора (сумма эластичностей)b = bi. Эта величина дает обобщенную харак-теристику эластичности производства.
Если значение b> 1, то говорят, что функция имеет возрастающий эффект от масштаба производства. Значение b= 1 говорит о постоянном масштабе производства. Если значение b< 1, то имеет место убывающий эффект от мас-штаба производства.
Примеры других зависимостей, используемых при построении регрессии, приведены в п. 1.4.
Если один и тот же фактор вводится в регрессию в разных степенях , то ка-ждая степень рассматривается как самостоятельный фактор. Например, если в нелинейной модели с двумя факторами x1,x2
y a b1 x1 b2 x2 b3 x12 b4 x1 x22,
величины x12,x1x22 рассматривать как новые дополнительные факторы, то,
используя замену переменных z | x , z | x | , z | x2 | , z | x x2 | , ее можно | ||||||||
привести к линейному уравнению регрессии с четырьмя факторами: | |||||||||||||||
y a b1 z1 b2 z2 b3 z3 b4 z4 | . | ||||||||||||||
3.4. Оценка параметров уравнения линейной | |||||||||||||||
множественной регрессии | |||||||||||||||
Рассмотрим уравнение линейной множественной регрессии | |||||||||||||||
y a b1 x1 b2 x2 | ... bpxp . | (3.6) | |||||||||||||
Для оценки параметров уравнения множественной регрессии обычно при-меняется метод наименьших квадратов (МНК), согласно которому следует вы-бирать такие значения параметров а и bi, при которых сумма квадратов откло-нений фактических значений результативного признака yi от теоретических значений ŷ= f (x1i,x2i,...,xpi)(при тех же значениях фактора xij) минимальна, т. е.
S yˆi yi2min .
С учетом (3.6) величина S является функцией неизвестных параметров а и bi
n
S ( yia b1x1b2x2 ... bpxp )2S(a,b1,...,bp ) . (3.7)
i 1
Оптимальные значения параметров а и bi удовлетворяют условиям
S | 0, | S | 0, | S | 0, ... | S | 0. | (3.8) | |
a | b1 | b2 | bp | ||||||
Выполняя соответствующие вычисления, получим для определения пара-метров а и bi следующую систему уравнений
S | n | |||||||
2 ( yia b1x1 | b2 x2 | ... bpxp ), | ||||||
a | ||||||||
i 1 | ||||||||
S | n | |||||||
2b1 ( yia b1x1b2x2 ... bpxp ), | ||||||||
b1 | (3.9) | |||||||
i 1 | ||||||||
... | ||||||||
S | n | |||||||
2bp ( yia b1 | x1 b2 | x2... bp x p), | ||||||
bp | ||||||||
i 1 |
откуда после некоторых преобразований получается система нормальных урав-нений метода наименьших квадратов
y n a b1 x1 | b2x2 | ... bpxp ; | ||||||||||||
yx1 a x1 b1 x12 b2 x2 x1 | ... bpxpx1 | ; | (3.10) | |||||||||||
..................................................................................... | ||||||||||||||
yx p a x p | b1x1xp | b2 x2 x p... bp x22. | ||||||||||||
Решение системы (3.10) удобно записать с помощью матричных обозначе- | ||||||||||||||
ний. Обозначим | 1x11...xp1 | |||||||||||||
a | y | |||||||||||||
...x | ||||||||||||||
y | ||||||||||||||
b | , | Y | , | X | 1x | , | (3.11) | |||||||
B1 | p2 | |||||||||||||
... | ... | |||||||||||||
... | ||||||||||||||
y | 1x | ...x | ||||||||||||
bp | n | |||||||||||||
1n | pn |
где B матрица-столбец (p+1×1) из коэффициентов а и bi;
Y матриц-столбец (n×1) исходных значений зависимой переменнойy;
X матрица(p+1×n)исходных значений независимых переменных xi,в ко-торой первый столбец из единиц можно рассматривать как значения «фиктив-
ной» переменной, соответствующей коэффициенту а. | |||
В этих обозначениях система (3.10) примет вид | |||
(3.12) | |||
(X X )B | X Y , | ||
где X' транспонированная матрица X. | является неособенной | ||
Матрица X X |
квадратной размерности (p+1×p+1) при условии, что столбцы матрицы X ли-нейно независимы.
Решение системы (3.12) определяется соотношением | ||||
(3.13) | ||||
B (X X ) | X Y . |
Независимые переменные xi имеют различный экономический смысл, раз-ные единицы измерения и масштаб. Если нужно определить степень относи-тельного влияния отдельных факторов xi на изменение результативной пере-менной y, то переменные xi следует привести к сопоставимому виду. Это мож-но осуществить, вводя, так называемые, «стандартизованные» переменные t y,tx1,...,txpс помощью соотношений
t y | y | , | t xi | xi | , (i = 1, 2, …, p) | (3.14) | |||
y | xi | ||||||||
где y,xi средние значения,y,xi средние квадратические отклонения пе-
ременных y и xi.
Стандартизованные переменные обладают следующими свойствами: 1) средние значения равны нулю tytxi0; 2) средние квадратические отклоне-
ния равны единице tytxi1.
Уравнения множественной регрессии в стандартизованных переменных принимает вид
t y | 1 | t x | 2 tx | ... | p t x | . | (3.15) |
p |
Величины βi называются стандартизованными коэффициентами. Их связь коэффициентами множественной регрессии bi задается соотношениями
b | y | или | b | xi | (i = 1, 2, …, p). | (3.16) | |||||||
i | i | ||||||||||||
i | xi | i | y | ||||||||||
Параметр а уравнения (3.6) можно определить из соотношения | |||||||||||||
a | b2 | ... bp | (3.17) |
Стандартизованные коэффициенты регрессии βi показывают, на сколько сигм (средних квадратических отклонений) изменится в среднем результатив-ный признак y за счет изменения соответствующего фактора на одну сигму при неизмененном значении других факторов, закрепленных на среднем уровне.
Система нормальных уравнений МНК (3.10) в стандартизованных пере-менных принимает вид:
ryx | 1 | 2 rx x | 3rx x | ... prx x ; | ||||||||||
3 1 | p 1 | |||||||||||||
ryx | 1rx x | 2 | 3rx x | ... prx x | ; | (3.18) | ||||||||
p 2 | ||||||||||||||
............................................................ | ||||||||||||||
ryx | p | 1rx x | p | 2 rx | x | p | 3rx x | p | ... p . | |||||
Стандартизованные коэффициенты регрессии βi сравнимы между собой, что позволяет ранжировать факторы по силе их воздействия на результат. Большее относительное влияние на изменение результативной переменной y оказывает тот фактор, которому соответствует большее по модулю значение коэффициента βi.
Отметим, что в случае парной линейной регрессии стандартизованный ко-эффициент регрессии β совпадает с линейным коэффициентом корреляции ryx.
Для оценки параметров нелинейных уравнений множественной регрессии предварительно осуществляется преобразование последних в линейную форму (с помощью замены переменных) и МНК применяется для нахождения пара-метров линейного уравнения множественной регрессии в преобразованных пе-ременных.
В случае внутренне нелинейных зависимостей (которые невозможно при-вести к линейному виду) для оценки параметров по методу наименьших квад-ратов приходится применять методы нелинейной оптимизации (п. 2.4).