Выбор формы уравнения регрессии

Различают следующие виды уравнений множественной регрессии: линей-ные, нелинейные, сводящиеся к линейным, и нелинейные, не сводящиеся к ли-нейным (внутренне нелинейные). В первых двух случаях для оценки парамет-ров модели применяются классического линейного регрессионного анализа. В случае внутренне нелинейных уравнений для оценки параметров приходится применять методы нелинейной оптимизации.

Основное требование, предъявляемое к уравнениям регрессии, заключает-ся в наличии наглядной экономической интерпретации модели и ее параметров.

Исходя из этих соображений, наиболее часто используются линейная и

степенная зависимости.  
Линейная множественная регрессия имеет вид  
yˆ a b1 x1 b2 x2... b p x p. (3.4)

Параметры bi при факторах хi называются коэффициентами «чистой» регрессии. Они показывают, на сколько единиц в среднем изменится результативный при-знак y за счет изменения соответствующего фактора на единицу при неизме-ненном значении других факторов, закрепленных на среднем уровне.

Предположим, например, что зависимость спроса на товар (Qd) от цены (P) и дохода (I) характеризуется следующим уравнением:

Qd= 2,5 0,12P + 0,23 I.

Коэффициенты данного уравнения говорят о том, что при увеличении цены на единицу, спрос уменьшится в среднем на 0,12 единиц измерения спроса, а при увеличении дохода на единицу, спрос возрастет в среднем 0,23 единицы.

Параметр а в (3.14) не всегда может быть содержательно проинтерпретирован. Степенная множественная регрессия имеет вид

a x b x b ... x bp (3.5)  
  p  
             

Параметры bj(степени факторов хi) являются коэффициентами эластично-сти. Они показывают, на сколько процентов в среднем изменится результатив-ный признак y за счет изменения соответствующего фактора хi на 1 % при не-измененном значении остальных факторов.

Наиболее широкое применение этот вид уравнения регрессии получил в производственных функциях, а также при исследовании спроса и потребления.

Например, зависимость выпуска продукции Y от затрат капитала K и труда L

Y 0,89 K 0.23 L0.81

говорит о том, что увеличение затрат капитала K на 1 % при неизменных затра-тах труда вызывает увеличение выпуска продукции Y на 0,23 %. Увеличение за-трат труда L на 1 % при неизменных затратах капитала K вызывает увеличение выпуска продукции Y на 0,81 %.

Экономический смысл имеет также сумма коэффициентов bi каждого фак-тора (сумма эластичностей)b = bi. Эта величина дает обобщенную харак-теристику эластичности производства.

Если значение b> 1, то говорят, что функция имеет возрастающий эффект от масштаба производства. Значение b= 1 говорит о постоянном масштабе производства. Если значение b< 1, то имеет место убывающий эффект от мас-штаба производства.

Примеры других зависимостей, используемых при построении регрессии, приведены в п. 1.4.

Если один и тот же фактор вводится в регрессию в разных степенях , то ка-ждая степень рассматривается как самостоятельный фактор. Например, если в нелинейной модели с двумя факторами x1,x2

y a b1 x1 b2 x2 b3 x12 b4 x1 x22,

величины x12,x1x22 рассматривать как новые дополнительные факторы, то,

используя замену переменных z x , z x , z x2 , z x x2 , ее можно  
             
привести к линейному уравнению регрессии с четырьмя факторами:  
y a b1 z1 b2 z2 b3 z3 b4 z4 .            
3.4. Оценка параметров уравнения линейной        
множественной регрессии              
Рассмотрим уравнение линейной множественной регрессии      
y a b1 x1 b2 x2 ... bpxp .       (3.6)  
                               

Для оценки параметров уравнения множественной регрессии обычно при-меняется метод наименьших квадратов (МНК), согласно которому следует вы-бирать такие значения параметров а и bi, при которых сумма квадратов откло-нений фактических значений результативного признака yi от теоретических значений ŷ= f (x1i,x2i,...,xpi)(при тех же значениях фактора xij) минимальна, т. е.

S yˆi yi2min .

С учетом (3.6) величина S является функцией неизвестных параметров а и bi

n

S ( yia b1x1b2x2 ... bpxp )2S(a,b1,...,bp ) . (3.7)

i 1

Оптимальные значения параметров а и bi удовлетворяют условиям

S 0, S 0, S 0, ... S 0. (3.8)  
a b1 b2 bp  
           

Выполняя соответствующие вычисления, получим для определения пара-метров а и bi следующую систему уравнений


  S   n        
  2 ( yia b1x1 b2 x2 ... bpxp ),    
  a    
    i 1        
  S     n        
    2b1 ( yia b1x1b2x2 ... bpxp ),    
  b1   (3.9)  
    i 1      
...              
  S   n        
    2bp ( yia b1 x1 b2 x2... bp x p),    
  bp      
    i 1        

откуда после некоторых преобразований получается система нормальных урав-нений метода наименьших квадратов

y n a b1 x1 b2x2 ... bpxp ;          
yx1 a x1 b1 x12 b2 x2 x1 ... bpxpx1 ; (3.10)  
.....................................................................................    
     
yx p a x p b1x1xp b2 x2 x p... bp x22.    
Решение системы (3.10) удобно записать с помощью матричных обозначе-  
ний. Обозначим             1x11...xp1        
a   y              
              ...x          
y              
b , Y   , X 1x   ,   (3.11)  
B1       p2    
                             
...         ...            
    ...                
  y       1x ...x        
bp     n                
        1n   pn      

где B матрица-столбец (p+1×1) из коэффициентов а и bi;

Y матриц-столбец (n×1) исходных значений зависимой переменнойy;

X матрица(p+1×n)исходных значений независимых переменных xi,в ко-торой первый столбец из единиц можно рассматривать как значения «фиктив-

ной» переменной, соответствующей коэффициенту а.    
В этих обозначениях система (3.10) примет вид    
    (3.12)  
(X X )B X Y ,  
где X' транспонированная матрица X.   является неособенной  
Матрица X X  

квадратной размерности (p+1×p+1) при условии, что столбцы матрицы X ли-нейно независимы.

Решение системы (3.12) определяется соотношением    
    (3.13)  
B (X X )   X Y .  

Независимые переменные xi имеют различный экономический смысл, раз-ные единицы измерения и масштаб. Если нужно определить степень относи-тельного влияния отдельных факторов xi на изменение результативной пере-менной y, то переменные xi следует привести к сопоставимому виду. Это мож-но осуществить, вводя, так называемые, «стандартизованные» переменные t y,tx1,...,txpс помощью соотношений


               
t y y y , t xi xixi , (i = 1, 2, …, p) (3.14)  
       
  y       xi    
             
                   

где y,xi средние значения,y,xi средние квадратические отклонения пе-

ременных y и xi.

Стандартизованные переменные обладают следующими свойствами: 1) средние значения равны нулю tytxi0; 2) средние квадратические отклоне-

Выбор формы уравнения регрессии - student2.ru

ния равны единице tytxi1.

Уравнения множественной регрессии в стандартизованных переменных принимает вид

t y 1 t x 2 tx ... p t x . (3.15)
        p  

Величины βi называются стандартизованными коэффициентами. Их связь коэффициентами множественной регрессии bi задается соотношениями

b       y или     b   xi (i = 1, 2, …, p). (3.16)  
i     i      
             
i   xi     i     y      
                   
Параметр а уравнения (3.6) можно определить из соотношения    
  a y b1x1 b2x2 ... bpxp . (3.17)  

Стандартизованные коэффициенты регрессии βi показывают, на сколько сигм (средних квадратических отклонений) изменится в среднем результатив-ный признак y за счет изменения соответствующего фактора на одну сигму при неизмененном значении других факторов, закрепленных на среднем уровне.

Система нормальных уравнений МНК (3.10) в стандартизованных пере-менных принимает вид:

ryx   1   2 rx x 3rx x   ... prx x ;    
          3 1     p 1      
ryx   1rx x 2   3rx x ... prx x ; (3.18)  
            p 2  
............................................................    
     
ryx p 1rx x p 2 rx x p 3rx x p ... p .      
                   

Стандартизованные коэффициенты регрессии βi сравнимы между собой, что позволяет ранжировать факторы по силе их воздействия на результат. Большее относительное влияние на изменение результативной переменной y оказывает тот фактор, которому соответствует большее по модулю значение коэффициента βi.

Отметим, что в случае парной линейной регрессии стандартизованный ко-эффициент регрессии β совпадает с линейным коэффициентом корреляции ryx.

Для оценки параметров нелинейных уравнений множественной регрессии предварительно осуществляется преобразование последних в линейную форму (с помощью замены переменных) и МНК применяется для нахождения пара-метров линейного уравнения множественной регрессии в преобразованных пе-ременных.

В случае внутренне нелинейных зависимостей (которые невозможно при-вести к линейному виду) для оценки параметров по методу наименьших квад-ратов приходится применять методы нелинейной оптимизации (п. 2.4).

Наши рекомендации