Построение регрессионных моделей при наличииавтокорреляции остатков

Предположим, что нарушается только предпосылка 3 о независимости зна-чений случайного члена εi и εj в различных наблюдениях Cov(εij) = 0 (i≠j). В этом случае говорят об автокорреляции остатков. Оценки параметров, полу-ченные методом наименьших квадратов, остаются несмещенными, но теряют свою эффективность.

Автокорреляция обычно встречается в регрессионном анализе только при использовании исходных данных в виде временных рядов. Более подробно по-нятие автокорреляции изложено в 5 разделе, где также приведены методы, по-зволяющие определить наличие и характер авторреляции во временном ряде. Здесь же мы рассмотрим случай, когда имеет место зависимость только между

соседними остатками.

Предположим, что остатки в уравнении линейной регрессии


 
yt a b xt t (3.62)

образуют авторегрессионный процесс первого порядка

tt 1ut. (3.63)

Для оценки величины ρ может использоваться статистика Дарбина-Уотсона d(см. п. 5.3.5)

ρ = 1 –d/2. (3.64)

Преобразуем уравнение (3.62), чтобы исключить автокорреляцию в остат-ках. Для этого уравнение (3.62), записанное для момента времени t–1,

yt1 a b xt1t1

умножим на ρ и вычтем из исходного уравнения (3.62)    
ytyt1 a ab (xtxt1)tt 1.    
       
Вводя новые переменные yt и xt    
    (3.65)  
yt ytyt1; xt xtxt1  
и используя обозначение a a(1 ) , (3.66)  
   

приведем исходную модель регрессии (3.62) к линейному уравнению регрессии

  a     ut (3.67)  
yt   b xt  

со случайными независимыми остатками ut.

Для оценки параметров преобразованного уравнения (3.67) можно приме-

нять обычный МНК. После определения параметров a и b параметр а нахо-дится из соотношения (3.66).

Изложенная процедура предварительного преобразования переменных с последующим применением МНК к оценке параметров уравнения регрессии в преобразованных переменных является частным случаем обобщенного метода наименьших квадратов.

Если ρ=1, то данный метод становится методом первых последователь-ных разностей, так как

yt' yt yt1; xt' xt xt1.  
Если ρ=–1, т. е. в остатках наблюдается полная отрицательная корреля-  
ция, то с учетом соотношений        
  yt1;   ( 1) xt1xtxt1 ;  
yt yt( 1) yt1 yt xt xt  

a a(1 ( 1)) 2 a

изложенный выше метод (уравнение (3.67)) принимает следующий вид yt yt12 a b (xt xt1) ut

или

( ytyt1 ) / 2 a b (xtxt1 ) / 2 ut / 2 .

Данная модель является моделью регрессии по скользящим средним.

Регрессионные модели с переменной структурой. Фиктивные переменные

Фиктивные переменные

При изучении экономических взаимосвязей возникает необходимость учесть в модели влияние качественного фактора (фактора, не имеющего коли-чественного выражения), например пол потребителя, фактор сезонности, нали-чие государственных программ. Влияние качественных признаков может при-водить к скачкообразному изменению параметров линейных регрессионных моделей, построенных для различных значений качественного признака. Такие модели называются регрессионными моделями с переменной структурой.

Чтобы учесть влияние качественного фактора в рамках одного регрессион-ного уравнения вводятся, так называемые, фиктивные переменные с двумя зна-чениями 0 и 1. Например, изучается зависимость потребления товара y от вели-чины дохода x с учетом пола потребителя. С использованием фиктивной пере-менной z

1, мужской пол    
z женский пол    
0,    
       
уравнение регрессии принимает вид      
y a b x c z . (3.68)  

Вводя новый член регрессии cz, мы тем самым предполагаем, что пол потребителя влияет только на величину свободного члена уравнения (параметр a характеризует объем потребления).Чтобы учесть влияние пола потребителяна величину коэффициента регрессии b(характеризующего «склонность» к по-треблению), следует в модель регрессии ввести дополнительное слагаемое d z x ,что дает

y a b x c z d z x . (3.69)

Таким образом, модель (3.69) является объединением двух моделей для мужчин и женщин

y a1 b1 x , y a 2 b2 x ,

где a1a c;b1b d;a2a;b2b.

Проверка значимости коэффициентов при фиктивных факторах z и z·x по-кажет значимость влияния качественного показателя на изучаемый признак и необходимость включения в уравнение регрессии соответствующего члена.

Если качественный признак имеет более двух градаций признака, то вво-дится несколько фиктивных переменных, число которых на единицу меньше числа градаций признака. Например, чтобы учесть сезонность, вводятся три фиктивные переменные

z1 1, весна, z2 1, лето, z3 1, осень, (3.70)  
  не весна,   не лето,   не осень  
  0,   0,   0,    
                     

и уравнение регрессии примет вид

y a b x c1 z1 c2 z2 c3 z3.

Если качественных признаков несколько, то фиктивные переменные вво-дятся для каждого признака по таким же правилам.

Тест Чоу

Предположим, что имеется две набора наблюдений за совместным измене-нием двух зависимой и объясняющей переменной (xi,yi), полученные в различ-ных условиях. Возникает вопрос можно ли считать две полученные выборки наблюдений частями одной объединенной выборки или принципиально раз-личными , для которых уравнения регрессии должны строиться отдельно, как показано на рисунке 3.1 [4]. Ответ на этот вопрос дается с помощью теста Чоу.

Построение регрессионных моделей при наличииавтокорреляции остатков - student2.ru

Рис. 3.1. Регрессии, оцениваемые для теста Чоу

Рассмотрим уравнения регрессии, построенные по первой, второй и объе-диненной выборкам

y i a1 b11 x ... b1px pi   i , (i = 1, 2, …, n1)  
    1i          
y i a2 b21 x ... b2px pi   i , (i = 1, 2, …, n2)  
    1i            
yi a b1 x1i... bp x pi i.     (i = 1, 2, …, n = n1+n2)  

Обозначим суммы квадратов остатков регрессии, полученных по первой, второй и объединенной выборкам E21,E21,E2.

Согласно тесту Чоу, нулевая гипотеза H0 о том, что две выборки являются частями одной объединенной выборки, отвергается при уровне значимости α,

если выполняется условие            
F (E2 E 2 E 2)(n 2 p 2) F . (3.71)  
   
    (E2 E 2)( p 1) ; p 1;n 2 p 2      
           

Наши рекомендации