Построение регрессионных моделей при наличииавтокорреляции остатков
Предположим, что нарушается только предпосылка 3 о независимости зна-чений случайного члена εi и εj в различных наблюдениях Cov(εi,εj) = 0 (i≠j). В этом случае говорят об автокорреляции остатков. Оценки параметров, полу-ченные методом наименьших квадратов, остаются несмещенными, но теряют свою эффективность.
Автокорреляция обычно встречается в регрессионном анализе только при использовании исходных данных в виде временных рядов. Более подробно по-нятие автокорреляции изложено в 5 разделе, где также приведены методы, по-зволяющие определить наличие и характер авторреляции во временном ряде. Здесь же мы рассмотрим случай, когда имеет место зависимость только между
соседними остатками.
Предположим, что остатки в уравнении линейной регрессии
yt a b xt t | (3.62) |
образуют авторегрессионный процесс первого порядка
tt 1ut. | (3.63) |
Для оценки величины ρ может использоваться статистика Дарбина-Уотсона d(см. п. 5.3.5)
ρ = 1 –d/2. | (3.64) |
Преобразуем уравнение (3.62), чтобы исключить автокорреляцию в остат-ках. Для этого уравнение (3.62), записанное для момента времени t–1,
yt1 a b xt1t1
умножим на ρ и вычтем из исходного уравнения (3.62) | |||
ytyt1 a ab (xtxt1)tt 1. | |||
Вводя новые переменные yt | и xt | ||
(3.65) | |||
yt ytyt1; xt xtxt1 | |||
и используя обозначение | a a(1 ) , | (3.66) | |
приведем исходную модель регрессии (3.62) к линейному уравнению регрессии
a | ut | (3.67) | ||||
yt | b xt |
со случайными независимыми остатками ut.
Для оценки параметров преобразованного уравнения (3.67) можно приме-
нять обычный МНК. После определения параметров a и b параметр а нахо-дится из соотношения (3.66).
Изложенная процедура предварительного преобразования переменных с последующим применением МНК к оценке параметров уравнения регрессии в преобразованных переменных является частным случаем обобщенного метода наименьших квадратов.
Если ρ=1, то данный метод становится методом первых последователь-ных разностей, так как
yt' yt | yt1; | xt' xt | xt1. | |
Если ρ=–1, т. е. в остатках наблюдается полная отрицательная корреля- | ||||
ция, то с учетом соотношений | ||||
yt1; | ( 1) xt1xtxt1 ; | |||
yt yt( 1) yt1 yt | xt xt |
a a(1 ( 1)) 2 a
изложенный выше метод (уравнение (3.67)) принимает следующий вид yt yt12 a b (xt xt1) ut
или
( ytyt1 ) / 2 a b (xtxt1 ) / 2 ut / 2 .
Данная модель является моделью регрессии по скользящим средним.
Регрессионные модели с переменной структурой. Фиктивные переменные
Фиктивные переменные
При изучении экономических взаимосвязей возникает необходимость учесть в модели влияние качественного фактора (фактора, не имеющего коли-чественного выражения), например пол потребителя, фактор сезонности, нали-чие государственных программ. Влияние качественных признаков может при-водить к скачкообразному изменению параметров линейных регрессионных моделей, построенных для различных значений качественного признака. Такие модели называются регрессионными моделями с переменной структурой.
Чтобы учесть влияние качественного фактора в рамках одного регрессион-ного уравнения вводятся, так называемые, фиктивные переменные с двумя зна-чениями 0 и 1. Например, изучается зависимость потребления товара y от вели-чины дохода x с учетом пола потребителя. С использованием фиктивной пере-менной z
1, | мужской пол | ||
z | женский пол | ||
0, | |||
уравнение регрессии принимает вид | |||
y a b x c z . | (3.68) |
Вводя новый член регрессии cz, мы тем самым предполагаем, что пол потребителя влияет только на величину свободного члена уравнения (параметр a характеризует объем потребления).Чтобы учесть влияние пола потребителяна величину коэффициента регрессии b(характеризующего «склонность» к по-треблению), следует в модель регрессии ввести дополнительное слагаемое d z x ,что дает
y a b x c z d z x . | (3.69) |
Таким образом, модель (3.69) является объединением двух моделей для мужчин и женщин
y a1 b1 x , y a 2 b2 x ,
где a1a c;b1b d;a2a;b2b.
Проверка значимости коэффициентов при фиктивных факторах z и z·x по-кажет значимость влияния качественного показателя на изучаемый признак и необходимость включения в уравнение регрессии соответствующего члена.
Если качественный признак имеет более двух градаций признака, то вво-дится несколько фиктивных переменных, число которых на единицу меньше числа градаций признака. Например, чтобы учесть сезонность, вводятся три фиктивные переменные
z1 | 1, | весна, | z2 | 1, | лето, | z3 | 1, | осень, | (3.70) | |
не весна, | не лето, | не осень | ||||||||
0, | 0, | 0, | ||||||||
и уравнение регрессии примет вид
y a b x c1 z1 c2 z2 c3 z3.
Если качественных признаков несколько, то фиктивные переменные вво-дятся для каждого признака по таким же правилам.
Тест Чоу
Предположим, что имеется две набора наблюдений за совместным измене-нием двух зависимой и объясняющей переменной (xi,yi), полученные в различ-ных условиях. Возникает вопрос можно ли считать две полученные выборки наблюдений частями одной объединенной выборки или принципиально раз-личными , для которых уравнения регрессии должны строиться отдельно, как показано на рисунке 3.1 [4]. Ответ на этот вопрос дается с помощью теста Чоу.
Рис. 3.1. Регрессии, оцениваемые для теста Чоу
Рассмотрим уравнения регрессии, построенные по первой, второй и объе-диненной выборкам
y | i | a1 | b11 x | ... b1px | pi | i | , (i = 1, 2, …, n1) | ||
1i | |||||||||
y | i | a2 | b21 x | ... b2px | pi | i | , (i = 1, 2, …, n2) | ||
1i | |||||||||
yi | a b1 x1i... bp x pi i. | (i = 1, 2, …, n = n1+n2) |
Обозначим суммы квадратов остатков регрессии, полученных по первой, второй и объединенной выборкам E21,E21,E2.
Согласно тесту Чоу, нулевая гипотеза H0 о том, что две выборки являются частями одной объединенной выборки, отвергается при уровне значимости α,
если выполняется условие | |||||||
F | (E2 | E 2 | E 2)(n 2 p 2) | F | . | (3.71) | |
(E2 | E 2)( p 1) | ; p 1;n 2 p 2 | |||||