Оценивание параметров моделей с гетероскедастичностью возмущений

Рассмотрим использование обобщенного метода наименьших квадратов для корректировки гетероскедастичности возмущений. Пусть строится линейная регрессионная модель (1). Будем считать, что модель гетероскедастична, т. е. дисперсии возмущений Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n) не равны между собой, а сами возмущения не коррелированны и их математические ожидания равны нулю. Это означает, что ковариационная матрица вектора возмущений W будет диагональной:

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru . (25)

Для оценки параметров такой модели используется взвешенный метод наименьших квадратов (Weighted Least Squares), являющийся частным случаем обобщенного МНК.

Сущность взвешенного метода наименьших квадратов состоит в том, что каждый квадрат остатка Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n) «взвешивается» с помощью коэффициента Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , где s(ei) — среднее квадратическое отклонение i-го возмущения. Тем самым добиваются равномерного вклада остатков в остаточную сумму квадратов, что приводит, в конечном счете к получению несмещенных и наиболее эффективных оценок параметров модели.

Условие взвешенного метода наименьших квадратов имеет вид:

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru . (26)

Вектор b* оценок параметров модели определяется по формуле (24).

На практике, однако, средние квадратические отклонения возмущений s(ei) почти никогда не бывают известны. Поэтому для применения взвешенного метода наименьших квадратов, необходимо сделать предположение о значениях s(ei). Весьма часто считают, что среднее квадратическое отклонение возмущений пропорционально значениям одного из факторов, предположительно делающих выборочную совокупность неоднородной.

Пусть имеются исходные данные для построения модели множественной регрессии (табл. 1).

Таблица 1
Исходные данные для построения модели множественной регрессии
Номер наблюдения (объекта) Значение результата Y Набор факторов и их значения
X0 X1 X2 Xj Xp
y1 x11 x12 x1j x1p
y2 x21 x22 x2j x2p
i yi xi1 xi2 xij xip
 
n yn xn1 xn2 xnj xnp

Представим модель (1) в развернутом виде:

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n). (27)

Если предположить, что среднее квадратическое отклонение возмущений s(ei) (i=1, 2, …, n) пропорционально значениям xij фактора Xj (или, что одно и тоже — дисперсия возмущений Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru пропорциональна квадрату значений фактора Xj), то исходные данные преобразуются их делением на соответствующие значения xij (i=1, 2, …, n). Такое преобразование называется масштабированием исходных данных по фактору Xj. (табл. 2).

Таблица
Масштабирование исходных данныхпо фактору Xj
Номер наблюдения (объекта) Значение результата Y Набор факторов и их значения
X0 X1 X2 Xj Xp
y1/x1j 1/x1j x11/x1j x12/x1j x1p/x1j
y2/x2j 1/x2j x21/x2j x22/x2j x2p/x2j
i yi/xij 1/xij xi1/xij xi2/xij xip/xij
n yn/xnj 1/xnj xn1/xnj xn2/xnj xnp/xnj

Таким же образом преобразуется и модель (27):

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n), (28)

или, что одно и тоже —

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n), (29)

Введем обозначения.

Пусть Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , …, Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , тогда преобразованная модель окончательно будет иметь вид:

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n). (30)

Параметры преобразованной модели (30) оцениваются обычным методом наименьших квадратов. Если предположение о пропорциональности среднего квадратического отклонения возмущений значениям фактора Xj имеет основание, то «новое» возмущение ni будет иметь постоянную и притом — наименьшую дисперсию, а коэффициенты уравнения регрессии окажутся несмещенными и эффективными оценками параметров модели (30). Вместе с тем следует иметь в виду, что новые преобразованные переменные получают другое экономическое содержание и их регрессия имеет иной смысл, чем регрессия по исходным данным. Поэтому численно оценки параметров моделей (27) и (30) в общем случае не совпадают.

Если строится линейная модель парной регрессии Y по X

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n), (31)

то она трансформируется в модель

  Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n), (32)

в которой свободный член и угловой коэффициент как бы поменялись местами.

На практике иногда имеет смысл попробовать использовать одновременно несколько факторов для масштабирования исходных данных. Если каждый раз получаются сходные результаты и тесты Голдфельда–Квандта по всем факторам не выявляют гетероскедастичность возмущений, то эту проблему можно считать решенной.

В ряде случаев дисперсия возмущений зависит не от включенных в модель факторов, а от тех, которые не включены в модель, но играют существенную роль в исследуемой зависимости. Иногда для устранения гетероскедастичности необходимо изменить спецификацию модели, например, линейную на логарифмическую и т.д.

Пример 1

По 12 транспортным компаниям исследуется зависимость годового дохода (переменная Y, млн. руб.) от среднегодового количества грузовых автомобилей (переменная X). Имеются данные, для удобства упорядоченные по фактору X:

№ п/п 1 2 3 4 5 6 7 8 9 10 11 12
X 15 18 22 27 25 31 34 37 40 45 48 48
Y 235 250 247 287 260 262 307 280 357 410 389 311

Требуется:

1. Построить линейную модель парной регрессии Y по X.

2. Проверить наличие гетероскедастичности возмущений методом Голдфельда–Квандта.

3. При обнаружении гетероскедастичности возмущений построить взвешенную модель регрессии.

Решение

1. По исходным данным строим линейную модель парной регрессии

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n; n=12).

Параметры модели оцениваем обычным методом наименьших квадратов. С помощь табличного процессора MS Excel были определены коэффициенты уравнения регрессии Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru : b0=160,6; b1=4,277. Таким образом, уравнение примет вид:

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru .

Уравнение регрессии статистически значимо на уровне a=0,05: F‑статистика имеет значение F=25,15; табличное значение F-критерия Фишера — F0,05; 1;10=4,96; коэффициент детерминации — R2=0,716.

Значение углового коэффициента уравнения регрессии b1=4,277 показывает, что увеличение количества автомобилей на одну единицу приводит к росту годового дохода в среднем на 4,277 млн. руб.

Визуальный анализ графика зависимости годового дохода от количества автомобилей дает основание предполагать наличие гетероскедастичности возмущений. Видно, что отклонение от линии регрессии наблюдений, соответствующих крупным предприятиям, больше, чем для малых предприятий:

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru

2. Построим график остатков и проведем его визуальный анализ. Предсказываемые уравнением регрессии значения результата Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru и остатков Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n; n=12) приведены в таблице:

i 1 2 3 4 5 6 7 8 9 10 11 12
xi 15 18 22 27 25 31 34 37 40 45 48 48
yi 235 250 247 287 260 262 307 280 357 410 389 311
Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru 225 238 255 276 268 293 306 319 332 353 366 366
ei 10 12 -8 11 -8 -31 1 -39 25 57 23 -55

График остатков по фактору X показан на рисунке:

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru

Визуальный анализ графика остатков показывает, что их разброс растет по мере увеличения фактора Х, что может свидетельствовать о гетероскедастичности возмущений. Проверим это предположение методом Голдфельда–Квандта. Будет считать, что возмущения распределены по нормальному закону и их среднее квадратическое отклонение пропорционально значению фактора Х. Все остатки уже упорядочены по Х. Выбираем Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru первых и последних остатков. По каждой из групп определяем сумму квадратов остатков:

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru ;

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru .

Так как SS2>SS1 , то F-статистику рассчитываем по формуле

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru .

Табличное значение F-критерия Фишера для уровня значимости a=0,05 и чисел степеней свободы числителя и знаменателя Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (где p=1 — число факторов в модели) составляет F0,05; 3;3=9,28.

Так как Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru , статистическая гипотеза об одинаковой дисперсии возмущений отклоняется на уровне значимости a=0,05. Факт наличия гетероскедастичности возмущений считается установленным.

3. Применим взвешенный МНК к исходной модели в предположении, что среднее квадратическое отклонение возмущений пропорционально значению фактора Х, для чего масштабируем исходные данные по Х:

i 1 2 3 4 5 6 7 8 9 10 11 12
1/xi 0,0667 0,0556 0,0455 0,0370 0,0400 0,0323 0,0294 0,0270 0,0250 0,0222 0,0208 0,0208
yi/xi 15,67 13,89 11,23 10,63 10,40 8,45 9,03 7,57 8,93 9,11 8,10 6,48

Исходную модель преобразуем в модель Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (i=1, 2, …, n; n=12). Оцениваем параметры преобразованной модели b1 и b0 обычным методом наименьших квадратов. С помощь MS Excel были определены коэффициенты уравнения регрессии Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru преобразованной модели: b1=3,863; b0=173,2, и уравнение регрессии примет вид:

Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru (F=106; R2= 0,914).

Угловой коэффициент данного уравнения сравнивают со свободным членом исходного уравнения регрессии и наоборот. Видно, что значения соответствующих параметров уравнений отличаются друг от друга.

Тест Голдфельда–Квандта, примененный к преобразованной модели, не выявляет гетероскедастичности ее возмущений: F-статистика Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru не превышает табличное значение F-критерия Фишера Оценивание параметров моделей с гетероскедастичностью возмущений - student2.ru .

Используя преобразованное уравнение регрессии делаем вывод, что увеличение количества автомобилей на одну штуку приводит к росту годового дохода в среднем на 3,863 млн. руб.

Наши рекомендации