Обобщенный метод наименьших квадратов. Гетероскедастичность
Обобщенный метод наименьших квадратов
Оценки (3.13) коэффициентов линейной множественной регрессии (3.6) являются эффективными (имеющими минимальную дисперсию в классе ли-нейных несмещенных оценок) только при выполнении предпосылок п. 3.5. На-рушение второй и третьей предпосылок ведет к утере эффективности оценок (3.13), т. е. существуют оценки с меньшей дисперсией (с меньшим разбросомзначений оценок).
Следствием предпосылок 2 и 3 является диагональная структура матрицы ковариаций ε случайного члена εi с одинаковыми диагональными элементами σ2(дисперсия случайного члена εi)
(3.43)
где En единичная матрица размерности n(n– количество наблюдений). При нарушении предпосылок ε перестает иметь структуру (3.43). Обозначим ее для удобства через Ω.
В общем случае, согласно теореме Айткена, наилучшей в классе линейных несмещенных оценок является оценка
X ) | (3.44) | ||||||
B (X | X | Y . |
Вычисление оценок параметров уравнения множественной линейной рег-рессии по формуле (3.45) (с учетом матрицы ковариаций Ω) называется обоб-щенным методом наименьших квадратов (ОМНК).
Согласно ОМНК, уравнения регрессии предварительно преобразовывают-ся с целью получить модель, содержащую случайный член, удовлетворяющий предпосылкам регрессионного анализа (п. 3.5).
Следует сказать, что ввиду сложности определения матрицы ковариаций ε = Ωэтот результат имеет в основном теоретический характер. Тем не менее, при определенных предположениях о структуре ε теорема имеет практическое значение.
Обобщенный метод наименьших квадратов в случае гетероскедастичности остатков
Предположим, что нарушается только предпосылка 2 о постоянстве дис-
, ( j i) . В этом случае говорят о ге- | ||||||
персии случайного члена | i | j | ||||
тероскедастичности остатков, а сами остатки называются гетероскедастичны-ми. При выполнении предпосылки 2 говорят о гомоскедастичности остатков. Матрицы Ω и Ω–1 в этом случае являются диагональными
0 ... | ||||||||||||||||||
... | ||||||||||||||||||
2 | ... | ... | ||||||||||||||||
, | . | |||||||||||||||||
... ... ... ... | ||||||||||||||||||
... ... ... ... | ||||||||||||||||||
... | ||||||||||||||||||
n | 0 ... | |||||||||||||||||
n |
Система нормальных уравнений ОМНК (3.13), (3.10) имеет вид
( X1X )B X1Y
или в координатной форме
y | i | a | b1 | x | x1 | b2 | x | 2i | bp | x pi | ||||||||||||||||||||||||||||||||
1i | ; | |||||||||||||||||||||||||||||||||||||||||
i | i | i | i | i | ||||||||||||||||||||||||||||||||||||||
y | x | a | x | b1 | x21i | b2 | x | 2i | x | bp | x pi x1i | |||||||||||||||||||||||||||||||
i | 1i | 1i | 1i | ; | ||||||||||||||||||||||||||||||||||||||
i | i | i | i | i | ||||||||||||||||||||||||||||||||||||||
..................................................................................... | ||||||||||||||||||||||||||||||||||||||||||
yi x pi | a | x pi | b1 | x1ixpi | b2 | x2ixpi | bp | x2pi | ||||||||||||||||||||||||||||||||||
. | ||||||||||||||||||||||||||||||||||||||||||
i | i | i | i | i | ||||||||||||||||||||||||||||||||||||||
(3.45)
(3.46)
(3.47)
Система уравнений (3.47) соответствует модели, определяемой соотноше-ниями
y | i | a | b1 | x | b2 | x | 2i | ... bp | x pi | ui, (i= 1, 2, …,n) (3.48) | |||||
1i | |||||||||||||||
i | i | i | i | i | |||||||||||
которые получаются, если исходное уравнение множественной регрессии (3.6), записанное для каждого наблюдения разделить на среднее квадратическое от-
клонение | случайного члена εi в i-наблюдении. Случайный член | ui | i | в | ||||
i | ||||||||
i |
модели (3.48) имеет постоянную для всех наблюдений дисперсию ui2=1. Запись
модели в виде (3.48) соответствует уравнению линейной множественной рег-рессии (без свободного члена)
y | b1 | b2 | (3.49) | ||||||||||||||||||||||||
ax0 | x1 | x2 | ... bpxpu , | ||||||||||||||||||||||||
записанному в новых переменных | ..., | ||||||||||||||||||||||||||
y , x0 | , x1 , | x p,значения которых опреде- | |||||||||||||||||||||||||
ляются по формулам | xpi | ||||||||||||||||||||||||||
y | i | x | x | 2i | , ui | i | , (i = 1, 2, …, n) | (3.50) | |||||||||||||||||||
1i | |||||||||||||||||||||||||||
yi | , x0i | , x1i | , x2i | , ..., xpi | |||||||||||||||||||||||
i | i | i | i | i | i | ||||||||||||||||||||||
Следует сказать, | что величины i2 | практически никогда не известны и |
вместо них следует использовать состоятельные оценки ˆi2.
При практическом использовании ОМНК используется какое-либо пред-положение относительно зависимости дисперсии i2 случайного члена ε от на-
блюдения или величины факторов xi.
Представим дисперсии i2 случайного члена в виде произведения некото-рой функции Ki2 от факторов на постоянную величину 2
. | (3.51) | ||||||||||||||||||||||||||||||||||||||||||||||||
i | Ki | ||||||||||||||||||||||||||||||||||||||||||||||||
Тогда соотношения (3.50) принимают вид | x pi | ||||||||||||||||||||||||||||||||||||||||||||||||
y | i | x | x | 2i | i | ||||||||||||||||||||||||||||||||||||||||||||
1i | |||||||||||||||||||||||||||||||||||||||||||||||||
, | , ..., | , ui | , | ui | const | . | |||||||||||||||||||||||||||||||||||||||||||
yi | Ki | , x0i | ,x1i | Ki | x2i | Ki | x pi | Ki | Ki | ||||||||||||||||||||||||||||||||||||||||
Ki | |||||||||||||||||||||||||||||||||||||||||||||||||
(i = 1, 2,…, n) | (3.52) | ||||||||||||||||||||||||||||||||||||||||||||||||
Часто на практике можно с достаточным основанием предположить, что | |||||||||||||||||||||||||||||||||||||||||||||||||
величины | σi | пропорциональны | значениям | какого-либо | фактора xα, | т. е. | |||||||||||||||||||||||||||||||||||||||||||
i | x | ( | x2 | 2 | ). В этом случае модель (3.49) принимает вид | ||||||||||||||||||||||||||||||||||||||||||||
i | i | i | |||||||||||||||||||||||||||||||||||||||||||||||
y | a | b | x | ... b | x | b b | x | ... b | x p | u | |||||||||||||||||||||||||||||||||||||||
p | (3.53) | ||||||||||||||||||||||||||||||||||||||||||||||||
x | x | x | x | x | x | ||||||||||||||||||||||||||||||||||||||||||||
и ui2 2.
Оценки параметров модели (3.53) являются оценками параметров исходно-го уравнения (3.6).
Если, вычислив значения новых переменных, мы запишем модель в стан-дартном виде
y | x | x | x p | |||||||
a b1 | b2 | ... bp | u , | (3.54) | ||||||
x | x | x | x | |||||||
то это будет новая модель с переменными, имеющими иной смысл. Оценки ее параметров будут отличаться от оценок параметров исходной модели.
Рассмотрим случай парной регрессии
y a b x | (3.55) |
и предположим, что величины σi пропорциональны значениям фактора x, т. е.i xi(i2 xi2 2).Преобразуя согласно ОМНК уравнение регрессии(3.55)
получим следующую модель
y | a | b u , | (3.56) | ||
x | x | ||||
оценки параметров которой будут эффективными оценками параметров исход-ной модели (5.55). Заметим, что в новой модели параметры a и b поменялись местами, т. е. свободный член стал коэффициентом и наоборот.