Линейные регрессионные модели с гетероскедастичными остатками

При оценке параметров уравнения регрессии применяется метод наименьших квадратов (МНК). При этом делаются определенные предпосылки относительно случайной составляющей Линейные регрессионные модели с гетероскедастичными остатками - student2.ru .

В модели

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru

случайная составляющая Линейные регрессионные модели с гетероскедастичными остатками - student2.ru представляет собой ненаблюдаемую величину. После того как произведена оценка параметров модели, рассчитывая разности фактических и теоретических значений результативного признака y, можно определить оценки случайной составляющей Линейные регрессионные модели с гетероскедастичными остатками - student2.ru . Поскольку они не являются реальными случайными остатками, их можно считать некоторой выборочной реализацией неизвестного остатка заданного уравнения, т.е. Линейные регрессионные модели с гетероскедастичными остатками - student2.ru .

При изменении спецификации модели, добавлении в нее новых наблюдений выборочные оценки остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru могут меняться. Поэтому в задачу регрессионного анализа входит не только построение самой модели, но и исследование случайных отклонений Линейные регрессионные модели с гетероскедастичными остатками - student2.ru , т.е. остаточных величин.

При использовании критериев Фишера и Стьюдента делаются предположения относительно поведения остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru :

– остатки представляют собой независимые случайные величины и их среднее значение равно 0;

– они имеют одинаковую (постоянную) дисперсию;

– они подчиняются нормальному распределению.

После построения уравнения регрессии проводится проверка наличия у оценок Линейные регрессионные модели с гетероскедастичными остатками - student2.ru (случайных остатков) тех свойств, которые предполагались. Связано это с тем, что оценки параметров регрессии должны отвечать определенным критериям. Они должны быть несмещенными, состоятельными и эффективными. Эти свойства оценок, полученных по МНК, имеют чрезвычайно важное практическое значение в использовании результатов регрессии и корреляции.

Несмещенность[1] оценки означает, что математическое ожидание остатков равно нулю. Если оценки обладают свойством несмещенности, то их можно сравнивать по разным исследованиям.

Оценки считаются эффективными, если они характеризуются наименьшей дисперсией. В практических исследованиях это означает возможность перехода от точечного оценивания к интервальному.

Состоятельность оценок характеризует увеличение их точности с увеличением объема выборки. Большой практический интерес представляют те результаты регрессии, для которых доверительный интервал ожидаемого значения параметра регрессии Линейные регрессионные модели с гетероскедастичными остатками - student2.ru имеет предел значений вероятности, равный единице. Иными словами, вероятность получения оценки на заданном расстоянии от истинного значения параметра близка к единице.

Указанные критерии оценок (несмещенность, состоятельность и эффективность) обязательно учитываются при разных способах оценивания. Метод наименьших квадратов строит оценки регрессии на основе минимизации суммы квадратов остатков. Поэтому очень важно исследовать поведение остаточных величин регрессии Линейные регрессионные модели с гетероскедастичными остатками - student2.ru . Условия, необходимые для получения несмещенных, состоятельных и эффективных оценок, представляют собой предпосылки МНК, соблюдение которых желательно для получения достоверных результатов регрессии.

Исследования остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru предполагают проверку наличия следующих пяти предпосылок МНК:

1) случайный характер остатков;

2) нулевая средняя величина остатков, не зависящая от Линейные регрессионные модели с гетероскедастичными остатками - student2.ru ;

3) гомоскедастичность – дисперсия каждого отклонения Линейные регрессионные модели с гетероскедастичными остатками - student2.ru , одинакова для всех значений x;

4) отсутствие автокорреляции остатков – значения остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru распределены независимо друг от друга;

5) остатки подчиняются нормальному распределению.

Если распределение случайных остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru не соответствует некоторым предпосылкам МНК, то следует корректировать модель.

Прежде всего, проверяется случайный характер остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru – первая предпосылка МНК. С этой целью стоится график зависимости остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru от теоретических значений результативного признака (рис. 2.1). Если на графике получена горизонтальная полоса, то остатки Линейные регрессионные модели с гетероскедастичными остатками - student2.ru представляют собой случайные величины и МНК оправдан, теоретические значения Линейные регрессионные модели с гетероскедастичными остатками - student2.ru хорошо аппроксимируют фактические значения y.

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru

Рис. 2.1. Зависимость случайных остатков от теоретических значений .

Возможны следующие случаи, если Линейные регрессионные модели с гетероскедастичными остатками - student2.ru зависит от Линейные регрессионные модели с гетероскедастичными остатками - student2.ru то:

1) остатки Линейные регрессионные модели с гетероскедастичными остатками - student2.ru не случайны (рис. 2.2а);

2) остатки Линейные регрессионные модели с гетероскедастичными остатками - student2.ru не имеют постоянной дисперсии (рис. 2.2б);

3) остатки Линейные регрессионные модели с гетероскедастичными остатками - student2.ru носят систематический характер (рис. 2.2в).

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru Линейные регрессионные модели с гетероскедастичными остатками - student2.ru Линейные регрессионные модели с гетероскедастичными остатками - student2.ru
а б в
Рис. 2.2. Зависимость случайных остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru от теоретических значений Линейные регрессионные модели с гетероскедастичными остатками - student2.ru .

В этих случаях необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки Линейные регрессионные модели с гетероскедастичными остатками - student2.ru не будут случайными величинами.

Вторая предпосылка МНК относительно нулевой средней величины остатков означает, что Линейные регрессионные модели с гетероскедастичными остатками - student2.ru . Это выполнимо для линейных моделей и моделей, нелинейных относительно включаемых переменных.

Вместе с тем, несмещенность оценок коэффициентов регрессии, полученных МНК, зависит от независимости случайных остатков и величин x, что также исследуется в рамках соблюдения второй предпосылки МНК. С этой целью наряду с изложенным графиком зависимости остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru от теоретических значений результативного признака Линейные регрессионные модели с гетероскедастичными остатками - student2.ru строится график зависимости случайных остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru от факторов, включенных в регрессию Линейные регрессионные модели с гетероскедастичными остатками - student2.ru (рис. 2.3).

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru

Рис. 2.3. Зависимость величины остатков от величины фактора .

Если остатки на графике расположены в виде горизонтальной полосы, то они независимы от значений Линейные регрессионные модели с гетероскедастичными остатками - student2.ru . Если же график показывает наличие зависимости Линейные регрессионные модели с гетероскедастичными остатками - student2.ru и Линейные регрессионные модели с гетероскедастичными остатками - student2.ru , то модель неадекватна. Причины неадекватности могут быть разные. Возможно, что нарушена третья предпосылка МНК и дисперсия остатков не постоянна для каждого значения фактора Линейные регрессионные модели с гетероскедастичными остатками - student2.ru . Может быть неправильна спецификация модели и в нее необходимо ввести дополнительные члены от Линейные регрессионные модели с гетероскедастичными остатками - student2.ru , например Линейные регрессионные модели с гетероскедастичными остатками - student2.ru .

Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью F- и t-критериев. Вместе с тем, оценки регрессии, найденные с применением МНК, обладают хорошими свойствами даже при отсутствии нормального распределения остатков, т.е. при нарушении пятой предпосылки МНК.

Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.

В соответствии с третьей предпосылкой МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это значит, что для каждого значения фактора Линейные регрессионные модели с гетероскедастичными остатками - student2.ru остатки Линейные регрессионные модели с гетероскедастичными остатками - student2.ru имеют одинаковую дисперсию. Если это условие применения МНК не соблюдается, то имеет место гетероскедастичность. Наличие гетероскедастичности можно наглядно видеть из поля корреляции (рис. 2.4).

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru Линейные регрессионные модели с гетероскедастичными остатками - student2.ru Линейные регрессионные модели с гетероскедастичными остатками - student2.ru
а б в
Рис. 2.4. Примеры гетероскедастичности.

На рис. 2.4 изображено: а – дисперсия остатков растет по мере увеличения x; б – дисперсия остатков достигает максимальной величины при средних значениях переменной x и уменьшается при минимальных и максимальных значениях x; в – максимальная дисперсия остатков при малых значениях x и дисперсия остатков однородна по мере увеличения значений x.

Наличие гомоскедастичности или гетероскедастичности можно видеть и по рассмотренному выше графику зависимости остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru от теоретических значений результативного признака Линейные регрессионные модели с гетероскедастичными остатками - student2.ru . Так, для рис. 2.4а зависимость остатков от Линейные регрессионные модели с гетероскедастичными остатками - student2.ru представлена на рис. 2.5.

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru

Рис. 2.5. Гетероскедастичность: большая дисперсия для больших значений .

Соответственно для зависимости, изображенной на полях корреляции рис. 2.4б и 2.4в, гетероскедастичность остатков представлена на рис. 2.6 и 2.7.

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru

Рис. 2.6. Гетероскедастичность, соответствующая полю корреляции на рис. 2.4б.

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru

Рис. 2.7. Гетероскедастичность, соответствующая полю корреляции на рис. 2.4в.

Для множественной регрессии данный вид графиков является наиболее приемлемым визуальным способом изучения гомо- и гетероскедастичности.

При построении регрессионных моделей чрезвычайно важно соблюдение четвертой предпосылки МНК – отсутствие автокорреляции остатков, т.е. значения остатков Линейные регрессионные модели с гетероскедастичными остатками - student2.ru , распределены независимо друг от друга. Автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений[2]. Коэффициент корреляции между Линейные регрессионные модели с гетероскедастичными остатками - student2.ru и Линейные регрессионные модели с гетероскедастичными остатками - student2.ru , где Линейные регрессионные модели с гетероскедастичными остатками - student2.ru – остатки текущих наблюдений, Линейные регрессионные модели с гетероскедастичными остатками - student2.ru – остатки предыдущих наблюдений (например, Линейные регрессионные модели с гетероскедастичными остатками - student2.ru ), может быть определен как

Линейные регрессионные модели с гетероскедастичными остатками - student2.ru ,

т.е. по обычной формуле линейного коэффициента корреляции. Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированы и функция плотности вероятности Линейные регрессионные модели с гетероскедастичными остатками - student2.ru зависит от j-й точки наблюдения и от распределения значений остатков в других точках наблюдения.

Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динамики, где ввиду наличия тенденции последующие уровни динамического ряда, как правило, зависят от своих предыдущих уровней.

При несоблюдении основных предпосылок МНК приходится корректировать модель, изменяя ее спецификацию, добавлять (исключать) некоторые факторы, преобразовывать исходные данные для того, чтобы получить оценки коэффициентов регрессии, которые обладают свойством несмещенности, имеют меньшее значение дисперсии остатков и обеспечивают в связи с этим более эффективную статистическую проверку значимости параметров регрессии.

Наши рекомендации