Автокорреляция в остатках. Критерий Дарбина-Уотсона
Автокорреляция остатков - наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции между ei и ej , где ei — остатки текущих наблюдений, ej — остатки предыдущих наблюдений, может быть определен по обычной формуле линейного коэффициента корреляции . Если этот коэффициент окажется существенно отличным от нуля, то остатки автокоррелированы и функция плотности вероятности F(e) зависит j-й точки наблюдения и от распределения значений остатков в других точках наблюдения. Для регрессионных моделей по статической информации автокорреляция остатков может быть подсчитана, если наблюдения упорядочены по фактору х. Отсутствие автокорреляции остаточных величин обеспечивает состоятельность и эффективность оценок коэффициентов регрессии. Особенно актуально соблюдение данной предпосылки МНК при построении регрессионных моделей по рядам динамики, где ввиду наличия тенденции последующие уровни динамического ряда, как правило, зависят от своих предыдущих уровней.
Два метода определения автокорреляции остатков: Первый метод — это построение графика зависимости остатков от времени и визуальное определение наличия или отсутствия автокорреляции. Второй метод — использование критерия Дарбина — Уотсона и расчет величины
(1)Таким образом, d есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии. Можно предположить у2,что: , предположим также Коэффициент автокорреляции остатков определяется как
С учетом (3) имеем: Таким образом, если в остатках существует полная положительная автокорреляция и , то d= 0. Если в остатках полная отрицательная автокорреляция, то и, следовательно, d= 4.Если автокорреляция остатков отсутствует, то и d = 2. Следовательно, 0≤d≤4
19. Ошибки спецификации уравнения регрессии. Спецификация регрессии – отбор факторных переменных, включаемых в регрессионную модель и определение формы модели.
Гипотеза о статистической значимости оценок может быть правильной и неправильной, поэтому возникает необходимость ее проверки. В результате статистической проверки гипотезы в двух случаях может быть принято неправильное решение, т.е. могут быть допущены ошибки двух типов.
Ошибка первого рода состоит в том, что будет опровергнута правильная гипотеза. Обычно ее называют уровнем значимости α – т.е. вероятность совершить ошибку первого рода. Обычно уровень значимости α принимают равным 0,05 или 0,01 (например если α=0,05 то в 5 случаях из 100 имеется риск допустить ошибку первого рода).
Ошибка второго рода состоит в том что будет принята неправильная гипотеза. Число степеней свободы ν=n-k-1, где n-число наблюдений (объем выборки), k-число параметров при факторных переменных в уравнении регрессии (для однофакторной регрессии k=1 и ν=n-2). — случайная величина, характеризующая отклонения реального значения результативного признака от теоретического.
Случайная величина ε называется также возмущением. Она включает влияние не учтенных в модели факторов, случайных ошибок и особенностей измерения.
От правильно выбранной спецификации модели зависит величина случайных ошибок: они тем меньше, чем в большей мере теоретические значения результативного признака подходят к фактическим данным у.
К ошибкам спецификации относятся неправильный выбор той или иной математической функции для , и недоучет в уравнении регрессии какого-либо существенного фактора, т. е. использование парной регрессии вместо множественной.
16. Парная и частная корреляция в модели множественной регрессии. Множественный коэффициент корреляции, множественный коэффициент детерминации.
Если имеется одна независимая и одна зависимая переменная, то мерой тесноты их связи служит парный коэффициент корреляции. Если имеется несколько независимых переменных, то необходимо рассчитывать частные коэффициенты корреляции.
Парный и частный коэффициенты корреляции ( ) характеризуют тесноту линейной зависимости между двумя переменными соответственно на фоне действия и при исключении влияния всех остальных показателей, входящих в модель.
Они изменяются в пределах от -1 до +1, причем чем ближе коэффициент корреляции к 1, тем сильнее зависимость между переменными. Если коэффициент корреляции больше нуля, то связь положительная, а если меньше нуля — отрицательная.
Множественный коэффициент корреляции (R) характеризует тесноту, линейной связи между одной переменной (результативной) и остальными, входящими в модель; он изменяется в пределах от 0 до 1.
Квадрат множественного коэффициента корреляции называется множественным коэффициентом детерминации (R2). Он характеризует долю дисперсии одной переменной (результативной), обусловленной влиянием всех остальных переменных, входящих в модель.
Коэф. корреляции:
где и – средние значения переменных x и y:
Множественный коэф. корреляции:
Множественный коэф. детерминации:
17. Оценка множественной регрессии. Критерий Фишера и Стьюдента.
В общем виде качество эконометрической модели оценивается адекватностью (ее соотношение моделируемому объекту относительно существенных для исследования свойств объекта) и точностью (отклонение теоретического значения от его фактического).
Оценка статистической значимости модели множественной регрессии состоит в сравнение факторной и остаточной дисперсии с использованием F-критерия Фишера. Если фактическое значение этого критерия больше теоретического при заданном уровне значимости α и степени свободы v1=n-1 и v2=n-k-1, то модель признается значимой.
При проверке качества надо также оценить значимость коэффициентов с использованием t-статистики Стьюдента. Если расчетное значение критерия превышает критическое, то коэффициент регрессии считается значимым.
Обобщенный МНК
При нарушении гомоскедастичности (Наличие одинаковой дисперсии. Данные являются гомо-ми, если их вариации соответствуют случайным отклонениям по тому же мн-ву. Это отличается от гетероскедастичности (heteroscedasticity), т. е. наличия различной дисперсии.) и наличии автокорреляции ошибок рекомендуется традиционный МНК заменять обобщенным методом. ОМНК применяется к преобразованным данным и позволяет получать оценки, которые обладают не только свойством несмещенности, но и имеют меньшие выборочные дисперсии. Суть ОМНК – минимиз-я обобщенной суммы квадратов отклонений( учет ненулевых ковариаций случ-ой ош-ки для разных наблюденийи непостоянной дисперсии ош-ки)
В общем виде для уравнения yi=a+bxi+ei при где Ki – коэф-т пропор-ти. Модель примет вид: yi=+xi+ei . В ней остаточные величины гетероскедастичны. Предполагая в них отсутствие автокорреляции, можно перейти к уравнению с гомоскедастичными остатками, поделив все переменные, зафиксированные в ходе i-го наблюдения на . Тогда дисперсия остатков будет величиной постоянной. От регрессии у по х мы перейдем к регрессии на новых переменных: y/ и х/. Уравнение регрессии примет вид: . По отношению к обычной регрессии уравнение с новыми, преобразованными переменными представляет собой взвешенную регрессию,в которой переменные у и х взяты с весами . Коэф-т регрессии b можно определить как
Как видим, при использовании обобщенного МНК с целью корректировки гетероскедастичности коэффициент регрессии b представляет собой взвешенную величину по отношению к обычному МНК с весами 1/К.Аналогичный подход возможен не только для уравнения парной, но и для множественной регрессии. Применение в этом случае обобщенного МНК приводит к тому, что наблюдения с меньшими значениями преобразованных переменных х/К имеют при определении параметров регрессии относительно больший вес, чем с первоначальными переменными