Вопрос: Стохастические объясняющие переменные.

Одной из предпосылок МНК (в случае стохастических регрессоров) является требование, чтобы регрессоры и остатки были независимыми. Как было показано выше, если при этом математическое ожидание остатков равно нулю, МНК-оценки параметров уравнения регрессии будут несмещёнными. Одним из путей преодоления этой трудности (смещённость оценок вектора параметров) является использование других независимых переменных, которые носят название инструментальные переменные. Для получения состоятельных оценок в этом случае надо, чтобы инструментальные переменные обладали двумя свойствами:

• новые независимые переменные должны быть тесно связаны с исходными независимыми переменными;

• новые переменные не должны быть связаны с остатками модели.

Рассмотрим эти вопросы подробнее. Пусть исходная модель, как и раньше, описывается равенством Y = X + . При этом установлено, что хотя бы один из регрессоров коррелирован с остатками модели. Предположим, что задана матрица Z размера – матрица инструментальных переменных, причём k x k матрица ZTX обратима (здесь n – число наблюдений, k – число регрессоров, включая константу). Тогда по определению оценкой параметров с помощью инструментальных переменных называется вектор = (ZTX)-1ZTY.

Можно показать, что эта оценка является состоятельной, хотя в общем случае может быть смещённой и не эффективной, поскольку зависит от Z.

Типичными ситуациями, когда требуется использование инструментальных переменных, является наличие ошибок в измерениях независимых переменных или наличие лаговых переменных в качестве независимых переменных, если остатки модели автокоррелированы. Кроме того, метод инструментальных переменных используется при анализе системы одновременных эконометрических уравнений, когда одни и те же переменные одновременно являются зависимыми в одних уравнениях и независимыми в других. Можно показать, что применение стандартного МНК в этих случаях будет приводить к смещённым и несостоятельным оценкам.

Рассмотрим один из таких случаев, когда предпосылка о независимости регрессоров и остатков нарушается. Пусть рассматривается уравнение регрессии, в котором в качестве регрессора выступает лагированная зависимая переменной и остатки при этом автокоррелированы. Тогда анализируемая модель имеет вид

yt = + xt + yt-1 + ,

где xt – единственная объясняющая переменная. Известно, что если регрессоры (xt и yt-1) и остаток независимы, то МНК-оценка вектора параметров = ( )T будет несмещённой и состоятельной. Однако предположим, что остаток подвержен автокорреляции первого порядка, т.е. = + vt. Теперь исходная модель примет вид

yt = + xt + yt-1 + + vt.

Но yt-1 и зависимы (см. исходное уравнение с индексом (t1)), а в силу автокорелированности связано с , следовательно, регрессор yt-1 и остаток также зависимы. Таким образом, если 0, то МНК больше не приводит к несмещённым и состоятельным оценкам для параметров исходной модели.

Метод оценивания с помощью инструментальных переменных является обобщением обычного МНК. Выбор самих инструментальных переменных – не совсем простая задача. Её решение зависит от конкретной ситуации. Может оказаться, что вообще не удаётся найти инструментальных переменных, а может существовать и несколько таких инструментов.

Идея метода инструментальных переменных заключается в следующем. Сначала осуществляем регрессию каждого xj на Z и находим расчётные значения , j = 1,…,k. Будем считать их новыми независимыми переменными, и оценка по методу инструментальных переменных вектора параметров строится с помощью обычной регрессии y на , j = 1,…,k. Таким образом, МНК применяется здесь дважды – сначала для построения регрессоров , j = 1,…,k, а затем для нахождения оценки . Эта процедура носит название двухшагового МНК.

Следует иметь в виду, что не для каждой независимой переменной необходимо строить инструмент. Если какая-либо независимая переменная не коррелирует с остатками, то она сама для себя может служить инструментом.

Тест Хаусмана служит для проверки того, надо ли применять инструментальные переменные или достаточно обойтись обычным МНК. В этом тесте нулевой гипотезой является предпосылка, что регрессоры и остатки независимы. Альтернативная гипотеза – зависимые.

Рассчитываются два вида оценок вектора параметров модели – обычным МНК ( ) и с помощью инструментальных переменных (). При нулевой гипотезе обе эти оценки несмещённые и состоятельны, а при альтернативной – несмещённой оценкой является только оценка, рассчитанная с помощью инструментальных переменных. Так что при нулевой гипотезе разность этих оценок ( – ) стремится к нулю и при соответствующей нормировке распределение этой разности асимптотически будет совпадать к каким-нибудь известным распределением.

Хаусман доказал, что при верности нулевой гипотезы асимптотически верно равенство Var( – ) = Var () – Var (), так что статистика H = ( – )T(Var() – Var())-1( – ) при нулевой гипотезе асимптотически имеет хи-квадрат распределение с k степенями свободы.

Рассмотрим более общий случай, когда анализируются несколько эндогенных, т.е. определяемых внутри модели регрессоров. Пусть оценивается модель вида

Y = X1 + X2 + ,

где X1 – матрица значений экзогенных объясняющих переменных, некоррелированных с остатками,

X2 – матрица значений эндогенных объясняющих переменных, коррелированных с остатками.

Чтобы оценить это уравнение, необходима инструментальная переменная для каждого элемента в векторе объясняющих переменных X2. Это означает, что если имеются, например, три эндогенных регрессора, то необходимо иметь, по крайней мере, три различных инструментальных переменных. Обозначая совокупность инструментальных переменных вектором Z2, оценку методом инструментальных переменных можно записать как = (ZTX)-1ZTY, где теперь X = (X1,X2), a Z =(X1,Z2).

Иногда всю матрицу Z рассматривают как матрицу инструментальных переменных. В этом случае, если переменная в матрице объясняющих переменных является экзогенной, то для неё не надо искать инструментальную переменную. Эта переменная используется в качестве своей собственной инструментальной переменной. Поэтому число инструментальных переменных должно быть не менее, чем число оцениваемых параметров. Если все переменные экзогенные, то при применении метода инструментальной переменной реализуется обычная МНК-оценка, где каждая переменная инструментирована сама собой.

Задача 1. Анализ динамики временного ряда, используя средства Excel

Требуется:

1. Проверить наличие аномальных наблюдений во временном ряду
показателя (использовать графический и аналитический методы(можно не делать)).

2. Проверить наличие во временном ряду тенденции.

3. Используя средства Excel (или другого программного продукта), построить следующие виды трендовых моделей:

- линейную,

- логарифмическую,

- полиномиальную,

- степенную,

- экспоненциальную,

- линейной фильтрации.

4. Сравнить качество построенных моделей, используя коэффициент детерминации и среднюю относительную ошибку. Данные представить в таблице. Выбрать лучшую модель. Выводы обосновать.

· Задача 2. Оценка качества моделей одномерного временного ряда и построение прогнозов

1. Оценить адекватность лучшей моделей для выбранного показателя, используя свойства независимости остаточной компоненты, случайности и соответствия нормальному закону распределения (при использовании R/S-критерия взять табулированные границы 2,7—3,7).

2. Оценить точность модели на основе средней относительной ошибки
аппроксимации.

3. Осуществить прогнозы исследуемого признака на следующие 2 дня (доверительный интервал прогноза рассчитать при доверительной
вероятности р = 80%).

4. Фактические значения признаков, результаты моделирования и
прогнозирования представить графически.

5. Оценить в целом динамику торгов на представленные ценные бумаги. Сформировать предложения по повышению цен торгов на ценные бумаги (используя знания, полученные при изучении других дисциплин).

Исследуется динамика цены закрытия торгов на акции ряда компаний. Имеются данные о результатах биржевых торгов за пятнадцать дней (номер ценной бумаги соответствует выбранному номеру варианта):

Наблюдения

1. Вводим исходные данные

Строим график

Однородность данных означает отсутствие сильных изломов тенденций,а так же аномальных наблюдений. Аномальные наблюдения проявляются в виде сильного изменения уровня-скачка или спада с последующим приблизительным восстановлением предыдущего уровня. Визуально на данном графике аномалий нет.

2. Гипотезу о равенстве дисперсий проверим с помощью F-теста, который можно найти среди инструментов анализ данных.

Вводим данные для заполнения F-теста, указывая интервал для первой и второй переменных.

Результаты выполнения

Анализируя результаты Двухвыборочного t-теста с одинаковыми дисперсиями, убеждаемся, что тренда нет.

2. Используя средства Excel, строим следующие виды трендовых моделей:

Линейную, логарифмическую, полиномиальную, степенную, экспоненциальную, линейной фильтрации.

Сравним по качеству полученные модели. Для этого результаты вычислений представим в свободной таблице.

Вывод:

Лучшей по качеству моделью признается модель, обладающая большим значением коэффициента детерминации. Коэффициент детерминации R2 показывает долю вариации результативного признака под воздействием факторных признаков, введенных в модель регрессии. Следовательно, в качестве лучшей модели следует выбрать полиномиальную модель, так как у нее больший коэффициент детерминации R2=0.9282

Построим линейную однопараметрическую модель регрессииY от t/ для проведения регрессионного анализа выполняются следующие действия: Данные-анализ данных-регрессия. В диалоговом окне в поле входной интервал Y вводим адрес одного диапазона ячеек, который представляет зависимую переменную. В поле Входной интервал Х вводим адрес диапазона, который содержит значения независимой переменной t.

Уравнение регрессии зависимости Y от t имеет вид:

Y=0,367696*t - 17,6852

Наши рекомендации