Коэффициент детерминации как индикатор качества спецификации эконометрической модели (15 баллов)
Алгоритм проверки адекватности множественной регрессионной модели (сущность этапов проверки, расчетные формулы, формулировка вывода) (15 баллов).
Адекватность – возможность получения результата с удовлетворительной точностью. Применительно к построению эконометрических моделей под точностью результата понимается абсолютное значение разности между прогнозом, полученным с помощью модели и реальным значением эндогенной переменной. Модель считается адекватной, если эта разность не превосходит некоторого наперед заданного.
1.Вся имеющаяся в распоряжении выборка наблюдений делится на две неравные части: обучающую и контролирующую. Обучающая выборка включает основную (большую) часть наблюдений. Контролирующая выборка содержит до 5% от общего объема выборки
2.По обучающей выборке оценивается модель (рассчитываются оценки параметров модели и их стандартные ошибки).
Оценка параметров модели пар- ной и множественной линейной регрессии
Все параметры будут представлены в протоколе с помощью инструмента”Регрессия” в надстройке “Анализ данных”
3.Задается значение доверительной вероятности Рядов =1-α и определяется критическое значение дроби Стьюдента tкрит.
В Excel критическое значение t-критерия можно по- лучить с помощью функции СТЬЮДРАСПОБР(вероятность; степени_свободы)
вероятность – вероятность, соответствующая двусто- роннему распределению Стьюдента
степени_свободы – число степеней свободы, характе- ризующее распределение
4.Для каждой «точки» из контролирующей выборки по известным значениям экзогенных переменных строится доверительный интервал прогнозного значения эндогенной переменной.
5.Проверяется, попадает ли соответствующее значение эндогенной переменной внутрь полученного.
Пункты 5 и 6 проводятся для каждой точки выборки персонально!
Вывод. Если все значения эндогенных переменных из контрольной выборки накрываются соответствующими доверительными интервалами, то полученная модель с вероятностью Рядов считается адекватной, т.е. пригодной для дальнейшего использования в целях решения экономических задач.
Гетероскедастичность случайного возмущения (определение). Алгоритм теста Голдфелда-Квандта на наличие или отсутствие гетероскедастичности случайных возмущений в парной регрессионной модели (15 баллов).
Определение: При рассмотрении классической линейной регрессионной модели МНК дает наилучшие линейные несмещенные оценки лишь при выполнении ряда предпосылок, одной из которых является постоянство дисперсии отклонений (гомоскедастичность). Выполнимость данной предпосылки называется гомоскедастичностью (постоянством дисперсии отклонений). Невыполнимость данной предпосылки называется гетероскедастичностью (непостоянством дисперсий отклонений).
Тест Голдфелъда-Квандта применяется в том случае, когда имеются предположения:
1.о прямой зависимости дисперсии σt, ошибки регрессии εt от величины некоторой независимой переменной X в наблюдении t; 2.случайный член εt, распределен нормально и не подвержен автокорреляции.
Алгоритм теста:
4) Коэффициент детерминации в парной регрессионной модели: определение, расчетная формула, смысл компонентов формулы, смысл коэффициента детерминации (15 баллов).
Квадрат коэффициента множественной корреляции принято называть выборочным множественным коэффициентом детерминации, он показывает, какую долю вариации (случайного разброса) исследуемой величины Xj объясняет вариация остальных случайных величин X1, X2,…,Xm. Коэффициент детерминации является положительной величиной , принимающей значения в интервале от 0 до 1. При приближении коэффициента детерминации R2 к единице можно сделать вывод о тесноте взаимосвязи случайных величин, но не о ее направлении.
В общем, коэффициент детерминациипоказывает долю вариации результативного признака, находящегося под воздействием изучаемых факторов, то есть определяет, какая доля вариации признака Y учтена в модели и обусловлена влиянием на него факторов.
Чем ближе R2 к 1, тем выше качество модели.
Коэффициент детерминации как индикатор качества спецификации эконометрической модели (15 баллов)
Коэффициент детерминации (R2)— это доля дисперсии отклонений зависимой переменной от её среднего значения, объясняемая рассматриваемой моделью связи. Модель связи обычно задается как явная функция от объясняющих переменных.
где yi — наблюдаемое значение зависимой переменной, а fi — значение зависимой переменной предсказанное по уравнению регрессии -среднее арифметическое зависимой переменной. Коэффициент детерминации является случайной переменной. Он характеризует долю результативного признака у, объясняемую регрессией, в общей дисперсии результативного признака:
0≤ R2≤1. причем если R2= 1 то переменная yt полностью объясняется регрессором xt. В множественной регрессионной модели добавление дополнительных регрессоров увеличивает значение коэффициента детерминации, поэтому его корректируют с учетом числа независимых переменных:
Коэффициент детерминации R2 может использоваться для оценки качества
(точности) построенной модели регрессии. Чем выше этот показатель, тем
лучше модель описывает исходные данные. Чем ближе R^2 к 1, тем выше качество модели. При равенстве коэффициента единице линия регрессии точно соответствует всем наблюдениям. Равенство коэффициента нулю означает, что выбранные факторы не улучшают качество предсказания Yi по сравнению с тривиальным предсказанием . Достаточно качественной можно признать модель с коэффициентом детерминации выше 0,8.
Недостатком коэффициента детерминации является то, что он увеличивается при добавлении новых объясняющих переменных, что необязательно означает улучшение качества регрессионной модели. По этой причине, для устранения этого недостатка, на практике чаще используется скоректированный коэффициент детерминации.
В случае линейной зависимости коэффициент детерминации R2 и выборочный коэффициент корреляции rxy связаны соотношением
r2xy = R2.