Сравнение двух регрессий
В примерах, рассматриваемых до сих пор, предполагалось, что изменение значения качественного фактора влияет лишь на изменение свободного члена. Но это не всегда так. Изменение качественного фактора может привести также к изменению наклона прямой регрессии.
Обычно это характерно для временных рядов экономических данных при изменении институциональных условий, введении новых правовых или налоговых ограничений. Например, можно предположить, что до некоторого года в стране обменный курс валют был фиксированным, а затем плавающим. Или налог на ввозимые автомобили был одним, а затем он существенно изменился. В этом случае зависимость может быть выражена так:
(6.12)
где
В этой ситуации ожидаемое значение зависимой переменной определяется следующим образом:
(6.13)
(6.14)
Коэффициенты и в уравнении (6.12) называются дифференциальным свободным членом и дифференциальным угловым коэффициентом соответственно. Фиктивная переменная в уравнении (6.12) используется как в аддитивном виде , так и в мультипликативном , что позволяет фактически разбивать рассматриваемую зависимость на две части, связанные с периодами изменения некоторого рассматриваемого в модели качественного фактора. Уравнение регрессии (6.12) достаточно хорошо моделирует ситуацию, изображенную на рисунке 6.3.
|
|
Рис. 6.3
На рисунке 6.3, а зависимость моделируется обыкновенной линейной регрессией. На рисунке 6.3, б в модели учитываются изменения, произошедшие с некоторого времени в характере расположения точек наблюдений. На данном примере хорошо видно, каким образом можно проанализировать, имеет ли смысл разбивать выборку на части и строить для каждой из них уравнение регрессии (т.е. фактически строить сложную регрессию с фиктивными переменными) либо можно ограничиться общей «обыкновенной» регрессией для всех точек наблюдений. Для этого можно использовать тест Чоу.
Суть теста Чоу заключается в следующем. Пусть выборка имеет объем . Через обозначим сумму квадратов отклонений значений от общего уравнения регрессии. Пусть есть основание предполагать, что целесообразно общую выборку разбить на две подвыборки объемами и соответственно и построить для каждой из выборок уравнение регрессии. Обозначим через и суммы квадратов отклонений значений каждой из подвыборок от соответствующих уравнений регрессий. Затем рассчитывается -статистика, которая для теста Чоу имеет вид:
(6.15)
где – число количественных объясняющих переменных в уравнении регрессии (одинаково для всех трех уравнений регрессии).
Из приложения 2 определяется для числа степеней свободы , и требуемого уровня значимости . Если при выбранном уровне значимости, то нет смысла разбивать уравнение регрессии на части. В противном случае разбиение на подынтервалы целесообразно с точки зрения улучшения качества модели, что означает необходимость введения в уравнение регрессии соответствующей фиктивной переменной.