Пример исп-ия фиктивных переменных с временным рядом
В кач-ве примера рассм.спрос на автомобили в завис-ти от располагаемого дохода ур-ие регрессии запишем в сл.виде: ; y-спрос на авто; x-располаг.доход
Предполагается, что со временем доход растет. Проводится анализ с 1963 по 1983. В 1974 наблюдалось резкое снижение спроса на авто из-за повышения цены на бензин. (график)
Чтобы учесть в одном ур-ии:
Если δ считать отриц.величиной, то с 1963 по 1974г.,D=0; а с 1974 по 1983г., D=1.
Использование сезонных фиктивных переменных.
При исп-ии данных вр.рядов зачастую вместо годовых данных исп-ют квартальные пок-ли это позволяет существенно увеличить кол-во наблюдений. Однако на эти данные сущ-ое влияние оказ.сезонный фактор.Н-р, расходы потребителей на газ и электричество растут во времени(от года в год), но и изм.сущ-но от сезонов года. Для учета этого исп-ем след.ур-ие регрессии:
y- потребление (в руб.), t-время, D2,D3,D4-фиктив переменные
За базовый период взят 1-ый квартал. В этом сл.все фиктив.переменные = 0
Если наблюдение относится ко 2-му кварталу, то D2=1, D3=0, D4=0
Если наблюдение относится ко 3-му кварталу, то D3=1, а ост. = 0
Если наблюдение относится ко 4-му кварталу, то D2=0, D3=0, D4=1
Обычно имеет отриц.значение. (график)
Это сезонное отражение изменения потребления газа и электричества за год.
Фиктивные переменные для коэф-та наклона ур-ия регрессии.
Любые примеры обеспечивали интерпретацию сдвига графиков (вверх,вниз) при изм-ии кач-го признака. При этом предполагалось, что наклон графика не зависит от кач-го признака, что не всегда верно. В связи с этим введем фиктивную переменную для коэф-та наклона, назыв-ый иногда фиктив.переменной взаимодействия. В любом ранее примере с рождением первенца/не первенца ур-ие регрессии имело вид: : D=0- если первенец; D=1-если не первенец
Введем дополнительную фиктивную переменную для коэф-та наклона графика:
;
D1=0, D2=0, если первенец
D1=1, D2=1, если не первенец
Доугерти провел исслед-ие и получил:
Если первенец=(3363-4х)гр. Если матери курят, (график)
Если не перв.=(3410-12х)гр. то вес меньше
Тест Чоу.
Иногда выборки наблюдений состоят из двух или более подвыборок и необходимо решить вопрос: «сделать для каждой подвыборки отдельное уравнение регрессии или сделать одно общее уравнение регрессии?»
Для подвыборки А:
Для подвыборки В:
Для подвыборки А+В:
Обозначим суммы квадратов остатков для регрессии подвыборок , и , и (сумма квадратов отклонений для регрессии А+В на участке А), и (сумма квадратов отклонений для регрессии А+В на участке В)
Естественно предположить, что , а
Следовательно,
Up – сумма квадратов отклонения для регрессии (А+В). В пределе . Это будет достигаться при совпадении коэффициентов уравнения регрессии (Объединенной регрессии и регрессии подвыборок). Таким образом можно сказать, что имеется уличшение качества уравнения регрессии равное за счет представления уравнения регрессии в виде двух уравнений регрессии.
Однако в этом случае уменьшается число степеней свободы, т.к. в первом случае для объединенной регрессии мы имели число степеней свободы k=n-p-1, где р – число неизвестных.
Если мы берем для двух уравнений регрессии (А+В), то k2=n-2p-2.
Кроме того во втором случае остается необъясненной поэтому необходим критерий, который помог бы однозначно решить вопрос: «эффективно ли улучшение качества уравнения, получаемое за счет использования двух уравнений регрессии, по сравнению с использованием одного уравнения»
Для решения этого вопроса используется тест Чоу, который предполагает вычисления критерия Фишера по формуле:
Где в числителе записано улучшение качества уравнения, деленное на использованные степени свободы, а в знаменателе необъясненная дисперсия результативного признака, деленное на число оставшихся степеней свободы.
Данные расчетные значения критерия Фишера сравнивается при 5% уровне значимости нулевой гипотезы.
Нулевая гипотеза: в ген. Совокупности улучшение качества за счет использования двух уравнений регрессии равно 0.
Табличное значение Fp находится из таблицы со степенями свободы ;
Если Fp меньше Fтабл, то нулевая гипотеза отвергается и считается, что улучшение качества за счет использования двух уравнений регрессии существенно, т.е. имеет смысл их использовать.