Фиктивные переменные для пространственных выборок и временных рядов
Сравнительно часто отдельные факторы, кот.желательно ввести в модель явл.начальными по своей природе и ,след-но, не измер-ся в числовой шкале. Н-р, исслед-ся зав-сть м/д прод-тью получаемого образования и доходов и в выборке представлены лица муж. и жен.пола. Необх-мо выяснить обуславливает ли пол различия в рез-тах исслед-ния. Др.пример исслед-ые факторы, опр-ие инф-ию и в некот. годы изучаемого периода пр-во проводило политику регулирования доходов. Необх-мо выяснить, оказало ли это сущ-ое влияние на исслед-ую зав-сть. В каждом из этих примеров можно оценить отдельные ур-ия регрессии для двух категорий наблюдений, а затем сравнить полученные коэф-ты ур-ия регрессии. Др.подход закл.в нахождении единого ур-ия регрессии и исп-ем всей совок-ти данных и учетом степени влияния кач-ого фактора путем введения фиктивной переменной. Такой подход им. 2 преимущества: это простая проверка значимости кач-го фактора; оценки ур-ия регрессии будут более эффективными за счет увеличение числа наблюдений. Любой метод использования фиктивных переменных на примере регрессионного анализа влияния на вес новорожденных интенсивности курения матерей во время беременности. Наибольшая часть дисперсии веса новорожденного обуславливает генетической наследственностью ребенка и продолжительностью беременности. Курение объясняет очень малую часть всей дисперсии, но тем не менее является значимым фактором. Исследования показали, что при постоянных остальных факторов, курение 10 сигарет в день снижает вес новорожденного на 80 грамм, хотя данное снижение незначительно, но она показывает стат. устойчивое, неблагоприятное воздействие на вес новорожденного, а следовательно неблагоприятное воздействие на умственное развитие. В качестве отправной точки рассматривается модель вида: , где y – вес новорожденного в гр. x – количество сигарет в день, выкуренных матерью.
Оценка коэффициентов уравнения регрессии на базе информации о 967 родах показала, что y=3418-7,2x, т.е. ребенок, рожденных некурящей матерью в ср. будет иметь вес ≈ 3 кг 400 гр, а курящий – 7 гр на каждую сигарету.
Если положить угол наклона графика одинаково, то ур-ие можно записать: - ребенок, родившийся не первым.
Чтобы учесть оба случая, запишем ур-ие: D – фиктив.переменная
Если наблюдение касается первенца, то D=0, а если нет, то D=1. В этом сл.график выглядит:
для первенца, мать не курит = 3373гр.; не первенец, мать не курит = 3373-119; мать курит = 1сигарета – 78гр.
Стандартные ошибки коэф-ов при фиктивных переменных, рассчитываются с исп-ем ЭВМ, также как и станд.ошибки др.коэф-ов, исп-ся для проверки гипотез и построении доверительных интервалов. В частности определяется t – критерий Стьюдента, для чего производит деление коэф-та на станд.ошибку. Для учета пола ребенка ур-ие регрессии можно записать: , т.е. ввести 2 фиктив. переменные.
Первенец жен.пола: D1=0, D2=0
Не первенец муж.пола: D1=1, D2=1