Использование фиктивных переменных для определения структурных изменений в экономике
В регрессионных моделях в качестве объясняющих перменных часто приходится использовать не только количественные(определяемые численно), но и качественные переменные.Например, спрос на некоторое благо может определяться ценой дополняющих благ, доходом потребителей и тд. (эти показатели определяются количественно). Но спрос может также зависеть от вкусов потребителей, их ожиданий, сезона, пола, национальных и религиозных особенностей и тд. А эти показатели можно представить в целочисленном виде. В литературе они называются качественными признаками.
Качественные признаки могут существеннно влиять на структуру линейных связей между переменными иприводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или построении регрессионных моделей по неоднородным данным.
Например, нам надо изучить зависимость размера з/п Y работников не только от личественных факторов Х1,Х2,Х3..Хn , но и от качественного признака Z1. В принципе можно было получить оценки регрессионной модели Yi =ß0 + ß1*x1(i)+…+ ßp*xp(i) + e(i) , i=1,…,nдля каждого уровня качественного признака (т.е выборочное уравнение регрессии отдельно для работников-мужчин и отдельно –для женщин) , а затем изучать различия между ними. Также можно ввести фиктивные переменные , которые принимают всего два значения: 0 и 1)
Z1=0 это работник мужчина , а Z1=1 это работник женщина
Эти переменные можно включить в уравнение регрессии
Yi =ß0 + ß1*x1(i)+…+ ßp*xp(i) + a1*z1(i) + e(i) , i=1,…,n
Где z1(i)= 1 если i-ый работник муж , z1(i) = 0 если i-ый работник жен
Коэффициент детерминации в множественной регрессионной модели (смысл, расчетная формула). Проверка значимости коэффициента детерминации. Формула расчета и назначение скорректированного коэффициента детерминации в множественной регрессионной модели (15 баллов).
Коэффициент детерминации (R^2 — R-квадрат) — это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными. Более точно — это единица минус доля необъяснённой дисперсии (дисперсии случайной ошибки модели, или условной по факторам дисперсии зависимой переменной) в дисперсии зависимой переменной.
Его рассматривают как универсальную меру зависимости одной случайной величины от множества других. В частном случае линейной зависимости R^2 является квадратом так называемого множественного коэффициента корреляции между зависимой переменной и объясняющими переменными. В частности, для модели парной линейной регрессии коэффициент детерминации равен квадрату обычного коэффициента корреляции между y и x.
Истинный коэффициент детерминации модели зависимости случайной величины от признаков определяется следующим образом:
где — условная (по признакам ) дисперсия зависимой переменной (дисперсия случайной ошибки модели).
В данном определении используются истинные параметры, характеризующие распределение случайных величин. Если использовать выборочную оценку значений соответствующих дисперсий, то получим формулу для выборочного коэффициента детерминации (который обычно и подразумевается под коэффициентом детерминации):
где
— сумма квадратов регрессионных остатков,
— общая дисперсия,
— соответственно, фактические и расчетные значения объясняемой переменной,
— выборочное среднее.