Семинар 14 – Подготовка к экзамену (часть 2)
Вопрос 32- Фиктивные переменные и их использование
Часто в исследованиях может оказаться необходимым включить в модель качественную переменную. Это могут быть разные атрибутивные признаки, такие как профессия, пол, образование, климатические условия, принадлежность к определенному региону и т.п. Для того, чтобы ввести в модель регрессии такие переменные, им должны быть присвоены цифровые метки. Такого вида сконструированные переменные называют фиктивными переменными.
Например, фиктивная переменная z принимает значение 1, если какой-либо признак наблюдается, и 0, если не наблюдается:
Качественные признаки могут приводить к неоднородности исследуемой совокупоности, что может быть учтено при моделировании двумя путями:
- регрессия строится для каждой качественно отличной группы в отдельности, чтобы преодолеть неоднородность единиц общей совокупности;
- общая регрессионная модель строится для совокупности в целом. В этом случае в модель вводятся фиктивные переменные.
Как правило, фиктивная переменная принимает только два значения: 0 и 1. Если же число градаций качественного фактора превышает 2 (допустим, n), то вводится несколько фиктивных переменных (n-1 переменная).
Оценка параметров регрессионной модели с фиктивными переменными производится с помощью метода наименьших квадратов. Значимость уравнения регрессии в целом и отдельных коэффициентов проверяется так же, как и в случае множественной регрессии без фиктивных переменных.
Коэффициент регрессии при фиктивной переменной интерпретируется как изменение зависимости при переходе от одной категории к другой при неизменности значений остальных параметров.
Пример:
.
Значение качественной переменной, для которого принимается z = 0, называется базовым или сравнительным. Выбор базового значения обычно диктуется целями исследования, но может быть и произвольным.
Коэффициент c в модели иногда называют дифференциальным коэффициентом свободного члена, так как он показывает, на какую величину отличается свободный член модели при значении фиктивной переменной, равном единице, от свободного члена модели при базовом значении фиктивной переменной.
Заметим, что изменения значений качественных переменных в ряде случаев могут приводить не только к параллельному сдвигу базовой модели. Например, они могут привести к изменению наклона модели. В таких случаях пользуются следующей спецификацией модели:
,
то есть вводят в модель произведение xz.
Вопрос 33 - Тесты Голдфелда-Квандта и Глейзера.