Фиктивные переменные во множественной регрессии

До сих пор в качестве факторов рассматривались экономические переменные, принимающие количественные значения в некотором интервале. Вместе с тем может оказаться необходимым включить в модель фактор, имеющий два или более качественных уровней. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол, образование, климатические условия, принадлежность к определенному региону. Чтобы ввести такие переменные в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количественные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными. В отечественной литературе можно встретить термин «структурные переменные».

Рассмотрим применение фиктивных переменных для функции спроса. Предположим, что по группе лиц мужского и женского пола изучается линейная зависимость потребления кофе от цены. В общем виде для совокупности обследуемых уравнение регрессии имеет вид:

Фиктивные переменные во множественной регрессии - student2.ru ,

где Фиктивные переменные во множественной регрессии - student2.ru — количество потребляемого кофе; Фиктивные переменные во множественной регрессии - student2.ru — цена.

Аналогичные уравнения могут быть найдены отдельно для лиц мужского пола: Фиктивные переменные во множественной регрессии - student2.ru и женского пола: Фиктивные переменные во множественной регрессии - student2.ru .

Различия в потреблении кофе проявятся в различии средних Фиктивные переменные во множественной регрессии - student2.ru и Фиктивные переменные во множественной регрессии - student2.ru . Вместе с тем сила влияния Фиктивные переменные во множественной регрессии - student2.ru на Фиктивные переменные во множественной регрессии - student2.ru может быть одинаковой, т. е. Фиктивные переменные во множественной регрессии - student2.ru . В этом случае возможно построение общего уравнения регрессии с включением в него фактора «пол» в виде фиктивной переменной. Объединив уравнения Фиктивные переменные во множественной регрессии - student2.ru и Фиктивные переменные во множественной регрессии - student2.ru и введя фиктивные переменные, придем к следующему выражению: Фиктивные переменные во множественной регрессии - student2.ru ,

Фиктивные переменные во множественной регрессии - student2.ru Фиктивные переменные во множественной регрессии - student2.ru где Фиктивные переменные во множественной регрессии - student2.ru Фиктивные переменные во множественной регрессии - student2.ru и Фиктивные переменные во множественной регрессии - student2.ru – фиктивные переменные, принимающие значения:

Фиктивные переменные во множественной регрессии - student2.ru

В общем уравнении регрессии зависимая переменная Фиктивные переменные во множественной регрессии - student2.ru рассматривается как функция не только цены Фиктивные переменные во множественной регрессии - student2.ru , но и пола Фиктивные переменные во множественной регрессии - student2.ru . Переменная Фиктивные переменные во множественной регрессии - student2.ru рассматривается как дихотомическая переменная, принимающая всего два значения: 1 и 0. При этом когда Фиктивные переменные во множественной регрессии - student2.ru , то Фиктивные переменные во множественной регрессии - student2.ru и, наоборот, при Фиктивные переменные во множественной регрессии - student2.ru переменная Фиктивные переменные во множественной регрессии - student2.ru .

Для лиц мужского пола, когда Фиктивные переменные во множественной регрессии - student2.ru и Фиктивные переменные во множественной регрессии - student2.ru , объединенное уравнение регрессии составит: Фиктивные переменные во множественной регрессии - student2.ru , а для лиц женского пола, когда Фиктивные переменные во множественной регрессии - student2.ru и Фиктивные переменные во множественной регрессии - student2.ru Фиктивные переменные во множественной регрессии - student2.ru . Иными словами, различия в потреблении для лиц мужского и женского пола вызваны различиями свободных членов уравнения регрессии: Фиктивные переменные во множественной регрессии - student2.ru . Параметр Фиктивные переменные во множественной регрессии - student2.ru является общим для всей совокупности лиц, как для мужчин, так и для женщин.

Следует иметь в виду, что при введении фиктивных переменных Фиктивные переменные во множественной регрессии - student2.ru и Фиктивные переменные во множественной регрессии - student2.ru в модель Фиктивные переменные во множественной регрессии - student2.ru применение МНК для оценивания параметров а1 и а2 приведет к вырожденной матрице исходных данных, а следовательно, и к невозможности получения их оценок. Объясняется это тем, что при использовании МНК в данном уравнении появляется свободный член, т. е. уравнение примет вид

Фиктивные переменные во множественной регрессии - student2.ru

Предполагая при параметре А независимую переменную, равную 1, имеем матрицу исходных данных:

Фиктивные переменные во множественной регрессии - student2.ru

В рассматриваемой матрице существует линейная зависимость между первым, вторым и третьим столбцами: первый равен сумме второго и третьего столбцов. Поэтому матрица исходных факторов вырождена. Выходом из создавшегося затруднения может явиться переход к уравнению

Фиктивные переменные во множественной регрессии - student2.ru

или

Фиктивные переменные во множественной регрессии - student2.ru ,

т.е. каждое уравнение включает только одну фиктивную переменную z1 или z2.

В рассмотренном примере качественный фактор имел только два состояния, которым и соответствовали обозначения 1 и 0. Если же число градаций качественного признака-фактора превышает два, то в модель вводится несколько фиктивных переменных, число которых должно быть меньше числа качественных градаций. Только при соблюдении этого положения матрица исходных фиктивных переменных не будет линейно зависима и возможна оценка параметров модели.

Резюме по теме.

Зависимость между большинством экономических переменных не является строго функциональной из-за воздействия случайных незначительных факторов, и каждому значению одной переменной соответствует множество возможных значений другой переменной. Поэтому исследователи рассматривают зависимость между значениями одной переменной и условным математическим ожиданием другой. Такая зависимость называется корреляционной или регрессионной. Зависимость условного математического ожидания СВ Y от X называется модельным уравнением регрессии. Эта регрессия строится по генеральной совокупности. Но обычно исследователи имеют дело лишь с конечной выборкой ограниченного объема, поэтому вместо модельного уравнения регрессии используют выборочное уравнение регрессии, характеризующее зависимость выборочного условного среднего от х. Параметры спецификации выборочной регрессии являются оценками соответственных параметров спецификации модельной регрессии. В общем случае не известны ни точный вид функции, ни значения параметров спецификации.

Вопросы для повторения

2. Что такое условное математическое ожидание?

3. Какая зависимость называется корреляционной или регрессионной?

4. Что такое объясняющая переменная?

5. Что такое объясняемая переменная?

6. Какое уравнение называется модельным уравнением регрессии?

7. Какое уравнение называется выборочным уравнением регрессии?

8. Какая модель наблюдения соответствует модельному уравнению регрессии?

9. Какая модель наблюдения соответствует выборочному уравнению регрессии?

10. Что такое величины ei?

11. Что такое невязки, остатки?

12. Задачи регрессионного анализа?

13. Что такое парная линейная регрессия?

14. Что такое принцип наименьших квадратов?

15. Что такое метод наименьших квадратов (МНК)?

16. Применение МНК для вычисления коэффициентов парной линейной регрессии?

17. Нормальные уравнения для вычисления коэффициентов парной линейной регрессии?

18. Как оценить статистическую значимость уравнения регрессии в целом?

19. Как оценить статистическую значимость параметров регрессии?

20. Прогноз по уравнению парной линейной ререссии

21. Что такое гомоскедастичность остатков?

22. Что такое гетероскедастичность остатков?

23. Виды нелинейной регрессии

24. Оценка тесноты связи нелинейной регрессии

25. Оценка статистической значимости нелинейной регрессии

26. В каких случаях целесообразно использование множественной регрессии?

27. Требования, предъявляемые к факторам, включаемым во множественную регрессию

28. Мультиколлинеарность, способы ее выявления и ее коррекции

29. Уравнение линейной множественной регрессии. Коэффициенты «чистой» регрессии

30. Стандартизованные уравнения регрессии. Стандартизованные коэффициенты регрессии

31. Частные уравнения регрессии

32. Частные коэффициенты корреляции

33. Предпосылки МНК, методы их проверки

34. Свойства оценок МНК

35. Оценка статистической значимости множественной регрессии в целом

36. Оценка статистической значимости коэффициентов «чистой» регрессии

37. Фиктивные переменные во множественной регрессии

Наши рекомендации