Тема 6. линейные регрессионные модели

С ПЕРЕМЕННОЙ СТРУКТУРОЙ.

ФИКТИВНЫЕ ПЕРЕМЕННЫЕ

План лекции

1. Фиктивные переменные.

2. Модели регрессии с фиктивными переменными сдвига.

3. Модели регрессии с фиктивными переменными наклона.

4. Критерий Г. Чоу.

Введение

До сих пор мы рассматривали регрессионную модель, в которой в качестве объясняющих переменных (регрессоров) выступали количественные переменные (производительность труда, себестоимость продукции, доход и т. п.). Однако на практике достаточно часто возникает необходимость исследования влияния качественных признаков, имеющих два или несколько уровней (градаций). К числу таких признаков можно отнести: пол (мужской, женский), образование (начальное, среднее, высшее), фактор сезонности (зима, весна, лето, осень) и т. п.

Качественные признаки могут существенно влиять на структуру линейных связей между переменными и приводить к скачкообразному изменению параметров регрессионной модели. В этом случае говорят об исследовании регрессионных моделей с переменной структурой или построении регрессионных моделей по неоднородным данным.

Фиктивные переменные

Например, нам надо изучить зависимость размера заработной платы тема 6. линейные регрессионные модели - student2.ru работников не только от количественных факторов тема 6. линейные регрессионные модели - student2.ru ,но и от качественного признака тема 6. линейные регрессионные модели - student2.ru (например, фактора «пол работника»).

В принципе можно было получить оценки регрессионной модели

тема 6. линейные регрессионные модели - student2.ru , тема 6. линейные регрессионные модели - student2.ru (6.1)

для каждого уровня качественного признака (т. е. выборочное уравнение регрессии отдельно для работников-мужчин и отдельно – для женщин), а затем изучать различия между ними.

Но есть и другой подход, позволяющий оценивать влияние значений количественных переменных и уровней качественных признаков с помощью одного уравнения регрессии. Этот подход связан с введением так называемых фиктивных (манекенных) переменных, или манекенов (dummy variables).

В качестве фиктивных переменных обычно используются бинарные, булевы переменные, которые принимают всего два значения: «0» или «1» (например, значение такой переменной тема 6. линейные регрессионные модели - student2.ru по фактору «пол»: тема 6. линейные регрессионные модели - student2.ru для работников-женщин и тема 6. линейные регрессионные модели - student2.ru ‑для мужчин).

В этом случае первоначальная регрессионная модель (6.1) заработной платы изменится и примет вид:

тема 6. линейные регрессионные модели - student2.ru , тема 6. линейные регрессионные модели - student2.ru , (6.2)

где тема 6. линейные регрессионные модели - student2.ru

Таким образом, принимая модель (6.2), мы считаем, что средняя заработная плата у мужчин на тема 6. линейные регрессионные модели - student2.ru выше, чем у женщин, при неизменных значениях других параметров модели. А проверяя гипотезу тема 6. линейные регрессионные модели - student2.ru : тема 6. линейные регрессионные модели - student2.ru , мы можем установить существенность влияния фактора «пол» на размер заработной платы работника.

Следует отметить, что качественное различие можно формализовать с помощью любой переменной, принимающей два разных значения, не обязательно «0» или «1». Однако в эконометрической практике почти всегда используются фиктивные переменные типа «0 ‑ 1», так как при этом интерпретация полученных результатов выглядит наиболее просто. Если рассматриваемый качественный признак имеет несколько тема 6. линейные регрессионные модели - student2.ru уровней (градаций), то в принципе можно было ввести в регрессионную модель дискретную переменную, принимающую такое же количество значений (например, при исследовании зависимости заработной платы тема 6. линейные регрессионные модели - student2.ru от уровня образования тема 6. линейные регрессионные модели - student2.ru можно рассматривать тема 6. линейные регрессионные модели - student2.ru значения: тема 6. линейные регрессионные модели - student2.ru при наличии начального образования, тема 6. линейные регрессионные модели - student2.ru – среднего и тема 6. линейные регрессионные модели - student2.ru при наличии высшего образования). Однако обычно так не поступают из-за трудности содержательной интерпретации соответствующих коэффициентов регрессии, а вводят тема 6. линейные регрессионные модели - student2.ru бинарных переменных.

При включении в уравнение регрессии фиктивных переменных возникает вопрос о характере влияния количественных факторов на результат при различных значениях неколичественного фактора. Далее будут рассмотрены различные варианты моделей регрессии с фиктивной переменной.

Наши рекомендации