Применение теста Стьюдента в процедуре подбора переменных в модели множественной регрессии
Множественная регрессия широко используется в решение проблем спроса, доходности акций, изучении функции издержек производства, в макроэкономических расчетах и целого ряда других вопросов эконометрики. В настоящее время множественная регрессия - один из наиболее распространенных методов в эконометрике. Основная цель множественной регрессии - построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемые показатели.
Построение уравнения множественной регрессии начинается с решения вопроса о спецификации модели, включает в себя два круга вопросов: отбор факторов и выбор вида уравнения регрессии.
Включение в уравнения множественной регрессии того или иного набора факторов связано, прежде всего, с представлением исследователя о природе взаимосвязи моделируемого показателя с другими экономическими явлениями. Факторы, включаемые во множественную регрессию должны отвечать следующим требованиям:
· должны быть количественно измеримы;
· не должны быть интеркоррелированы и, тем более, находиться в точной функциональной связи.
Включаемые во множественную регрессию факторы должны объяснять вариацию независимой переменной. Если строится модель с набором р-факторов, то для нее рассчитывается показатель детерминации R2, который фиксирует долю объясненной вариации результативного признака за счет рассматриваемых в регрессии р-факторов. Влияние других, неучтенных в модели факторов, оценивается как 1-R2 с соответствующей остаточной дисперсией S2 .
При дополнительном включении в регрессию фактора (1+р) коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться: R2p+1 >= R2p и S2р+1 =< S2р
Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемые в анализ фактор хр+1 не улучшает модель и практически является лишним фактором. Насыщение модели лишними факторами не только не снижает величину остаточной дисперсии и не увеличивает показатель детерминации, но и приводит к статистической незначимости параметром регрессии по t –критерию Стьюдента.
Т.о., хотя теоретически регрессионная модель позволяет учесть любое число факторов, практически в этом нет необходимости. Отбор факторов производится на основе качественного теоретико-экономического анализа. Однако теоретический анализ часто не позволяет однозначно ответит на вопрос о количественной взаимосвязи рассматриваемых признаков и целесообразности включения фактора в модель. Поэтому отбор факторов обычно осуществляется в две стадии: на первой – подбирают факторы исходя из сущности проблемы; на второй – на основе матрицы показателей корреляции определяют t-статистики для параметров регрессии.
50. Применение фиктивных переменных при исследовании сезонных колебаний: спецификация модели, экономический смысл параметров при фиктивных переменных.
Сезонные фиктивные переменные
При построении модели регрессии может возникнуть ситуация, когда в неё необходимо включить не только колич-ные, но и кач-ные переменные (например, возраст, образование, пол, расовую принадлежность и др.).
Фиктивной переменной наз-ся атрибутивный или качественный фактор, представленный с помощью определённого цифрового кода.
Метод сезонных фиктивных переменных относится к методам моделирования сезонных компонент временного ряда. Суть данного метода заключается в построении модели регрессии, которая наряду с фактором времени включает сезонные фиктивные переменные.
Модель регрессии, включающая в качестве факторной (факторных) переменных фиктивную переменную называется моделью регрессии с переменной структурой.
Наиболее наглядным примером применения фиктивных переменных является модель регрессии, отражающая проблему разрыва в заработной плате у мужчин и женщин.
Предположим, что на основе собранных данных была построена модель регрессии, отражающая зависимость заработной платы рабочих y от их возраста х: yt=β0+β1xt. (спецификация)
Однако данная модель регрессии не может в полной мере охарактеризовать вариацию результативной переменной. Поэтому в модель необходимо ввести дополнительный фактор, например пол, на основании предположения о том, что у мужчин в среднем заработная плата выше, чем у женщин. В связи с тем, что переменная пола является качественной, её необходимо представить в виде фиктивной переменной следующим образом:
С учётом новой фиктивной переменной модель регрессии примет вид: y=β0+β1x+β2D, где β2 – это коэффициент, который характеризует в среднем разницу в заработной плате у мужчин и женщин.
Пример 2
Рассмотрим модель регрессии, характеризующую зависимость переменной размера заработной платы у от переменной стажа работников х с различным образованием. Качественная переменная «образование» может принимать три значения: среднее, среднее специальное и высшее. Для включения факторной переменной «образование» в модель регрессии, необходимо ввести две новых фиктивных переменных, потому что их количество должно быть на единицу меньше, чем значений качественной переменной.
Следовательно, качественная переменная «образование» может быть представлена в виде:
Модель регрессии, характеризующая зависимость переменной размера заработной платы у от переменной стажа работников х с различным образованием, примет вид: y=β0+β1x+β2D1+ β3D2.