Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости

С формальной точки зрения, объясняющие переменные в линейной эконометрической модели должны обладать следующими свойствами:

• иметь высокую вариабельность;

• быть сильно коррелированными с объясняемой переменной;

• быть слабо коррелированными между собой;

• быть сильно коррелированными с представляемыми ими другими переменными, не используемыми в качестве объясняющих.

Объясняющие переменные подбираются с помощью статистических мето­дов. Процедура подбора переменных состоит из следующих этапов:

1. На основе накопленных знаний составляется множество так называе­мых потенциальных объясняющих переменных (первичных переменных), в которое включаются все важнейшие величины, влияющие на объясняемую переменную. Такие переменные будем обозначать Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru

2. Собирается статистическая информация о реализациях как объясняе­мой переменной, так и потенциальных объясняющих переменных. Форми­руется вектор у наблюдаемых значений переменной Y и матрица X наблю­даемых значений переменных Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru в виде

Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru

3. Исключаются потенциальные объясняющие переменные, характеризу­ющиеся слишком низким уровнем вариабельности.

4. Рассчитываются коэффициенты корреляции между всеми рассматри­ваемыми переменными.

5. Множество потенциальных объясняющих переменных редуцируется с помощью выбранной статистической процедуры.

Речь идет о том, чтобы объясняющие переменные хорошо представляли те переменные, которые не были включены в модель.

Идея метода показателей информационной емкости сводится к выбору таких объясняющих переменных, которые сильно коррелированы с объясня­емой переменной, и одновременно, слабо коррелированы между собой. В ка­честве исходных точек этого метода рассматриваются вектор Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru и матрица R.

Рассматриваются все комбинации потенциальных объясняющих пере­менных, общее количество которых составляет I = 2W-1. Для каждой комбинации потенциальных объясняющих переменных рас­считываются индивидуальные и интегральные показатели информацион­ной емкости.

Индивидуальные показатели информационной емкости в рамках конк­ретной комбинации рассчитываются по формуле

Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru ; (l=1,2,…,L; j=1,2,… Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru ), где l – номер переменной, Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru – количество переменных в рассматриваемой комбинации.

Интегральныерассчитываются по формуле

Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru , (l=1,2,…,L). В качестве объясняющих выбирается такая комбинация переменных, которой соответствует максимальное значение интегрального показателя и формационной емкости.

43. Подбор переменных в модели множественной регрессии методом «снизу вверх»

Для подбора переменных в модели множественной «регрессии методом снизу вверх» мы для начала берем переменные х1,х2,х3…хn. Включаем переменную х1 в модель.

Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru .

Делаем по этой модели линейн. Находим соответственно по линейн F Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru . Ищем F Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru . Если F Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru больше чем F Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru , то следовательно качество модели улучшилось. Добавляем еще одну переменную.

Проделываем тот же алгоритм при добавлении каждой переменной.

Если же F Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru меньше чем F Подбор переменных в модели множественной регрессии на основе метода оценки информационной ёмкости - student2.ru ,то исключаем эту переменную, так как качество модели не улучшилось с ее добавлением.


Наши рекомендации