Лабораторная работа № 4. Бинарные переменные в моделях множественной регрессии
Имеются данные по однокомнатным квартирам, выставлявшимся на продажу в Москве:
Region | район; |
Distc | удаленность от центра, км.; |
Distm | удаленность от метро, мин.; |
Totsq | общий метраж, кв.м.; |
Kitsq | площадь кухни, кв.м.; |
Livsq | площадь комнаты, кв.м.; |
Floor | этаж (0,1) 0 – первый или последний, 1 – средний; |
Cat | категория дома (0,1), 1–кирпичный, 0 – панельный; |
Price | цена, тыс. USD. |
Задание 1.(Линейная модель множественной регрессии)
1. Скопировать из файла данные для своего варианта. Значения объясняющих переменных для всех вариантов одинаковы. Значения объясняемой переменной Price – по вариантам.
1. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в линейной форме.
2. Оцените значимость полученного уравнения.
3. Определите, какие факторы значимо воздействуют на формирование цены квартиры в этой модели.
4. С учетом выполненного задания 3 ответьте на вопрос: верно ли утверждение, что этаж влияет на стоимость квартиры.?
5. С учетом выполненного задания 3 ответьте на вопрос: верно ли утверждение, что квартиры в кирпичных домах при прочих равных факторах стоят дороже, чем квартиры в панельных домах.
6. Постройте линейную модель формирования цены квартиры за счет только значимых факторов.
Оставшиеся факторы должны располагаться в соседних столбцах, если это не так, то перед вызовом Пакета анализа скопируйте данные на отдельный лист.
7. Дайте интерпретацию коэффициентов построенной модели со значимыми факторами.
Задание 2.(Степенная модель множественной регрессии)
1. Прологарифмируйте все переменные, кроме бинарных. Почему нельзя логарифмировать бинарные переменные?
2. Постройте уравнение регрессии, характеризующее зависимость цены от всех факторов в степенной форме. Окончательное уравнение регрессии должно иметь вид:
Это уравнеие легко можно сделать линейным, прологарифмировав. Если затрудняетесь это сделать, посмотрите построение степенной модели во второй и третьей лабораторных работе.
3. Оцените значимость полученного уравнения.
4. Определите, какие факторы значимо воздействуют на формирование цены квартиры в этой модели.
5. С учетом выполненного задания 4 ответьте на вопрос: верно ли утверждение, что этаж влияет на стоимость квартиры.?
6. С учетом выполненного задания 4 ответьте на вопрос: верно ли утверждение, что квартиры в кирпичных домах при прочих равных факторах стоят дороже, чем квартиры в панельных домах.
7. Постройте степенную модель формирования цены квартиры за счет значимых факторов.
8. Дайте интерпретацию коэффициентов построенной модели со значимыми факторами.
Для количественных факторов интерпретация дается также, как в лабораторной 3. Интерпретацию переменной при качественном факторе рассмотрим на примере. Пусть мы получили таблицу
Коэффициенты | Стандартная ошибка | t-статистика | P-Значение | Нижние 95% | Верхние 95% | |
Y-пересечение | -0,21 | 0,55 | -0,38 | 0,71 | -1,31 | 0,90 |
ln(totsq) | 0,91 | 0,19 | 4,79 | 0,00 | 0,53 | 1,29 |
ln(kitsq) | 0,22 | 0,11 | 2,00 | 0,05 | 0,00 | 0,44 |
cat | 0,23 | 0,04 | 5,97 | 0,00 | 0,15 | 0,31 |
floor | 0,13 | 0,04 | 3,21 | 0,00 | 0,05 | 0,21 |
Этой таблице соответствует уравнение
Делаем вывод: квартиры на средних этажах стоят в среднем в раза дороже, чем квартиры на средних этажах (при прочих равных факторах). Иными словами, квартиры на средних этажах в среднем на 26% дороже, чем квартиры на крайних этажах. Аналогично интерпретируется коэффициент при переменной cat (обратите внимание в каких случаях cat принимает значения 0 и 1).
Задание 3.
1.Выберите лучшую моделель. Обоснуйте свой выбор.
2. Используя выбранную модель, осуществите прогноз цены однокомнатной квартиры, находящейся на расстоянии 10 км от центра, 5 мин. ходьбы до метро, общей площадью 35 кв.м, площадью кухни 8 кв.м, жилой площадью 33 кв.м, расположенной на 1-м этаже кирпичного дома.