Построение уравнения регрессии
Теснота связи результативного признака и одного из факторов определяется с помощью матрицы коэффициентов парной корреляции:
Y | X1 | X2 | X3 | |
Y | ||||
X1 | -0,0113 | |||
X2 | 0,7511 | -0,0341 | ||
X3 | 0,8740 | -0,0798 | 0,8685 |
Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. цена офиса, имеет тесную связь с числом комнат в офисе ( ), с площадью офиса. Однако факторы Х2 и Х3 тесно связаны между собой ( ), что свидетельствует о наличии мультиколлинеарности. Из этих двух переменных оставим в модели Х3 – общая площадь офиса.
Таким образом, наиболее тесный фактор к результативному признаку Y является жилая площадь квартиры (X3).
Определим линейную зависимость переменной Y от переменной X3. Общий вид линейного уравнения: .
1 СПОСОБ. С помощью инструмента анализ данных Регрессия MS Excel. Вводим необходимые данные (см. рис. 6).
Рисунок 6.Диалоговое окно инструмента Регрессия
Результатом выполнения инструмента Регрессия является совокупность таблиц (см. рис. 7).
Рисунок 7. Результат выполнения инструмента Регрессия
В ячейках В17 и В18 указаны коэффициенты b и a соответственно.
2 СПОСОБ. С помощью встроенной функции ЛИНЕЙН (Вставка → Функции). Вводим необходимые параметры (см. рис. 8).
Рисунок 8. Диалоговое окно функции ЛИНЕЙН
В активной ячейке (G2) появится число (коэффициент при ). Чтобы раскрыть все значения, выделяем диапазон ячеек (G2:H6), нажимаем клавишу F2, затем комбинацию Ctrl+Shift+Enter. Данные значения являются результатом выполнения функции ЛИНЕЙН (см. рис. 9).
Рисунок 9.Результат выполнения функции ЛИНЕЙН
Таким образом, уравнение зависимости результативного признака Y от наиболее тесно связанного с ним фактора X3:
.
Оценка качества модели
Оценку качества модели проведем с помощью MS Excel.
1 СПОСОБ. С помощью функции ЛИНЕЙН. При определении коэффициентов уравнения коэффициент детерминации показан в ячейке G4 (см. рис. 9) и .
2 СПОСОБ. С помощью инструмента Регрессия. Значение коэффициента детерминации можно найти в таблице Регрессионная статистика в ячейке В5 ( ) (см. рис. 7).
Коэффициент детерминации показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 76% вариации зависимой переменной учтено в модели и обусловлено влиянием включенных факторов.
Проверка значимости коэффициентов регрессии
Проверку значимости коэффициентов регрессии произведем на основе вычисления F-критерия Фишера.
Значение F-критерия Фишера можно найти в ячейке Е12 (см. рис. 7): .
Табличное значение F-критерия Фишера при доверительной вероятности 0,95 при и составляет 4,0982. Табличное значение F-критерия можно найти с помощью функции FРАСПОБР (см. рис. 10).
Рисунок 10. Диалоговое окно функции FРАСПОБР
Так как , то уравнение регрессии следует признать адекватным.