Построение парной линейной регрессионной модели
ОТЧЁТ ПО ДИСЦИПЛИНЕ «ЭКОНОМЕТРИКА»
По лабораторной работе № 1
Построение парной линейной регрессионной модели
1. Линейное уравнение регрессии имеет вид:
ŷ = 7,5 +3,2х
R = 0,93
R2 = 0,86
tст = (10,6) (9,6)
F = 91,4
2. Параметр b характеризует интенсивность, с которой увеличивается (или уменьшается) зависимость между переменными x и y. Так как в данном случае параметр положителен, то можно говорить о том, что при увеличении значения переменной x на единицу, переменная у будет увеличиваться на 3,2
Параметр а, равный 7.5, не имеет экономической интерпретации, хотя, если переменная х может принимать нулевое значение, а является соответствующим значением переменной ŷ и может интерпретироваться как значение y при x=0.
3. Чтобы определить тесноту линейной зависимости между зависимой и независимой переменной, необходимо проанализировать коэффициент корреляции (R), который является показателем тесноты линейной связи между переменными. Коэффициент корреляции R в данном случае равен 0,93, что характеризует весьма высокую степень тесноты линейной зависимости факторов.
4. О качестве модели можно судить по ряду показателей. Одним из них является критерий Фишера. Полученное мной F превышает значение 40, что свидетельствует о том, что данный критерий является значимым и не может быть отброшен.
О хорошем качестве регрессионной модели также свидетельствует коэффициент парной регрессии, который в данном случае весьма высок и близок к единице, что свидетельствует о том, что связь между экзогенной и эндогенной переменными очень тесна, что подтверждается и показателем коэффициента детерминации (R2), характеризующим 91,4%-ную зависимость доли расходов на товары длительного пользования (y) от дохода (x).
5. Из полученных данных видно, что t-статистика, представляющая собой оценку статистической значимости коэффициентов парной линейной регрессии, по у и х соответственно, равна:
tст = (10,6) (9,6)
Для проверки значимости коэффициентов уравнения регрессии вычислила критическое значение tкр=2,13. Так как tкр меньше tст, то коэффициентыявляются значимыми при выбранном уровне а, доверительные интервалы не содержат 0.
А F-критерий является значимым, т.к. F = 91,4, что больше 40.
6. Для того, чтобы проверить остатки уравнения регрессии на гетероскедастичность необходимо было проверить выполнение одной из предпосылок метода наименьших квадратов – постоянство дисперсий остатков уравнения регрессии.
График остатков показывает, что остатки регрессии являются гомоскедастичными.
Далее необходимо было проверить это предположение при помощи критерия Голдфелда-Квандта. Для этого, произведя ряд вычислений, нужно было найти Fкр для уровня значимости 0,05 (5%) и степеней свободы 4 и 4 для первой и третьей групп наблюдений соответственно. При данных условиях Fкр равно 6,39 и является большим по сравнению с Fрасч, равным 1,19 (найденным как отношение большей (из первой и третьей группы наблюдений) остаточной суммы квадратов к меньшей). Данное отношение подтверждает гомоскедастичность остатков регрессии.
7. Так как уравнение регрессии, построенное на основании имеющихся данных, имеет хорошее качество и является адекватным, то оно может быть использовано для дальнейшего прогнозирования. Задачей прогнозирования в данном случае было рассчитать прогноз доли расходов на товары длительного пользования, если доход будет составлять 85% от его максимального уровня.
Для этого изначально необходимо было найти максимальный уровень дохода (3,1 млн рубл.). 85 % от данной суммы – 2,635 млн рубл.
Далее, подставив полученное значение цены на товар в линейное уравнение регрессии, удалось определить прогнозируемый уровень спроса на товар, продаваемый по новой цене. (y = 7,5 +3,2*2,635, y = 15,932).
Рассчитаем ошибку прогноза по формуле:
= =0,7
В данном случае предельная ошибка прогноза Δŷ =t кр *sŷ= 2,13*0,7=1.49, а доверительный интервал равен15,932±1,49.Таким образом, прогнозное значение доли расходов на товары длительного пользования с вероятностью 98% должно находится в пределах между 15,232 и 16,632%.